Я использовал OCR для извлечения текста из 200 изображений, теперь у меня есть 200 .txt файлов, которые я должен скопировать весь .txt файл в документ с одним словом.Я ищу два решения

Немедленно: найдите способ автоматически скопировать весь текст в файл .doc.

идеально: сначала скопируйте изображение, а затем текст OCR автоматически. например, скопируйте 29.jpg в документ Word, а затем скопируйте 29.txt и т. д. Любое предложение приветствуется.

ОС: Windows 10

Python: установлен

Текст: UTF-8

3 ответа3

0

все предложения работают по первому запросу. благодарю вас

Я использовал предоставленную MSC ссылку и написал скрипт на python, который является решением для второго запроса. однако из-за проблемы с кодировкой utf-8 на компьютере с Windows (меня это смутило), он просто работает на Linux, если вы знаете, как преодолеть проблему с кодировкой utf-8 в Windows, прокомментируйте

#!/usr/bin/python
# -*- coding: UTF-8 -*-
from docx import Document
from docx.shared import Inches
document = Document()
p = document.add_paragraph()
r = p.add_run()
for i in range(29,48):
    r.add_picture(str(i)+'.jpg',width=Inches(6.2), height=Inches(9))
    with open(str(i)+'.txt','r') as f:
        for line in f:
            r.add_text(line)
document.save('test.docx')
0

Создайте командный файл со следующим:

CD OCRFolder
copy OCR*.txt > NewFile.txt
C:\Program Files\Microsoft Office\Office15\winword.exe Newfile.txt
del OCR.txt

Это позволит перейти к папке, содержащей файлы OCR. - CD OCRFolder
Объедините все текстовые файлы OCR в один текстовый файл - copy OCR*.txt > NewFile.txt
Откройте новый файл в Word - C:\Program Files\Microsoft Office\Office15\winword.exe Newfile.txt

Ваше местоположение WinWOrd.exe может отличаться в зависимости от вашей версии Word.

0

Поскольку вы просите объединить их в файл .doc, я предполагаю, что у вас установлен Microsoft Office.

Откройте Microsoft Office, выбрав вкладку «Вставка». Нажмите стрелку вниз рядом с « Object и выберите « Text from File .

Нажмите Ctrl A, чтобы выбрать все файлы, которые вы хотите объединить.

Примечание: если любое преобразование необходимо, это будет означать несколько дополнительных кликов ... на файл!

Чтобы добавить изображения в документ, на той же вкладке «Вставка» есть возможность вставить изображения, здесь вы можете нажать Ctrl A, чтобы добавить все свои изображения. Тем не менее, он не сможет добавлять их поочередно после вашего текста.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .