1

Я считаю, что я успешно установил OCRopus, странно, я нигде не могу найти никаких инструкций по использованию, искал около часа, возможно, я сумасшедший ...

Как я могу использовать OCRopus?

Я хочу, чтобы он распознал PNG-файл в HTML-файл, сохраняя макет.

1 ответ1

1

Эта ссылка может помочь вам.

Выдержка:

Перейдите в каталог с соответствующим образом названными изображениями сканирования страницы книги (TIFF или PNG). Когда вы набираете ls, вы должны видеть список страниц по порядку! Затем попробуйте:

ocropus book2pages out image *

Это готовит страницы для распознавания текста. Далее давайте создадим объекты страницы и, в конечном итоге, книгу:

ocropus pages2lines out

ocropus lines2fsts out/

ocropus fsts2text out/

ocropus buildhtml out/> book.html

Это должно создать вам хороший html-файл книги в формате hOCR.

Также есть много обучающих программ о том, как использовать ocropus.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .