Как извлечь текст из PDF-файла на основе изображений, используя Cuneiform в терминале

Question

клинопись -l рус -f текст -o outocr.txt input.pdf

Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25 (x86_64).

score 2 · Answer 1 · 2011-03-09T19:38:42

В этом посте приведен пример сценария для чтения множества отдельных страниц и создания многостраничного PDF. Cuneiform сама по себе не создает многостраничных документов. Как извлечь текст с помощью OCR из PDF в Linux?

Сейчас выбран русский

Как извлечь текст из PDF-файла на основе изображений, используя Cuneiform в терминале

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками linux pdf fedora ocr.

Как извлечь текст из PDF-файла на основе изображений, используя Cuneiform в терминале

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками linux pdf fedora ocr.

Похожие