OCR с неязыковым текстом

Question

Мне интересно использовать OCR для распознавания текста из документа, который не содержит слов. Скорее, это документ с длинной строкой "случайных" печатных символов. Я пытался использовать tesseract для сканирования текста, но, похоже, он ищет слова. Есть ли способ заставить tesseract просто распознавать символы?

score 2 · Accepted Answer · 2011-03-09T19:38:42

Да, вы можете отключить словари , определив файл конфигурации, содержащий:

load_system_dawg F
load_freq_dawg F

и укажите это с помощью команды.

Сейчас выбран русский

OCR с неязыковым текстом

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками ocr tesseract-ocr.

OCR с неязыковым текстом

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками ocr tesseract-ocr.

Похожие