Как я могу заставить OCR лучше распознавать текст моих документов?

Question

Я не могу получить некоторые из моих документов с изображениями для распознавания OCR. Они не особенно низкого разрешения - хотя некоторые искажены - но я не могу получить их через OCR, даже с Omnipage. Я загрузил один в качестве примера (преобразован из DOC в PDF для Omnipage), но у меня есть еще. Что я могу сделать, чтобы OCR преуспел?

score 1 · Accepted Answer · 2011-03-09T19:38:42

Несмотря на то, как они выглядят на экране, текстовые изображения имеют не очень высокое разрешение. Вы можете увидеть это, увеличив изображение в программе просмотра PDF. Изображения имеют пикселизацию и не все черно-белые.

Я извлек изображения с pdfimages. Gocr работал с полученными изображениями .ppm, но со многими ошибками. Я не мог заставить работать тессеракт с изображениями, несмотря на преобразование в монохромный TIFF.

Сейчас выбран русский

Как я могу заставить OCR лучше распознавать текст моих документов?

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками ocr.

Как я могу заставить OCR лучше распознавать текст моих документов?

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками ocr.

Похожие