1

У меня есть большой PDF-документ, который состоит из отсканированных страниц учебника. Я хочу запустить на нем функцию распознавания текста в Adobe Acrobat 9, но мне предоставляется это меню, когда я это делаю.

Adobe Acrobat OCR Menu

Меня смущают варианты в выделенном меню. Какой вариант позволит получить максимально качественный / читаемый текст? Я думал, что разрешение 600 т / д означает более высокое качество изображения, чем 72 т / д, поэтому меня смущают «Высокий (72 т / д)» и «Низкий (600 т / д)».

2 ответа2

3

Качественное описание ваших вариантов относится к количеству понижающей дискретизации изображения, а не к полученному качеству изображения. Понижение частоты дискретизации до 72 точек на дюйм приводит к значительному снижению частоты дискретизации.

0

Я не знаю точно, для Acrobat, но многие программы распознавания текста оптимизированы для текста шрифтом основного текста с типичным размером около 300 точек на дюйм. Начните с этого и попробуйте страницу. Если вы получаете много ошибок перевода, попробуйте 600 точек на дюйм. Если страница не чистая, то 600 точек на дюйм могут сделать артефакты достаточно большими, чтобы их можно было интерпретировать как символы, такие как знаки препинания, что требует более тщательной очистки перевода (большинство программ распознавания не знают, какое разрешение на дюйм создало изображение, они просто видят "смешанный размер" шрифты "). Я был бы удивлен, если бы 72 dpi работали хорошо, если вы не переводите огромные шрифты.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .