У меня есть сканирование книги в формате PDF. Когда я открываю его в Adobe Reader, он выглядит как оттенки серого. Когда я открываю его с помощью IrfanView, он выглядит как оттенки серого, а опция «Информация» говорит мне, что изображение на самом деле 24-битное (я не знаю, является ли это истинной битовой глубиной изображения, встроенного в pdf, или если IrfanView назначает максимальная глубина при открытии PDF как изображение).
Я хочу, чтобы OCR сканирование с OmniPage SE. Он не читает PDF, поэтому я решил использовать ImageMagick, чтобы сначала преобразовать файл в PNG. Но что бы я ни пытался, вывод всегда монохромный и практически не читаемый.
Я пробовал разные конверсионные линии, с разными значениями глубины, плотности и изменения размера, но это не помогло. То, что вы видите, было сделано с помощью опций convert testfile.pdf -density 600x600 -depth 8 PNG:testfile.png
.
Есть идеи, что вызывает проблему?
Изменить: Чтобы было ясно, вывод выглядит так для любого значения -density, -depth и -resize, которые я пробовал. Это также выглядит так, когда я вообще не использую никаких опций, как, например, в convert testfile.pdf PNG:testfile.png
.