Уменьшение тяжело отсканированного PDF(сохранение только оптического распознавания и удаление отсканированного изображения)

У меня тяжелый отсканированный PDF с OCR. Я смог уменьшить его размер вдвое с помощью ghostscript win64 с помощью этой команды (как рекомендуется в этом ответе):

gswin64 -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf

Но все же это не достаточно легко.

Я также мог бы конвертировать PDF с помощью Caliber или pdftotext из xpdf, но я теряю макет.

Есть ли способ извлечь OCR, сохраняя точное положение каждого текста на каждой странице при удалении отсканированного изображения?

задан MagTun435

Сейчас выбран русский

Уменьшение тяжело отсканированного PDF(сохранение только оптического распознавания и удаление отсканированного изображения)

0

Уменьшение тяжело отсканированного PDF(сохранение только оптического распознавания и удаление отсканированного изображения)

0

Знаете кого-то, кто может ответить? Поделитесь ссылкой на этот вопрос по почте, через Твиттер или Facebook.

Похожие