1

Ответы на этот вопрос не являются удовлетворительными для меня, так как они либо делают гигантский PDF и / или стоят денег.

Либо Windows, либо Linux в порядке.

Если по какой-то причине это трудная / невозможная программная проблема (я очень мало знаю об этих форматах), я также с радостью приму ответ, который может убедить меня в этом, так что мне не нужно смотреть дальше.

1 ответ1

2

По данным djvu.org

DjVu (произносится как «дежа вю») - это цифровой формат документов с передовой технологией сжатия и высокой производительностью. DjVu позволяет распространять в Интернете и на DVD изображения отсканированных документов с очень высоким разрешением

Итак, мы имеем

  • передовая технология сжатия
  • растровые изображения высокого разрешения

PDF оптимизирован для векторных рисунков и текста, а не для сжатия растровых изображений.

(Обновить)
PDF поддерживает несколько типов сжатия для растровых изображений, поэтому правильный выбор может помочь уменьшить размер. Сжатие CCIT Fax4 лучше, чем некоторые другие, которые я пробовал, но я считаю, что оно далеко не так эффективно, как сжатие, используемое в DJVU. Я конвертировал файл DJVU размером 236 КБ в TIFF размером 916 КБ со сжатием FAX4. Для сравнения, использование сжатия JPEG (настройки по умолчанию) позволило получить файл TIFF размером 28080 КБ. Я ожидаю аналогичных результатов после преобразования в PDF с теми же алгоритмами сжатия.
(конец обновления)

Запуск DJVU через OCR может помочь уменьшить размер, но это может быть процесс, который требует много человеческого взаимодействия для получения правильного контента и верстки.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .