1

У меня есть много старых отсканированных PDF-файлов, которые занимают слишком много места на диске.

Я пробовал много PDF компрессоров, доступных в Интернете. Все они спрашивают меня, какое сжатие использовать для цветных изображений и что использовать для монохроматических изображений; но я не смог найти ничего, чтобы преобразовать ВСЕ в двоичное изображение.

Под двоичным я подразумеваю, что каждый пиксель может иметь только одно из двух значений цвета: полностью черный или полностью белый. Я знаю, что все мои PDF-файлы имеют черно-белый текст (даже не в оттенках серого). Может ли какой-либо инструмент (Windows, Linux или Android) использовать эти знания для улучшения сжатия?

Я не уверен, но инструмент "Оптимизация PDF" в Adobe Acrobat Pro может делать то, что я хочу. Однако, даже если это произойдет, я бы предпочел узнать о менее дорогом и более компактном приложении.

1 ответ1

3

Сжатие jbig2 - лучший способ уменьшить размер файла

Адам Лэнгли написал jbig2enc кодировщик первоначально для googlebooks

а затем выпустил исходный код, так что любой может собрать

Вы также можете использовать предварительно скомпилированный двоичный файл из:

  • https://code.google.com/p/pdfrecompressor/downloads/list
  • или попробуйте, если измененная сборка (может использовать ключ -P, который вы можете решить, какое количество страниц в словаре вы хотите включить, поэтому получившийся pdf более отзывчивый), который я собрал для моей системы, работает с вашим

Jbig2enc+ акрыкуков патч

общий синтаксис для jbig2enc (при условии, что ваши файлы TIFF)

jbig2 -s -p -v *.tiff && pdf.py output >out.pdf

но, для Jbig2enc+ акрыкуков патч

jbig2 -s -p -v -P (number of pages for dictionary) *.tiff && thessalonica-pdf.py *.jbig2 >out.pdf

ВАЖНЫЙ:

вам нужны библиотеки Python, чтобы иметь возможность собирать и собирать все полученные файлы jbig2 в формате PDF

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .