Я написал сценарий, чтобы сделать это давным-давно. Это по сути склеенный код вокруг нескольких утилит, которые делают тяжелую работу. Разница между моим сценарием и другими инструментами того времени заключалась в том, что мой был единственным, который сделал все следующее:
- имеет степень сжатия, аналогичную исходному файлу DjVu (размер в 1,5-2 раза вместо размера в 10-20 раз)
- сохраненные метаданные закладок / оглавления (для навигации в программе чтения PDF)
- сохранил встроенный текстовый слой для поиска
При этом, это очень примитивно. Я просто убедился, что он хорошо работает для всех моих файлов и с тех пор не работал с ним.