2

Я ищу способ без потерь, надежного и сжатого преобразования PDF-файлов, которые содержат черно-белые текстовые сканы, в формат DJVU. Инструмент должен быть программой командной строки, чтобы я мог разбить преобразование. Я обнаружил, что djvulibre но я не смог заставить его работать с необходимыми драйверами на моем Ubuntu Linux (они кажутся отдельными из-за проблем с лицензией). pdf2djvu есть опции для настройки уровня потерь при сжатии изображений, но я не уверен, что он всегда будет правильно определять разрешение исходных файлов, так что я боюсь, что это может привести к потерям из-за повторной выборки изображений. Любые намеки на другое программное обеспечение, разрешение проблем с драйверами с помощью djvulibre или правильное использование pdf2djvu приветствуются.

1 ответ1

1

Вы можете использовать xpdf для извлечения отсканированных изображений из ваших файлов PDF.
Затем используйте imagemagick для преобразования каждого изображения в формат pbm:

convert page-000.png page-000.pbm

Затем с помощью djvulibre преобразуйте изображения в формате pbm в страницы djvu.

cjb2 -clean page-000.pbm page-000.djvu

Наконец добавление вашей новой страницы в окончательный документ

djvm -i page.djvu page-000.djvu

Процесс частично объясняется здесь:Создание файла DjVu

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .