Я ищу способ без потерь, надежного и сжатого преобразования PDF-файлов, которые содержат черно-белые текстовые сканы, в формат DJVU. Инструмент должен быть программой командной строки, чтобы я мог разбить преобразование. Я обнаружил, что djvulibre
но я не смог заставить его работать с необходимыми драйверами на моем Ubuntu Linux (они кажутся отдельными из-за проблем с лицензией). pdf2djvu
есть опции для настройки уровня потерь при сжатии изображений, но я не уверен, что он всегда будет правильно определять разрешение исходных файлов, так что я боюсь, что это может привести к потерям из-за повторной выборки изображений. Любые намеки на другое программное обеспечение, разрешение проблем с драйверами с помощью djvulibre
или правильное использование pdf2djvu
приветствуются.
2
1 ответ
1
Вы можете использовать xpdf для извлечения отсканированных изображений из ваших файлов PDF.
Затем используйте imagemagick для преобразования каждого изображения в формат pbm:
convert page-000.png page-000.pbm
Затем с помощью djvulibre преобразуйте изображения в формате pbm в страницы djvu.
cjb2 -clean page-000.pbm page-000.djvu
Наконец добавление вашей новой страницы в окончательный документ
djvm -i page.djvu page-000.djvu
Процесс частично объясняется здесь:Создание файла DjVu