Я конвертирую pdf файл в djvu файл с помощью pdf2djvu с опциями по умолчанию. Сгенерированный файл djvu (6,6 МБ) немного больше исходного файла PDF (6,4 МБ).

  1. Разве файл djvu не должен быть меньше файла pdf? Почему это не так здесь?
  2. Есть ли способы сделать файл djvu меньше после конвертации без потери важной информации?

Спасибо и всего наилучшего!

2 ответа2

2

1) DJVU больше, чем PDF.

Насколько я понимаю, djvu - это "технология сжатия изображений". PDF - это переносимый формат документов. PDF может хранить текст в виде символьных строк, а средство просмотра может отображать эти строки, используя внешние или встроенные шрифты. PDF может содержать сжатые растровые изображения отсканированного текста, но это не единственный способ хранения текста.

Если вы возьмете PDF-файл, где текст представляет собой строки + шрифты, и преобразуете его в djvu, возможно (при некоторых обстоятельствах) строки должны быть растеризованы, что увеличит размер данных.

Если вы можете предоставить небольшой пример PDF, который демонстрирует поведение, люди смогут объяснить более подробно.

2) сжатие без потерь

Есть много способов сделать вещи меньше без потери информации. некоторые алгоритмы сжатия более эффективны, чем другие, для определенных типов данных.

1

Одна из причин размера файла может заключаться в том, что конвертер классифицирует многие вещи как фоновый слой (см. Подробности реализации).

Есть ли у вас графика в документе?

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .