1) DJVU больше, чем PDF.
Насколько я понимаю, djvu - это "технология сжатия изображений". PDF - это переносимый формат документов. PDF может хранить текст в виде символьных строк, а средство просмотра может отображать эти строки, используя внешние или встроенные шрифты. PDF может содержать сжатые растровые изображения отсканированного текста, но это не единственный способ хранения текста.
Если вы возьмете PDF-файл, где текст представляет собой строки + шрифты, и преобразуете его в djvu, возможно (при некоторых обстоятельствах) строки должны быть растеризованы, что увеличит размер данных.
Если вы можете предоставить небольшой пример PDF, который демонстрирует поведение, люди смогут объяснить более подробно.
2) сжатие без потерь
Есть много способов сделать вещи меньше без потери информации. некоторые алгоритмы сжатия более эффективны, чем другие, для определенных типов данных.