5

У меня есть файл djvu, в котором я могу искать конкретные слова. Однако, если я преобразую его в pdf (я пробовал с cutePDF и с онлайн - инструментом djvu-pdf ), возможность поиска слов, похоже, будет потеряна.

Как я могу преобразовать файл djvu в PDF с сохранением поиска слова?

4 ответа4

2

Я написал сценарий, чтобы сделать это давным-давно. Это по сути склеенный код вокруг нескольких утилит, которые делают тяжелую работу. Разница между моим сценарием и другими инструментами того времени заключалась в том, что мой был единственным, который сделал все следующее:

  • имеет степень сжатия, аналогичную исходному файлу DjVu (размер в 1,5-2 раза вместо размера в 10-20 раз)
  • сохраненные метаданные закладок / оглавления (для навигации в программе чтения PDF)
  • сохранил встроенный текстовый слой для поиска

При этом, это очень примитивно. Я просто убедился, что он хорошо работает для всех моих файлов и с тех пор не работал с ним.

2

Откройте PDF-файл в PDF-XChange Viewer и выполните распознавание текста (я считаю, что поддерживаются только четыре языка). Это требует времени, но это чертовски хорошо (даже в двухколоночных документах).

На Mac и Linux вам понадобится Wine.

1

Этот конвертер DjVu в PDF определенно сохраняет возможность поиска по словам в случае, если оригинальный DjVu доступен для поиска. Это также производит меньшие выходные файлы, чем калибр.

0

Вы пробовали Калибр? Сотрудник Caliber упоминает, что текст OCR в djvu поддерживается. Таким образом, он может быть преобразован в PDF с возможностью поиска текста.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .