У меня много HTML-файлов (веб-страницы, сохраненные с FireFox как один <filename>.html каталог <filename>_files со статикой). Как я могу сжать их в один большой файл PDF с помощью только командной строки Linux?

Примечание: каждый файл имеет свою собственную кодировку. Например, некоторые файлы могут быть закодированы с помощью UTF-8, а другие - с латинским-1.

Я нашел htmldoc , но она не поддерживает кодировку UTF-8 (по крайней мере, версию из репозиториев apt-get). Таким образом, вопрос становится таким:

Как я могу (с изменением или без изменения кодировки файлов) сжать их в один большой файл PDF?

1 ответ1

0
  1. Используйте iconv для преобразования кодировки из UTF-8
  2. Используйте htmldoc для конвертации HTML в PDF
  3. Используйте pdftk для объединения PDF-файлов

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .