Мне нужно конвертировать PDF или HTML+CSS в DOC или DOCX под Linux, это может быть из командной строки или с помощью языка сценариев.
Любая идея?
Вы можете сделать это с помощью OpenOffice из командной строки. Существуют также мосты для языков сценариев - узнайте больше на сайте OpenOffice. Существует один для PHP, который называется PUNO, но у меня пока нет личного опыта.
Вы можете конвертировать HTML в .doc, используя макрос OpenOffice, смотрите эту ветку:
http://www.oooforum.org/forum/viewtopic.phtml?p=44367#44367
преобразовать pdf в .doc намного сложнее из-за множества различного контента, который может быть внутри PDF - довольно часто PDF-файлы используются для таких вещей, как сканированный текст.
Вы можете использовать pdftohtml
чтобы сделать HTML-файл из PDF-файла.
Word может открывать HTML-файлы напрямую.
Я только что наткнулся на этот вопрос и после еще немного погуглил нашел pandoc: http://johnmacfarlane.net/pandoc/README.html
Простая команда создаст файл docx или pdf (или rtf и т.д.) Из html-ввода следующим образом:
pandoc -o output.docx input.html
Он также может писать в стандартный вывод (с некоторыми форматами) и читать из стандартного ввода.
Не уверен, что он находится в репозиториях Debian / Ubuntu, но в репозитории epel 6 для Redhat / CentOS 6 ( yum install pandoc
).
Надеюсь, это поможет кому-то :)
Конвертация документов
Текущий список прошлых примеров.
Конвертировать любой тип документа в PDF
Как конвертировать слайды Powerpoint в JPEG с помощью OpenOffice API? (слайд сплиттер)
Список многих прошлых примеров конверсии
Список доступных конвертеров в OOo 2.0 (1.9.x)? Инструкция по созданию списка фильтров
Рекурсивная папка HTML в PDF, Txt, SXW, DOC
Рекурсивная папка с SXD на SDC (StarCalc 5)
Настройка размера изображения для экспорта в JPEG
Конвертация Xcel в Calc с использованием API
Очень похожий, преобразование Xcel в текст
VB: преобразование файлов Excel в текстовые файлы
Общие документы Visual Basic преобразования текста ...
Преобразование Word -> PDF из командной строки http://www.oooforum.org/forum/viewtopic.php?t=3772 http://www.oooforum.org/forum/viewtopic.php?t=5513 http://www.oooforum.org/forum/viewtopic.php?t=3768
Инструмент PyOpenOffice для конвертации SXW в PDF без использования OOo
Конвертировать Word -> Writer из командной строки
Конвертировать Excel -> PDF из командной строки
http://www.oooforum.org/forum/viewtopic.php?t=5596 http://www.oooforum.org/forum/viewtopic.php?p=21050#21050
Конвертировать SXC в CSV из командной строки
Конвертировать PPT в HTML из командной строки ...
Конвертировать PPT в HTML короткий пример ...
Конвертировать PPT в PDF короткий пример ...
Тема о преобразовании документа в PDF в Java
Конвертировать SXW в DOC с Java
http://www.oooforum.org/forum/viewtopic.phtml?p=81846#81846Я написал конвертер пакетных документов
http://www.oooforum.org/forum/viewtopic.php?t=3525 http://www.oooforum.org/forum/viewtopic.php?t=2810 http://www.oooforum.org/forum/viewtopic.php? p = 10311 # 10311 вы можете получить здесь
http://www.ooomacros.org/user.php#95532 подробнее об этом здесь ...
http://www.oooforum.org/forum/viewtopic.php?t=5708Макрос для сохранения в трех форматах
http://www.oooforum.org/forum/viewtopic.php?t=3612 Макрос для сохранения резервных копий с отметками времени
http://www.oooforum.org/forum/viewtopic.php?t=7674Откройте HTML с Writer, а не через Интернет, чтобы экспортировать
http://www.oooforum.org/forum/viewtopic.php?t=3973 http://www.oooforum.org/forum/viewtopic.php?p=44367#44367
Как преобразовать HTML в OpenOffice File?
http://www.oooforum.org/forum/viewtopic.php?t=11580
Размер страницы pblm при конвертации HTML в PDF
http://www.oooforum.org/forum/viewtopic.phtml?p=63682#63682Обсуждение, которое заканчивается в утилите DocConverter.
http://www.oooforum.org/forum/viewtopic.php?t=2668Конвертировать DBF в XLS, SXC, PDF и HTML
http://www.oooforum.org/forum/viewtopic.php?t=5728Хороший пример кода Visual Basic ... преобразование документов
http://www.oooforum.org/forum/viewtopic.php?t=7673Рисование экспорта и печати
http://www.oooforum.org/forum/viewtopic.php?t=3620Использование исходного кода OOo для чтения / преобразования / записи документов в форматах, поддерживаемых его фильтрами. http://www.oooforum.org/forum/viewtopic.php?t=5785