У меня есть набор файлов в формате .doc , которые необходимо преобразовать в формат .pdf . Я использую Ubuntu Linux.
10 ответов
Альтернатива 1)
sudo apt-get install cups-pdf
Затем перейдите к "Система"> "Администрирование"> "Печать" и создайте новый принтер, установите его в качестве принтера PDF-файла и назовите его "pdf".
Затем запустите:
oowriter -pt pdf your_word_file.doc
Теперь вы найдете ваш файл .pdf в ~/PDF.
Альтернатива 2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
Если пакет tetex-extra недоступен в вашем дистрибутиве, попробуйте texlive-base плюс texlive-latex-base:
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
Ты можешь использовать:
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
Если вы используете X, то вы можете сделать это через Open Office. Поскольку вы собираетесь возразить против этого, помните, что в Open Office есть несколько макросов, которые можно автоматизировать. Вы можете сделать что-то подобное с AbiWord (AbiWord --to = pdf).
Если у вас нет X, тогда есть антислово, но оно просто извлекает текст - не выполняет форматирование и графику. Есть также wvWare, который я использовал для массового извлечения изображений из файлов документов, но я никогда не пытался использовать его для преобразования файлов документов в PDF-файлы.
Да, и для файлов .docx может потребоваться что-то другое, но, поскольку они представляют собой просто заархивированные XML-файлы, не составит труда сделать что-то полезное с ними. Для массового извлечения изображений вы просто распаковываете их и копируете каталог с изображениями, но мне никогда не нужно было конвертировать их в Linux.
Печать в PDF теряет много метаданных документа (заголовок, авторство, дерево заголовков, которое используется для навигации и т.д.).
Установите unoconv, конвертируйте с помощью: unoconv -fpdf file1.doc file2.doc…
Вы также можете сделать это с AbiWord:
sudo apt-get install abiword
Затем вы можете загрузить файлы .doc в графический интерфейс AbiWord и экспортировать их в PDF или из командной строки:
abiword --to=pdf filename.doc
Если вы уже установили LibreOffice
lowriter --headless --convert-to pdf *.doc
Я бы попробовал использовать для Linux
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
Для окон:
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
PyODConverter требует, чтобы OpenOffice.org работал как служба и прослушивал порт (по умолчанию) 8100; Самый простой способ запустить OpenOffice.org как сервис - из командной строки:
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
Открытый офис - хороший путь вперед, но точность преобразования не всегда является правильной.
Если вы ищете 100% Linux-решение, то это лучший путь вперед. Однако, если вы не возражаете против одного Windows Box и пишете немного кода для взаимодействия с ним из вашей системы Linux , посмотрите этот пост.
Я написал этот пост, поэтому применяются обычные заявления об отказе от ответственности.
- Открыть -> Открыть офис (3.2 в моем случае)
- Откройте документ, который вы хотите экспортировать
- Файл-> Экспорт в PDF
- Пресса: Экспорт
- Выберите имя файла
Готово и Готово
- Установите OSE VirtualBox из центра программного обеспечения
- Установите Windows внутри VirtualBox
- Установите MS Office в виртуальной Windows
- Установите
dopdf
в виртуальной Windows - Установите
dopdf
качестве принтера по умолчанию во время установки. - Откройте
*.doc
в виртуальном офисе и распечатайте его на виртуальном принтереdopdf
. - Файл
*.pdf
появится в папке «My Documents
» виртуальной Windows. - Отправьте его как вложение электронной почты туда, куда вам нужно отправить его.