40

У меня есть набор файлов в формате .doc , которые необходимо преобразовать в формат .pdf . Я использую Ubuntu Linux.

10 ответов10

32

Альтернатива 1)

sudo apt-get install cups-pdf

Затем перейдите к "Система"> "Администрирование"> "Печать" и создайте новый принтер, установите его в качестве принтера PDF-файла и назовите его "pdf".

Затем запустите:

oowriter -pt pdf your_word_file.doc

Теперь вы найдете ваш файл .pdf в ~/PDF.


Альтернатива 2)

sudo apt-get install wv tetex-extra ghostscript  
wvPDF test.doc test.pdf

Если пакет tetex-extra недоступен в вашем дистрибутиве, попробуйте texlive-base плюс texlive-latex-base:

sudo apt-get install wv texlive-base texlive-latex-base ghostscript  
wvPDF test.doc test.pdf
14

Ты можешь использовать:

oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
11

Если вы используете X, то вы можете сделать это через Open Office. Поскольку вы собираетесь возразить против этого, помните, что в Open Office есть несколько макросов, которые можно автоматизировать. Вы можете сделать что-то подобное с AbiWord (AbiWord --to = pdf).

Если у вас нет X, тогда есть антислово, но оно просто извлекает текст - не выполняет форматирование и графику. Есть также wvWare, который я использовал для массового извлечения изображений из файлов документов, но я никогда не пытался использовать его для преобразования файлов документов в PDF-файлы.

Да, и для файлов .docx может потребоваться что-то другое, но, поскольку они представляют собой просто заархивированные XML-файлы, не составит труда сделать что-то полезное с ними. Для массового извлечения изображений вы просто распаковываете их и копируете каталог с изображениями, но мне никогда не нужно было конвертировать их в Linux.

9

Печать в PDF теряет много метаданных документа (заголовок, авторство, дерево заголовков, которое используется для навигации и т.д.).

Установите unoconv, конвертируйте с помощью: unoconv -fpdf file1.doc file2.doc…

5

Вы также можете сделать это с AbiWord:

sudo apt-get install abiword

Затем вы можете загрузить файлы .doc в графический интерфейс AbiWord и экспортировать их в PDF или из командной строки:

abiword --to=pdf filename.doc

2

Если вы уже установили LibreOffice

lowriter --headless --convert-to pdf *.doc 
2

Я бы попробовал использовать для Linux

$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf

Для окон:

"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf

PyODConverter требует, чтобы OpenOffice.org работал как служба и прослушивал порт (по умолчанию) 8100; Самый простой способ запустить OpenOffice.org как сервис - из командной строки:

"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
0

Открытый офис - хороший путь вперед, но точность преобразования не всегда является правильной.

Если вы ищете 100% Linux-решение, то это лучший путь вперед. Однако, если вы не возражаете против одного Windows Box и пишете немного кода для взаимодействия с ним из вашей системы Linux , посмотрите этот пост.

Я написал этот пост, поэтому применяются обычные заявления об отказе от ответственности.

0
  • Открыть -> Открыть офис (3.2 в моем случае)
  • Откройте документ, который вы хотите экспортировать
  • Файл-> Экспорт в PDF
  • Пресса: Экспорт
  • Выберите имя файла

Готово и Готово

-3
  • Установите OSE VirtualBox из центра программного обеспечения
  • Установите Windows внутри VirtualBox
  • Установите MS Office в виртуальной Windows
  • Установите dopdf в виртуальной Windows
  • Установите dopdf качестве принтера по умолчанию во время установки.
  • Откройте *.doc в виртуальном офисе и распечатайте его на виртуальном принтере dopdf .
  • Файл *.pdf появится в папке « My Documents » виртуальной Windows.
  • Отправьте его как вложение электронной почты туда, куда вам нужно отправить его.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .