4

Существует ли бесплатный (то есть бесплатный) способ преобразования файла PDF в Windows EMF (расширенный метафайл) таким образом, чтобы текст, использующий встроенные в PDF шрифты, отображался в MS Office PowerPoint таким же образом? Я думаю, что нужно было бы заменить текст заполненным путем, но это было бы хорошо, так как я только хочу показать результат, а не редактировать его.

Я попытался pstoedit, но встраивание шрифтов кажется хитрым. Глядя на руководство по обработке шрифтов, кажется, что -dt должен превращать текст в заполненные пути, но в этом случае пути, по-видимому, на самом деле просто полигоны, соединяющие конечные точки сегмента, но не делающие никаких кривых Безье между ними. Таким образом, результат выглядит странно, например, с бриллиантами в качестве точек всех «я».

Я читал в нескольких местах (например, здесь), что Inkscape может быть использован для преобразования PDF в EMF. Но в Windows импорт PDF зависает, не показывая диалоговое окно. В Linux я получаю диалоговое окно импорта, но единственный вариант для обработки текста - оставить текст в виде текста; Я не могу конвертировать в пути, поэтому без встроенных шрифтов я вынужден вместо этого использовать системные шрифты.

Я также пробовал convert ImageMagick , но это, кажется, растеризует изображение, поэтому результат выглядит размытым.

Для одного приложения, а именно для встраивания формул LaTeX в PowerPoint, этот пост предлагает альтернативы (по крайней мере, некоторые из которых работают через DVI вместо PDF и MHTML вместо EMF. Но есть еще много инструментов, которые могут создавать PDF, но не EMF, поэтому Общая проблема остается.

У меня есть доступ к Windows, Linux и OS X, поэтому предложенный ответ может использовать любую комбинацию ОС, если это поможет. Если у вас нет полного решения, то частичное решение все еще может помочь. Например, какой-нибудь PDF-to-PDF конвертер, который заменяет текст заполненными путями. Или какой-нибудь инструмент для извлечения шрифтов из PDF и сохранения их в отдельных файлах, где другие инструменты (такие как pstoedit или inkscape) могут их подбирать и использовать для визуализации текстов. Или что-то еще, что вы считаете значительным шагом к решению.

2 ответа2

4

Я столкнулся с той же проблемой, что и вы: у меня было несколько файлов .pdf (по две страницы в каждом), которые я хотел преобразовать во что-то, что можно было импортировать в файл Word; в итоге что-то оказалось .emf (все остальные форматы не были приняты).

Этот ответ предполагает, что вам удобно пользоваться консолью.

Инструментом выбора для преобразования векторного формата X в векторный формат Y является inkscape . Однако при импорте файла .pdf непосредственно в inkscape

  • вы можете получить доступ только к первой странице на консоли (насколько мне известно)
  • даже если вы выберете опцию text-to-paths -T , текст будет плохо преобразован.

Поэтому я счел необходимым предварительно преобразовать файл .pdf во что-то, что может использовать inkscape . Я нашел этот ответ очень полезным, особенно упоминание pdf2svg . Моя последняя последовательность была следующей:

pdf2svg input_filename.pdf interim_filename_%d.svg all
inkscape -T interim_filename_1.svg --export-emf=interim_filename_1.emf
(repeat for all additional pages of the .pdf)

Насколько я могу видеть на экране, перенося эти файлы .emf на компьютер под управлением Windows и открывая их с помощью средства просмотра изображений Windows, результат идентичен вводу. Кроме того, попробовав контрольный пример с нестандартным документом LaTeX, используя шрифт, которого нет на моем компьютере с Windows, я также нашел результат идентичным. Пропуск начального шага pdf2svg означал, что интервал был полностью испорчен после преобразования inkscape .

В моем случае мне не нужно было удалять границы страницы .pdf (я имел дело с полностраничными файлами). Вам может потребоваться такой промежуточный шаг, если вы заинтересованы только в небольшой части страницы .pdf . Судя по этому ответу, pdfcrop кажется, способен это сделать.

0

Если вам нужно написать формуляры на PPT, вы можете использовать IguanaTex Add-In для PPT.

Это зависит от распределения латекса, и если вы хотите также генерировать графики Tikz, вам понадобится ImageMagick. Который используется для преобразования полученного PDF PDFLatex в PNG, который выглядит довольно хорошо в PPT.

Если вам нужны картинки более высокого качества, вы можете использовать автономный класс и конвертировать (также требуется ImageMagick). Здесь вы можете генерировать PNG или JPG с определенным DPI. Или PDF как векторный формат.

Или вы можете использовать Standalone и вызвать pstoedit для генерации файлов WMF.

\documentclass[
   convert={command=\unexpanded{
     pstoedit\space-v \space -f\space emf \space convert.pdf \space convert.emf
   }}]{standalone}

Кажется, вам нужно отредактировать вывод и ввести имя файла от руки.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .