Мне нужно конвертировать целую кучу PDF-файлов в какой-то другой формат файла (Doc, DocX, RTF и т.д.), А затем немного позже вернуться в PDF.

Мне нужно, чтобы новые PDF-файлы выглядели так же, насколько это возможно.

Есть ли какая-то разница между этими форматами файлов относительно того, насколько конвертируются потери, или это не имеет большого значения? Какие факторы будут иметь значение?

1 ответ1

1

PDF - это формат описания макета страницы : он описывает общую структуру документа, ресурсы, такие как шрифты и встроенные изображения, дерево всех страниц и другие возможные вещи. Для каждой страницы он содержит команды для размещения определенных глифов в определенных позициях или другие операции с изображениями, например размещение встроенного изображения.

Три других упомянутых вами формата (Doc, DocX, RTF) являются специфичными для Microsoft форматами "источника", которые описывают последовательности символов с атрибутами и не описывают (по крайней мере в принципе) расположение этих символов на видимых страницах.

Таким образом, все преобразования из PDF в любой из этих форматов (и в основном все форматы, которые вы можете разумно редактировать) будут с потерями. Очень с потерями.

Если вы приложите достаточно усилий для преобразования, вы можете получить обратно PDF, который более или менее напоминает исходный PDF, но сделать его похожим на самом деле очень сложно.

Итог: PDF не редактируются. Отредактируйте все, что использовалось для создания PDF. Если у вас нет доступа к этому, удачи. Вы все еще можете попробовать отредактировать PDF напрямую, но это тоже не легко.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .