4

Я знаю, что общая проблема преобразования произвольного PDF в .tex либо невозможна, либо может привести к непригодному для использования LaTeX (например, выражая все как векторную графику).

Но если мой PDF был сгенерирован из файла LaTeX (которого у меня больше нет), есть ли способ «перепроектировать» его обратно в исходный файл?

4 ответа4

1

Извините, но это не очень поможет, если файл был сгенерирован LaTex.

1

Я поместил это здесь для любого, кто ищет доказательства будущего - извините, это не поможет, если вы уже не сделали что-то вроде следующего -

Существуют пакеты LaTeX для включения / вложения оригинальных (или любых) файлов в созданный вами pdf.

Я собирался разместить всю информацию здесь, но как новый пользователь система сказала мне, когда я закончил писать, что я могу сделать только две ссылки, так что здесь та же самая информация (в другом обсуждении), которую я разместил в рассылке TeXworks. Список после этой публикации изначально не удался.

http://tug.org/pipermail/texworks/2011q3/004624.html

Пол http://twscript.paulanorman.info

1

Вы потеряли свой файл .tex и хотели бы воссоздать PDF, возможно, чтобы изменить его. В зависимости от того, насколько длинным является ваш файл и насколько "обычным" был ваш файл стиля, вы можете попытаться создать его вручную.

Для текста вы должны иметь возможность скопировать его из PDF-файла (если только вы не использовали странную функцию безопасности, чтобы запретить это), а затем вставить его в Emacs большими кусками. С помощью команд fill вы можете справляться с разрывами страниц и легко и легко восстанавливать структуру абзаца. Затем вы можете найти / заменить посторонние символы, такие как дефисы и ударения. Отслеживание сносок и подписей создаст некоторые проблемы; Я предлагаю вставить их там, где они есть, и соответствующим образом отформатировать, прежде чем восстанавливать структуру абзаца.

Для графики, предполагая, что они являются векторными изображениями, вы можете использовать Illustrator или Inkscape, чтобы вырезать их из файла PDF и сохранить их как соответствующий тип файла, который может использоваться pdflatex. Если это jpgs, вам не повезло, так как качество уже будет слишком скомпрометировано, чтобы они были полезны. Если они были сгенерированы LaTeX с использованием PSTricks или чего-то в этом роде ... вам тоже не повезло.

Заголовки разделов и подразделов должны быть достаточно просты для идентификации и переформатирования. Когда я пишу это, маркировка и ссылки начинают выглядеть как мир боли, но если вы планируете это на бумаге, прежде чем вручную анализировать файл, это должно быть выполнимо.

Математические уравнения, если у вас есть что-то более сложное, у вас не будет проблем с быстрой переписью.

Что касается ссылок, вам придется заново создать файл .bib (при условии, что вы его использовали). Я бы порекомендовал скачать записи BibTeX, которые вы можете найти в Интернете, и заполнить остальные вручную.

В целом, это похоже на (утомительный) проект выходного дня. Я делал это раньше, и это не так сложно, как кажется. Опять же, это был документ на ~ 20 страницах, а не докторская диссертация, поэтому обязательно выбирайте свои битвы с умом. Все, что я могу сказать, это Удача.

0

Если PDF-файл в основном текстовый, вы можете запустить pdf2text для файла, чтобы извлечь необработанный текст. Но тогда вам все равно придется вручную вставить все команды LaTeX, чтобы получить форматирование.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .