-2

У меня есть PDF книга. У меня нет источников этого.

Мне нужно получить часть этого (то есть 1 главу) в другой файл PDF.

Я знаю, что могу напечатать несколько страниц в файл, но этого недостаточно, потому что глава начинается в середине страницы. (и мне нужно сдвинуть его в начало страницы, если это возможно)

ОС это Ubuntu

1 ответ1

3

Если вы не можете согласиться с тем, что часть предыдущей главы находится на той же странице, что и начало следующей главы, тогда проблема сводится к тому, что каждая страница обрабатывается как изображение, и выполняется редактирование изображения до тех пор, пока оно не будет удовлетворено, а затем PDF-файл изображения вместе.

PDF-файлы не являются "переформатируемыми", то есть, если вы удалите какой-либо текст, остальная часть текста не будет автоматически "перемещаться" вверх, как это было бы в Microsoft Word или других редакторах документов на основе страниц. PDF просто не работает таким образом, и нет абсолютно никакого способа заставить его вести себя таким образом и сохранять 100% достоверность входного содержимого.

Вы можете использовать Adobe Acrobat, чтобы попытаться "сохранить как" документ в формате Word, но это крайне несовершенное приближение, которое пытается (иногда плохо) определить содержание PDF в терминах MS Word. Получающийся в результате документ может быть очень трудно изменить, и он может не выглядеть как входной документ, особенно если вы немного поиграете с ним.

Это также зависит от того, как был создан входной PDF. Если он был сгенерирован из изображений, тогда весь текст должен был бы быть OCR для какой-либо его модификации, и у OCR есть свои проблемы (крайне неточные, если он уже не знает, что шрифт OCRed и DPI очень высокое), Если PDF-файл содержит фактический текст, проблема становится немного проще, но если вы хотите сохранить 100% исходного форматирования, графики и т.д., Проблема снова становится чрезвычайно сложной.

Я просто хотел бы жить с частью предыдущей главы на той же странице и использовать один из многих существующих инструментов для извлечения нужных страниц из PDF. Вы можете использовать, например, pdfedit чтобы извлечь страницы и вставить их в другой PDF в Linux. Очень легко вырезать страницы из одного PDF-файла и помещать их обратно в другой PDF-файл в произвольном месте, сохраняя при этом 100% -ную достоверность содержимого. Когда вы хотите изменить содержимое страницы , это становится практически невозможным без потери точности или огромных затрат времени и усилий на ручное редактирование растровых изображений страниц PDF.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .