Если вы не можете согласиться с тем, что часть предыдущей главы находится на той же странице, что и начало следующей главы, тогда проблема сводится к тому, что каждая страница обрабатывается как изображение, и выполняется редактирование изображения до тех пор, пока оно не будет удовлетворено, а затем PDF-файл изображения вместе.
PDF-файлы не являются "переформатируемыми", то есть, если вы удалите какой-либо текст, остальная часть текста не будет автоматически "перемещаться" вверх, как это было бы в Microsoft Word или других редакторах документов на основе страниц. PDF просто не работает таким образом, и нет абсолютно никакого способа заставить его вести себя таким образом и сохранять 100% достоверность входного содержимого.
Вы можете использовать Adobe Acrobat, чтобы попытаться "сохранить как" документ в формате Word, но это крайне несовершенное приближение, которое пытается (иногда плохо) определить содержание PDF в терминах MS Word. Получающийся в результате документ может быть очень трудно изменить, и он может не выглядеть как входной документ, особенно если вы немного поиграете с ним.
Это также зависит от того, как был создан входной PDF. Если он был сгенерирован из изображений, тогда весь текст должен был бы быть OCR для какой-либо его модификации, и у OCR есть свои проблемы (крайне неточные, если он уже не знает, что шрифт OCRed и DPI очень высокое), Если PDF-файл содержит фактический текст, проблема становится немного проще, но если вы хотите сохранить 100% исходного форматирования, графики и т.д., Проблема снова становится чрезвычайно сложной.
Я просто хотел бы жить с частью предыдущей главы на той же странице и использовать один из многих существующих инструментов для извлечения нужных страниц из PDF. Вы можете использовать, например, pdfedit
чтобы извлечь страницы и вставить их в другой PDF в Linux. Очень легко вырезать страницы из одного PDF-файла и помещать их обратно в другой PDF-файл в произвольном месте, сохраняя при этом 100% -ную достоверность содержимого. Когда вы хотите изменить содержимое страницы , это становится практически невозможным без потери точности или огромных затрат времени и усилий на ручное редактирование растровых изображений страниц PDF.