41

У меня есть отсканированный курс, и он состоит из двух страниц, которые отображаются последовательно как одна страница, как я могу автоматически разделить все страницы за один проход. Обычно это делается путем обрезки нечетных и четных страниц, а затем их объединения, но это может занять очень много времени?

Как разделить страницы на отсканированном PDF за один проход?

5 ответов5

25

Посмотрев некоторые ответы в Интернете (это часто задаваемый вопрос), я обнаружил, что это можно легко сделать с помощью параметра « Poster в меню « Print .

Шаги (для Adobe Acrobat XI):

  1. Выберите « Print из меню « File или Ctrl+P
  2. Выберите Printer как Adobe PDF
  3. Выберите вкладку Poster .
  4. Измените Overlap на 0 дюймов
  5. Настройте Tile scale в соответствии с вашими потребностями:100%(99%), если размер напечатанной PDF-страницы в результате совпадает с текущим размером страницы PDF, 75%, если размер напечатанной страницы PDF составляет половину от текущего PDF-файла. При необходимости возьмите проценты по шкале плиток, чтобы получить желаемый результат. Чтобы проверить размер напечатанного PDF-документа, перейдите справа от поля со списком "Adobe PDF", выберите « Properties и при необходимости измените поле со списком « Adobe PDF Page Size .
  6. Вы можете нажать кнопку « Print , когда страница выглядит разделенной, как вам нужно, проверьте пунктирную линию в предварительном просмотре:

Вот экран печати для описанных настроек:

24

Есть отличный, бесплатный инструмент с открытым исходным кодом под названием Briss. Это очень просто, удобно и эффективно. Он работает на нескольких операционных системах через Java.

Загрузите ваш PDF в приложение. Приложение сгруппирует похожие страницы и уложит их друг на друга. Нарисуйте прямоугольники поверх ваших страниц, чтобы они покрывали то, что вы хотите включить. Это будет выглядеть так:

Даже если ваш PDF имеет несколько категорий макета в одном документе, Briss справится с этим. Например, скажем, некоторые части в портретной, а другие в альбомной. Briss сгруппирует их по разным категориям и позволит вам нарисовать на них разные прямоугольники, а затем обработать все это за один проход в один документ. Брисс очень хорошо решает, какие страницы должны быть сгруппированы. Как правило, у меня уходит меньше минуты ручной работы, чтобы начать работу с Бриссом. Таким образом, документ за сотни или даже тысячи страниц может быть сделан за пару минут благодаря этой замечательной программе.

Когда все выглядит хорошо, выберите « Действие», затем « Обрезать PDF».

Действительно очень аккуратный инструмент.

Примечание: я понимаю, что этот ответ звучит так, как будто я разработчик Briss или что-то в этом роде, но на самом деле это не так. Я просто люблю инструмент.

15

Sejda.com может разделить отсканированные документы PDF пополам, посередине. Работает на всех настольных платформах.

Вот краткое как:

Как разделить отсканированные PDF документы пополам с Sejda.com

Если это отсканированный буклет, и страницы уже не в своем естественном порядке, он также может изменить их порядок для вас.

Я разработчик проекта. Открытый исходный код

6

Вы можете использовать MuTol mutool:

mutool poster -x 2 in.pdf out.pdf
4

Есть две проблемы с автоматизацией разделения отсканированных книг за один проход:

  • Автоматизация не всегда точность
  • Сделать отсканированную книгу удобной для чтения - это больше, чем просто разделение страниц

Для всего, что связано со сканированными книгами, я настоятельно рекомендую использовать ScanTailor. Он имеет такие функции, как:

  • перевернуть перекошенные страницы по вертикали,
  • выберите контент, чтобы уменьшить размер страницы,
  • добавить больше поля, чтобы иметь больше места для заметок,
  • отбелить результат для лучшего опыта чтения.

Вы должны экспортировать PDF в изображения, чтобы использовать это, и рекомбинировать выходные изображения обратно. Обработанные изображения могут быть очень маленькими по размеру файла (до 6% от исходного), но отличного качества.

Чтобы выполнить задачу удовлетворительно, я рекомендую вам использовать PDF-Xchange Viewer для извлечения изображений и добавления OCR, i2pdf для объединения выходов. По моему опыту, вы можете установить самое низкое качество JPG, и оно не будет сильно отличаться, но у вас есть компромисс между размером конечного результата и качеством изображения. Все программы бесплатны. Весь процесс занимает около 1 часа в фоновом режиме, с периодическими проверками.

Из своего GitHub:

Scan Tailor - это бесплатное программное обеспечение (которое больше, чем просто бесплатное программное обеспечение). Он написан на C++ с Qt и выпущен под лицензией General Public License версии 3. Мы разрабатываем версии для Windows и GNU/Linux.


К вашему сведению: Как создавать иерархические закладки на отсканированных файлах PDF?

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .