1

Я извлекаю все изображения из нескольких отсканированных PDF-файлов с помощью pdfimages , чтобы обработать и упаковать их.

Проблема в том, что некоторые изображения поворачиваются на 90 ° (по часовой стрелке или против часовой стрелки), а другие нет. Исходный PDF повторно поворачивает их на странице, так что все страницы отображаются ровно, а извлеченные изображения остаются повернутыми.

Я не смог найти опцию в pdfimages для вывода поворотов, чтобы я мог использовать их в скрипте.

Есть ли способ извлечь эту информацию?

1 ответ1

-1

Я не уверен, что ваши PDF-файлы являются многостраничными, поэтому, если они затем используют pdfTK или pdfSAM, чтобы разбить их на одностраничные PDF-файлы, то используйте The Gimp для поворота изображений вручную.

Другая вещь, которую вы могли бы использовать, это использовать инструмент, подобный ImageMagick, для автоматизации поворота, но вам, вероятно, придется разделить обычные изображения, CW, CCW, на разные папки.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .