У меня есть отсканированный файл PDF, где разные страницы имеют разную ширину страницы из-за того, как PDF был объединен из нескольких источников. Это сбивает с толку зрителей.
Есть ли инструмент командной строки, который может назначить всем страницам одинаковую ширину?
Поскольку сканирование большое и уже сильно сжатое, фактические растровые изображения должны оставаться неизменными, и текст OCR, если таковой имеется, должен быть сохранен в процессе.
Например:
- До.
- Размер страницы 15x10 см
- Размер дисплея 15х10 см
- Размер пикселя изображения 1500x1000
- После.
- Размер страницы 30x20 см
- Размер дисплея 30х20 см
- Размер пикселя изображения 1500x1000, неизменный поток двоичных данных.
Было бы предпочтительным решение с использованием imagemagick, поскольку оно легко доступно для сценариев оболочки через Cygwin. Однако я подозреваю, что может быть невозможно предотвратить повторное кодирование изображений в ImageMagick.