1

У меня есть несколько отсканированных файлов PDF, которые я хочу обработать с помощью ScanTailor. Для этого мне нужно извлечь изображения (как TIFF). Я использовал GhostScript следующим образом:

gs -sDEVICE=tiffgray -r400x400 -dNOPAUSE -dBATCH -sOutputFile="file0000.tiff" "input.pdf"

Проблема в том, что я не знаю, каково разрешение исходных изображений в PDF. Есть ли способ заставить GhostScript адаптировать свое разрешение на основе изображений в файле PDF? Или есть другое бесплатное программное обеспечение для Linux, которое может это сделать?

Adobe Acrobat делает это:

Цветовое пространство /разрешение Указывает цветовое пространство и разрешение для выходного файла. Вы можете позволить Acrobat определять эти параметры автоматически.

1 ответ1

1

Pdfimages от poppler-utils извлекает изображения из файлов pdf, сохраняет их как PBM для монохромных изображений и PPM для немонохромных изображений, но вместо этого вы можете сделать вывод в формате jpg. Если это вас не устраивает, вы можете использовать pdfimages -list для получения списка изображений и их информации, включая разрешения.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .