Я получил несколько PDF-файлов с изображениями в них. Исходные изображения были утеряны, поэтому мне нужно их извлечь. У меня есть Adobe Acrobat Pro, поэтому я извлек их, используя Advanced > Document Processing > Export All Images
(есть четыре варианта: jpeg, png, tiff, jpeg2000). Но я хотел бы извлечь их в исходном формате, и это, очевидно, не jpeg: я также протестировал pdfimages.exe из xpdf, как описано здесь, и это дало файлы .ppm, а не jpeg.
Поэтому я попытался идентифицировать ImageMagick, что он мне дал:
identify images-000.ppm
images-000.ppm PPM 870x1181 870x1181+0+0 8-bit sRGB 3.082MB 0.000u 0:00.000
Означает ли это, что это был встроенный .bmp? Как сказать? На самом деле я ожидал, что в Acrobat будет функция для определения формата изображений, но я не смог его найти.
Итак, как лучше всего определить формат изображения изображений в формате PDF?
(Я предпочитаю извлечение через Acrobat из-за функциональности пакета).