Как просмотреть внутреннюю структуру PDF в Adobe 9.0?
Я не нашел расширенного меню, в котором есть эта опция.
Кто-нибудь может мне помочь?
Как просмотреть внутреннюю структуру PDF в Adobe 9.0?
Я не нашел расширенного меню, в котором есть эта опция.
Кто-нибудь может мне помочь?
Есть несколько способов просмотреть внутреннюю структуру PDF.
За исключением паролей безопасности, большая часть из них читается человеком. Если PDF-файл имеет пароль, все строки и потоки (которые уже будут сжаты, без потерь) будут псевдослучайным мусором. Сжатые потоки данных имеются в большом количестве, но большая часть их выглядит примерно так в вашем любимом текстовом редакторе:
2 0 obj
<< /Type /Page
/MediaBox [0 0 612 792]
/Contents 4 0 R
/Resources << /Fonts
<< /F1 5 0 R>>
>>
>>
endobj
Предупреждение: пробелы в значительной степени не имеют значения и обычно удаляются, когда это возможно. Я просто сделал это красиво, чтобы было легче понять это.
<< и >> начало и конец словарей. Словари состоят из пар ключ / значение. Ключ всегда является "именем": все имена начинаются с «/». Значение может быть любым, включая другое имя.
[ и ] начало и конец "массивов". Массивы могут состоять из чего угодно.
Числа являются "числами". Плавающая точка или иначе.
() и <> начинаются и заканчиваются "строками". <> строки перечислены как шестнадцатеричные значения, () - строки ANSI.
Pet Peeve: / Имена и (Строки) используют совершенно разные системы побега. Grr.
Косвенные ссылки указывают на другие объекты в PDF:
<objNum> <generationNum-AlwaysZero> R
В вышеприведенном примере объекта поток контента находится в объекте 4 в другом месте PDF. Чтобы найти его, вы можете использовать текстовый поиск ваших редакторов для "N 0 obj", где N - номер объекта, который вы хотите.
ВНИМАНИЕ: в PDF есть сотни, возможно, тысячи объектов. Поиск "1 0 obj" даст вам много хитов.
Учитывая, что вы просите увидеть внутреннюю структуру, вы, вероятно, уже знаете все это. Другие, желающие узнать то же самое, могут не знать.
ВНИМАНИЕ: НЕ РЕДАКТИРУЙТЕ PDF в текстовом редакторе. Все эти двоичные файлы будут искажены, байтовые смещения очень важны в PDF.
Есть плагин для акробата PDF CanOpener от Windjack Solutions (без принадлежности). Это СЛИК. Вы сможете просматривать структуру PDF в виде дерева, просматривать (и изменять) потоки содержимого и т.д.
Много. Многие люди создают его как часть обучения анализу PDF или как инструмент отладки. Они довольно удобны.
iText RUPS (часть iText, Java PDF lib):
https://sourceforge.net/projects/itext/
Браузер объектов PDF:
http://ulc-community.canoo.com/snipsnap/space/PDF+Object+Browser
PDF Vole:
https://java.net/projects/pdfvole
O2Solutions предлагает совместимую с MS Windows утилиту для просмотра внутренней структуры PDF-документов. Это бесплатно для личного и коммерческого использования.
PoDoFoBrowser - небольшая бесплатная портативная утилита, которая позволяет не только просматривать внутреннюю структуру PDF, но также экспортировать, импортировать и редактировать данные объекта. Его можно скачать здесь:
http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/
Вот как это выглядит под Windows:
Вы можете просмотреть внутреннюю структуру PDF в Adobe Acrobat с помощью команды « Browse Internal PDF Structure
из плагина Preflight:
http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/
Вы также можете использовать коммерческий плагин PDF CanOpener для Acrobat для просмотра структуры объектов или бесплатный PDFedit для декодирования сжатых потоков данных в PDF.
PDF Vole, кажется, сломан. Если кто-то все еще ищет инструмент, я использую бесплатный PDF Analyzer.
Бесплатный редактор PDF-XChange имеет панель « Содержимое», которая позволяет просматривать древовидную структуру файла PDF.
View -> Panes -> Content