16

Как просмотреть внутреннюю структуру PDF в Adobe 9.0?

Я не нашел расширенного меню, в котором есть эта опция.

Кто-нибудь может мне помочь?

6 ответов6

21

Есть несколько способов просмотреть внутреннюю структуру PDF.

PDF-файлы читаются человеком

За исключением паролей безопасности, большая часть из них читается человеком. Если PDF-файл имеет пароль, все строки и потоки (которые уже будут сжаты, без потерь) будут псевдослучайным мусором. Сжатые потоки данных имеются в большом количестве, но большая часть их выглядит примерно так в вашем любимом текстовом редакторе:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Предупреждение: пробелы в значительной степени не имеют значения и обычно удаляются, когда это возможно. Я просто сделал это красиво, чтобы было легче понять это.

<< и >> начало и конец словарей. Словари состоят из пар ключ / значение. Ключ всегда является "именем": все имена начинаются с «/». Значение может быть любым, включая другое имя.

[ и ] начало и конец "массивов". Массивы могут состоять из чего угодно.

Числа являются "числами". Плавающая точка или иначе.

() и <> начинаются и заканчиваются "строками". <> строки перечислены как шестнадцатеричные значения, () - строки ANSI.

Pet Peeve: / Имена и (Строки) используют совершенно разные системы побега. Grr.

Косвенные ссылки указывают на другие объекты в PDF:
<objNum> <generationNum-AlwaysZero> R

В вышеприведенном примере объекта поток контента находится в объекте 4 в другом месте PDF. Чтобы найти его, вы можете использовать текстовый поиск ваших редакторов для "N 0 obj", где N - номер объекта, который вы хотите.
ВНИМАНИЕ: в PDF есть сотни, возможно, тысячи объектов. Поиск "1 0 obj" даст вам много хитов.

Учитывая, что вы просите увидеть внутреннюю структуру, вы, вероятно, уже знаете все это. Другие, желающие узнать то же самое, могут не знать.

ВНИМАНИЕ: НЕ РЕДАКТИРУЙТЕ PDF в текстовом редакторе. Все эти двоичные файлы будут искажены, байтовые смещения очень важны в PDF.

Плагин Acrobat [s]

Есть плагин для акробата PDF CanOpener от Windjack Solutions (без принадлежности). Это СЛИК. Вы сможете просматривать структуру PDF в виде дерева, просматривать (и изменять) потоки содержимого и т.д.

Сторонние приложения

Много. Многие люди создают его как часть обучения анализу PDF или как инструмент отладки. Они довольно удобны.

iText RUPS (часть iText, Java PDF lib):
https://sourceforge.net/projects/itext/

Браузер объектов PDF:
http://ulc-community.canoo.com/snipsnap/space/PDF+Object+Browser

PDF Vole:
https://java.net/projects/pdfvole

6

O2Solutions предлагает совместимую с MS Windows утилиту для просмотра внутренней структуры PDF-документов. Это бесплатно для личного и коммерческого использования.

http://www.o2sol.com/pdfxplorer/overview.htm

4

PoDoFoBrowser - небольшая бесплатная портативная утилита, которая позволяет не только просматривать внутреннюю структуру PDF, но также экспортировать, импортировать и редактировать данные объекта. Его можно скачать здесь:

http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/

Вот как это выглядит под Windows:

Скриншот

4

Вы можете просмотреть внутреннюю структуру PDF в Adobe Acrobat с помощью команды « Browse Internal PDF Structure из плагина Preflight:

http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/

Вы также можете использовать коммерческий плагин PDF CanOpener для Acrobat для просмотра структуры объектов или бесплатный PDFedit для декодирования сжатых потоков данных в PDF.

2

PDF Vole, кажется, сломан. Если кто-то все еще ищет инструмент, я использую бесплатный PDF Analyzer.

1

Бесплатный редактор PDF-XChange имеет панель « Содержимое», которая позволяет просматривать древовидную структуру файла PDF.

View -> Panes -> Content

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .