Я должен проверить документ .pdf
который состоит из большого количества страниц. Я хотел бы быть в состоянии найти, какой тип шрифта используется в каком месте, чтобы проверить согласованность по всему документу.
2 ответа
Я рекомендую начать с утилиты pdffonts
. (Позже вы можете перейти к более продвинутому инструменту, такому как tet
с pdflib.com, если вам не хватит первого шага).
pdffonts
- это инструмент командной строки, доступный для Windows, Linux и Mac OS X. Он поставляется как часть XPDF (или как альтернативная реализация из форка XPDF под названием «poppler»). Загрузите утилиты XPDF для Windows здесь (в Linux они должны быть предварительно установлены на большинстве систем).
Попробуйте это, чтобы ознакомиться с инструментом (я предполагаю, что вы находитесь на Windows):
pdffonts.exe -h
Затем запустите его для своего PDF-файла, чтобы получить первый обзор всех используемых шрифтов:
pdffonts.exe d:\path\to\your.pdf
Теперь мы хотим увидеть, какие шрифты есть на страницах 11-13:
pdffonts.exe -f 11 -l 13 d:\path\to\your.pdf
Вы хотите шрифты на странице 15?
pdffonts.exe -f 15 -l 15 d:\path\to\your.pdf
Или вы хотите список шрифтов, используемых постранично? Хорошо, тогда вам нужно знать, сколько страниц в вашем PDF. Предполагая, что это 1234 страницы:
for /l %i in (1,1,1234) do (echo. &^
echo. Page %i:&^
echo. ============&^
pdffonts -f %i -l %i d:\path\to\your.pdf&^
echo.)
В Linux измените эту команду на:
for i in $(seq 1 1234); do
echo " Page ${i}:"
echo " ============"
pdffonts -f ${i} -l ${i} /path/to/your.pdf
echo
done
Теперь вы должны увидеть, что результат выглядит примерно так:
Page 1:
============
name type emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
DDPEFM+Helvetica Type 1C yes yes no 124352 0
DDPEIM+Helvetica-Bold Type 1C yes yes no 124354 0
Page 2:
============
name type emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
DDPEIM+Helvetica-Bold Type 1C yes yes no 124354 0
DDPEFM+Helvetica Type 1C yes yes no 124352 0
Arial-BoldMT TrueType no no no 3543 0
ArialMT TrueType no no no 3541 0
Page 3:
============
name type emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
DDPEFM+Helvetica Type 1C yes yes no 124352 0
DDPEIM+Helvetica-Bold Type 1C yes yes no 124354 0
Arial-BoldMT TrueType no no no 3543 0
ArialMT TrueType no no no 3541 0
Точное значение различных столбцов смотрите в man pdffonts
в Linux или в текстовом pdfinfo.txt
в Windows.
Насколько я знаю, вы можете увидеть список шрифтов, используемых в PDF, в диалоговом окне свойств документа (File> Properties или ctrl/cmd+D) на вкладке "Fonts".
Но в списке не указано, на какой странице используется конкретный шрифт, по крайней мере, в Adobe Reader. Может быть, есть такая опция в Acrobat Pro или какой-нибудь другой программе для чтения PDF?