У меня есть PDF-документ на 100 страниц, который мне нужно распечатать. Моей типографии нужно сказать, какие страницы содержат цвет. Я не хочу сканировать вручную. Есть ли программа, которая распознает цветные страницы и может вывести номер страницы?
3 ответа
Нашел это на http://root42.blogspot.de/2012/10/counting-color-pages-in-pdf-files.html
gs -o - -sDEVICE=inkcov input.pdf | grep -v "^ 0.00000 0.00000 0.00000" | grep "^ " | wc -l
Работал хорошо для меня
Общее количество страниц может быть найдено
pdfinfo input.pdf | grep Pages:
В Linux (и, вероятно, Mac / другой Unix), следующий очень короткий скрипт BASH, похоже, справится с задачей:
#!/bin/bash
file="$1"
for page in $(identify -density 12 -format '%p ' "$file") ; do
if convert "$file[$((page-1))]" -colorspace RGB -unique-colors txt:- | sed -e 1d | egrep -q -v ': \(\s*([0-9]*),\s*\1,\s*\1' ; then
echo $page
fi
done
Назовите сценарий как-нибудь в coloredpages.sh
и сделайте его исполняемым с помощью chmod +x coloredpages.sh
а затем запустите ./coloredpages.sh "pdfname.pdf"
и он должен вернуть список номеров страниц.
Для этого требуется установить ImageMagick и, возможно, Ghostscript. И это не самая быстрая вещь в мире.
Извините, я понятия не имею, как адаптировать это для Windows (без Cygwin или подобного, в любом случае).
Имея ту же задачу, что и OP и работая в Windows, я нашел следующее решение для быстрой и удобной работы: SDK счетчика файлов буферных файлов не бесплатен, но пробная версия все еще выполняет свою работу. Загрузите zip-файл по указанной выше ссылке, разархивируйте его и запустите bin/C#_ParsingTest yourfile.pdf
. Вы увидите что-то вроде
Page 1 is [ BW]
Page 2 is [Color]
...
Page 143 is [Color]
============
Statistics: bwPageCount=99, colorPageCount=44
Быстрый PDF-счет, упомянутый в другом ответе, требует установки (что для моей разовой работы - печать диссертации) является недостатком. Однако это также делает работу и предоставляет графический интерфейс. После установки запустите его, перетащите в него файл PDF, выберите Color Pages Counting
в меню «Настройка / Параметры», затем нажмите кнопку « Page count files in list
.
Интересно, что результаты моей диссертации отличаются на 1 страницу (99/44 против 100/43). Я полагаю, это потому, что некоторые фигуры (я сделал все с помощью Inkscape) на самом деле черно-белые, но в метаданных описываются как цветные. Я не уверен. Что я не нашел в Rapid PDF Count, так это список всех цветных / черно-белых страниц, поэтому я не могу сказать точный источник этого несоответствия.