Обнаружение векторных тяжелых PDF-файлов

Question

У меня есть механизм автоматической обработки PDF. У меня есть опыт работы с различными инструментами, такими как PDF-TK, Ghostscript, PyPDF и PDFMiner, но эта проблема ставит меня в тупик.

Я использую Ghostscript для оптимизации файлов PDF. Это работает до сих пор без проблем, он берет файлы изображений в формате PDF и снижает разрешение, а размер файлов меньше.

Моя проблема: теперь мне приходится обрабатывать исключительно векторные файлы PDF с градиентами, которые, хотя и оптимизированы, работают с частотой 15-20 МБ, что неприемлемо в моей ситуации. Кроме того, они требуют много вычислительной мощности для рендеринга в Acrobat и делают это медленно.

Есть ли у вас какие-либо предложения о том, как с этим бороться? Я думал, чтобы посчитать фигуры, отличные от текста (но как я не знаю). Основываясь на этой информации, я мог бы растрировать весь PDF, а еще лучше - все, кроме текста.

Любая помощь с благодарностью!

Обнаружение векторных тяжелых PDF-файлов

0

Знаете кого-то, кто может ответить? Поделитесь ссылкой на этот вопрос по почте, через Твиттер или Facebook.

Похожие