Я думаю, что вы были на правильном пути с Acrobat Pro.
Вам нужно изменить фактическое разрешение изображения, хотя. Вы можете сделать это, вручную создав версию с низким разрешением (например, 50% Ш x 50% В) и заменив существующее изображение в формате PDF на новое. В этом случае изображение dpi внутри pdf тоже нужно будет уменьшить вдвое, чтобы сохранить размер. Если вы сохраняете то же самое dpi, это будет четверть размера.
Пока размеры документа не меняются, текст OCR должен быть сопоставлен с теми же пространственными координатами.
Редактировать: пакетная обработка с использованием Acrobat Pro
Ниже вы можете увидеть Acrobat Pro (XI) может просматривать свойства изображения.
- Как только изображение становится частью PDF, оно получает физический « размер » на «виртуальной бумаге».
- Ppi (или dpi, но это больше для контекстов печати) - это метрика pdf, которая дает соотношение между физическим размером и количеством пикселей. Я полагаю, что единица измерения, обозначенная на рисунке, неверна; это должно быть ppi. Я также думаю, что называть это резолюцией - плохой выбор слов.
- Реальное разрешение изображения (ширина по ширине) - это свойство изображения, не зависящее от PDF, оно влияет на размер файла и степень его значительного увеличения при цифровом просмотре.
Существует простое математическое соотношение: 2 = 3/1.
- То, что вы хотите сделать, это уменьшить 3, сохраняя при этом 1 константу, тем самым неявно уменьшая 2 на соответствующую величину.
- Большинство редакторов используют формулировку "изменить dpi", которая практически одинакова: измените 2 и неявно настройте 3 таким образом, чтобы 1 оставался неизменным.
- Но под капотом самое большое изменение происходит с разрешением изображения (3), ppi/dpi - это просто число, которое необходимо обновить в pdf; так что я нахожу свою формулировку лучше :)
Ниже вы можете запустить своего рода «умный фильтр» в вашем PDF-файле с помощью Acrobat Pro, один из доступных предустановленных фильтров - уменьшение dpi изображения. Таким образом, вы можете просто запустить эту опцию предварительной проверки или создать свою собственную. Вы можете настроить параметры уменьшения масштаба и методы сжатия изображений.
Я думаю, что вы можете пакетно обрабатывать несколько файлов PDF, используя этот метод в сочетании с инструментом "мастера действий".