У меня есть две коллекции PDF-файлов. Один (collection1) - это 1000+ PDF-файлов, намного больше по размеру файла (100+ ГБ) и по нелогичным разделам (подумайте, pdf 1 (1), 1 (3), ... когда это могло и должно быть просто одним файлом) , Другой (collection2) - 300 файлов.
Collection2 должен быть сжатой и организованной версией collection1. Я использовал Adobe Acrobat для обработки, сжал несколько PDF-файлов в один PDF-файл, а затем применил сжатие (и нумерацию Бейтса). После нескольких из них у меня был младший персонал ...
И мы недавно обнаружили, что есть ошибки. Разделы отсутствуют по сравнению с оригинальными PDF-файлами и аналогичными проблемами. Это колосс ошибки, и я надеюсь, что мы легко это исправим.
Не уверен , что если то , что я ищу в этом случае действительно разница, как я должен был бы сравнить несколько файлов в один файл.
Если бы я мог изолировать проблемные файлы, я бы легко их исправил. Лучшее, что я могу понять прямо сейчас, - это, пожалуй, удивительно предварительный просмотр (MacOS), который позволяет открывать несколько файлов (и обеспечивает количество страниц). Оттуда я могу проверить первый, последний и несколько посередине. Если они согласованы и количество страниц одинаково, то, скорее всего, файлы являются надежными, насколько я могу судить по ошибкам. Однако это не самое тщательное решение.
Ответы на аналогичные вопросы есть здесь и здесь, однако они либо несколько лет, в зависимости от окон (что хорошо, если необходимо, но не желательно в данном конкретном случае), либо не в том масштабе, в котором мне нужно работать. Никто из моей команды не обладает продвинутыми техническими навыками по отношению к сообществу SU, поэтому подробный ответ или ссылки на соответствующие предварительные знания были бы очень важны.
Спасибо большое SU