У меня есть 5000 PDF, из которых 500 PDF важны, остальные бесполезны. В каждом файле 500 присутствует одно слово, которого нет в других файлах 4500. Я выполнил поиск по нескольким файлам и узнал, что не могу выбрать 500 PDF-файлов из результатов поиска в Adobe Reader. Есть ли другой способ выбрать несколько файлов PDF, которые содержат определенное слово?
2 ответа
У вас есть три основных варианта
Вариант первый:
Получите ваши 5000 PDF-файлов. Сделайте 10 папок по 500. Запустите 10 индивидуальных поисков.
Вариант второй:
Поиск в Windows (определенно 10, не уверен в других, но стоит попробовать) работает с PDF-файлами. Просто зайдите в свою папку, введите ключевое слово, все соответствующие файлы должны быть возвращены.
Вариант третий:
Такие библиотеки, как iTextSharp, позволят вам получить текст из документа в формате C #. Вы можете просматривать все документы и делать с ними все, что вам нужно, при условии, что вы можете использовать C #.
Очевидно, читатель FoxIt выполняет похожий поиск через функцию папок - хотя я не знаю, ограничен ли он и 500.
Я решал ту же самую проблему с тем, как искать среди тысяч файлов PDF и работать с теми, которые содержали определенную строку. Total Commander с плагином xPDFSearch помог мне. Плагин расширяет возможности поиска Total Commander, позволяя выполнять поиск по метатегам PDF или даже выполнять полнотекстовый поиск.
Total Commander доступен также в виде Shareware, но, если вам это нравится, пожалуйста, помогите автору этого блестящего менеджера.