Microsoft® предлагает эффективные инструменты для организации корпоративного поиска на разных уровнях, от централизованного хранения контента до настольных компьютеров. Microsoft Office SharePoint Server обладает мощными возможностями поиска в библиотеках и папках документов SharePoint; Поиск Windows полезен при поиске файлов на настольных компьютерах.
ABBYY Recognition Server IFilter является мощным дополнением к этим поисковым системам предприятия, которое позволяет им осуществлять поиск по всему содержимому графических документов. Обычно корпоративные поисковые системы могут индексировать полный текст только в форматах файлов документов, таких как HTML, RTF, DOC, XLS и т.д. На самом деле много важной информации содержится в файлах изображений, таких как JPEG, PDF и TIFF, и поэтому остается невидимым. для обычных поисковых систем. Отсканированные и сфотографированные документы, счета, письма, контракты - все эти документы могут быть получены только с использованием имени файла, а не фактического содержания документа. Чтобы расширить полнотекстовый поиск для документов с изображениями и не оставить никаких важных знаний незамеченными, необходима функция OCR IFilter.
ABBYY Recognition Server с компонентом OCR IFilter является абсолютно правильным решением: он «разблокирует» содержимое графических документов с помощью OCR и делает его доступным для индексации SharePoint Server и Microsoft Search. С ABBYY Recognition Server IFilter поиск документов становится действительно всеобъемлющим.
Следующая статья также может быть вам интересна: Распознавание всех PDF-файлов в библиотеке документов SharePoint с использованием PowerShell и Solid PDF Tools (я знаю, что здесь упоминается SharePoint, но нет никаких причин, по которым вы не можете запускать код PowerShell в ваша локальная машина).