Применение метаданных к файлам на основе распознавания их содержимого

Question

По сути, я ищу инструмент (Windows/Mac), который позволит мне следующий рабочий процесс:

Сканирование ВСЕХ моих документов в папку (200-300 отсканированных изображений)
запустить инструмент, который будет просматривать все файлы и запускать на них OCR
на основе OCR метаданные применяются к каждому файлу.
Затем я читаю метаданные и, соответственно, классифицирую файлы через пакетный процесс.

Несмотря на то, что в SU & SE есть довольно много предложений по выполнению простого распознавания текста, я не смог найти решение, которое, по сути, позволяло бы мне выполнять программные функции, основанные на данных из документов, полученных с помощью распознавания текста.

Шаблон документа является стандартным, поэтому мы знаем, какой файл ожидать. Мы просто хотим просканировать всю связку, а затем запустить бэкэнд-процесс, который аккуратно классифицирует / загружает в соответствующие папки. Наличие OCR дает мне возможность искать в файле, в то время как я открываю его в такой программе, как Acrobat Reader / Preview. Но я хочу запустить эту логику категоризации из скрипта batch / shell / apple. Такие вещи, как префикс номера документа к имени файла и т.д.

score 0 · Answer 1 · 2011-03-09T19:38:42

То, что вы описываете, кажется уникальным сценарием использования. Я не верю, что есть решения, которые работают так, как вы описываете из коробки. Если это некоммерческий / учебный проект, у вас нет большого выбора, особенно для окон. Просто Google для Tesseract посмотреть, что вы можете сделать.

Если у вас есть бюджет, у вас есть несколько вариантов. Не очень понятно, нужно ли вам готовое решение или SDK, я предполагаю, что вам нужен первый, так почему бы вам не взглянуть на сервер распознавания, это серверное решение для распознавания текста, предназначенное для среднего и среднего уровня. массовая обработка документов в крупных отделах и на предприятиях. Он может быть развернут как отдельная программа или интегрирован со сторонней системой, такой как DMS, RMS и система электронного архивирования.

Я работаю @ ABBYY и могу предоставить вам больше информации, если это необходимо. Надеюсь, поможет!

Сейчас выбран русский

Применение метаданных к файлам на основе распознавания их содержимого

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками windows macos metadata ocr scanning.

Применение метаданных к файлам на основе распознавания их содержимого

1 ответ1

Всё ещё ищете ответ? Посмотрите другие вопросы с метками windows macos metadata ocr scanning.

Похожие