Мне нужно отсканировать сотни страниц с номерами, написанными на них в правом нижнем углу. После сканирования - мне нужно программное обеспечение OCR, чтобы распознать число, написанное в правом нижнем углу каждой страницы и суммировать их в конце.
До сих пор я мог сканировать страницы и с помощью OCR в Adobe Acrobat, я мог идентифицировать отмеченные вручную цифры на страницах. Существует ли механизм или любое другое программное обеспечение для распознавания текста, которое передало бы значения в такие программы, как MS Excel.
Я пробовал различные программы OCR, такие как Neurograph (opensource) и пробную версию других программ OCR, но не мог связать их напрямую с отсканированными файлами. Они имеют возможность экспортировать значения OCR в Excel, но напрямую не подключаются к принтеру.
Также эти программы работают в пакетном режиме. Можно ли сделать обновления непрерывным процессом?
Какие-либо предложения?
Настройка системы:
Предполагаемой системой будет Raspberry PI, подключенный к сканеру. Со сканера вход будет передан в PI, и, в свою очередь, PI вычислит сумму и обновит базу данных с суммой.
1
1 ответ
0
Если вы собираетесь настраивать аппаратное обеспечение с помощью raspberry pi, вы также можете настроить свое программное обеспечение. Самым популярным и широко используемым пакетом OCR является Tesseract OCR
работающий на OpenCV
, который является Open Source и кроссплатформенным. Вместе они позволят вам применять фильтры, делать OCR и, возможно, другие приятные вещи, которые вы можете захотеть.
Я бы порекомендовал вам посмотреть некоторые видео, что делает его на удивление легко настраиваемым.