Есть ли OCR-библиотека /cliapp, которая позволяет мне делать что-то вроде этого:
# ./ocrapp -input file.pdf -posx 3.6cm -posy 7.8cm -width 10cm -height 1.5cm -output rawdata.txt
Я пытаюсь автоматизировать считывание идентификационных номеров клиентов, сумм и т.д. Из отсканированных счетов и счетов. Я ищу библиотеку или cli-приложение, потому что хочу создать из него свою собственную систему управления документами;) (платформа не важна, только не только для osx).
Типичный норвежский счет выглядит следующим образом: http://www.fakturo.no/img/uploads/WindowsLiveWriterHvordansenderderefakturaenppapir_1001Bfakturaeksempel_uten_logo_thumb_1.gif
Информация, которую мне нужно извлечь, находится внизу. (KID, Beløp и Kontonummer)
Какие-нибудь советы?