Я нахожусь на проекте, который обрабатывает сотни форм. Формы имеют согласованные форматы, но заполняются вручную разными людьми. Мне нужен способ быстро обработать все эти данные в электронном виде.
Распознавание распознавания для напечатанных документов кажется зрелым, но для рукописного ввода очень не хватает.
Для этого рассмотрим форму с несколькими полями, структурированными так:
Field1: Значение1
Например:
Name: John
где Name
- это поле, а John
- это значение.
Учитывая, что формы структурированы и типизированы, OCR должен иметь возможность распознавать / интерпретировать поля. Тем не менее, значения полей написаны от руки, и OCR будет работать очень плохо для них.
Итак, есть ли способ, где поля будут распознаны на изображении, а затем будет возвращен фрагмент изображения значения?