К сожалению, это не CSI, мы собрали 20 000 изображений для номерных знаков; нам было интересно, есть ли полу-надежный способ считывания этих номерных знаков с помощью OCR. изображения, особенно ночные, очень низкого качества.
3 ответа
Tesseract - лучшее (бесплатное) программное обеспечение для распознавания текста, которое я использовал. Я использовал его для отсканированных бумажных документов, но он также может работать для номерных знаков.
Вам нужно будет конвертировать все изображения в TIFF, если они еще не в этом формате.
Большинство готовых пакетов оптического распознавания текста предназначены для распознавания текста из отсканированных документов или аналогичных документов и ожидают разумного выравнивания текста, угла обзора и настроек контрастности.
Вероятно, вам потребуется выполнить предварительную обработку ваших изображений, чтобы (а) обнаружить и обрезать область изображения, содержащую номерной знак, (б) выполнить коррекцию перспективы и при необходимости (в) улучшить контраст и шум для ночных снимков.
Вы могли бы получить лучшие результаты с изображениями, если предварительно обработаете их, чтобы удалить шум, используя что-то вроде этого инструмента:
Я нашел ссылки на плагины с открытым исходным кодом для популярного инструмента GIMP, если коммерческое решение для вас неприемлемо, но я никогда лично не был большим поклонником этого инструмента (GIMP).