Обработайте ваше изображение до порогового цвета фона. Переключите цвет текста на черный (для лучшего распознавания. После того, как вы установили пороговое значение фона, изменение значений цвета должно быть довольно простым). Превратите ваше изображение в оттенки серого. Затем конвертируйте в формат .tif
.
Теперь у вас есть шанс обработать это изображение (супер-пользователь не позволяет мне публиковать изображения, поэтому я связываю их):
Обработанное изображение
Теперь запустите следующую команду:
tesseract test.tif test_output -psm 7
и результат был:
Tist
Что очень хорошо, учитывая, что я не использовал никаких дополнительных данных о тренировках, кроме стандартного англ.
Скриншот результата