Я пытаюсь распознать случайные текстовые строки из простых капч, таких как ,
Команда
tesseract -c page_separator="" gahap.png -
будет ошибочно выводить
283surn
кроме как на демонстрационной странице здесь, где результат ocr является правильным:
283swrn
Почему символ w сначала неправильно обрабатывается?
Tesseract 4.0.0 x64 для Windows используется:
- tesseract v4.0.0.20181030
- leptonica-1.76.0
- libgif 5.1.4
- libjpeg 8d (libjpeg-turbo 1.5.3)
- libpng 1.6.34
- libtiff 4.0.9
- zlib 1.2.11
- libwebp 0.6.1
- libopenjp2 2.2.0