Я пытаюсь распознать случайные текстовые строки из простых капч, таких как этот ,

Команда

tesseract -c page_separator="" gahap.png -

будет ошибочно выводить

283surn

кроме как на демонстрационной странице здесь, где результат ocr является правильным:

283swrn

Почему символ w сначала неправильно обрабатывается?

Tesseract 4.0.0 x64 для Windows используется:

  • tesseract v4.0.0.20181030
  • leptonica-1.76.0
  • libgif 5.1.4
  • libjpeg 8d (libjpeg-turbo 1.5.3)
  • libpng 1.6.34
  • libtiff 4.0.9
  • zlib 1.2.11
  • libwebp 0.6.1
  • libopenjp2 2.2.0

0