Я использую утилиту CLI под названием tesseract-ocr. Использование tesseract-ocr в cmd заключается в следующем: tesseract.exe imagename outputbase [options...] [configfile...]
В моем случае я набираю : tesseract photo0043.jpg photo0043.txt -l Cyrillic
Утилита возьмет файл с именем photo0043.jpg
и выведет свое задание в файл с именем photo0043.txt
Как создать пакет для запуска утилиты по всему каталогу рекурсивно?
1
1 ответ
1
Используйте файл .bat
с командой FOR /R для циклического перебора файлов и рекурсии по подпапкам.
Что-то вроде:
@echo off
Setlocal enabledelayedexpansion
For /R C:\path\to\folder %%a in (*.jpg) Do (
Set filename=%%~na
tesseract "%%a" !filename!.txt -l Cyrillic
)
Предупреждение: я не проверял этот скрипт. Это требует некоторой настройки, если у вас есть файлы .jpg
в подпапках указанной папки.