Я использую утилиту CLI под названием tesseract-ocr. Использование tesseract-ocr в cmd заключается в следующем: tesseract.exe imagename outputbase [options...] [configfile...] В моем случае я набираю : tesseract photo0043.jpg photo0043.txt -l Cyrillic Утилита возьмет файл с именем photo0043.jpg и выведет свое задание в файл с именем photo0043.txt Как создать пакет для запуска утилиты по всему каталогу рекурсивно?
1
1 ответ
1
Используйте файл .bat с командой FOR /R для циклического перебора файлов и рекурсии по подпапкам.
Что-то вроде:
@echo off
Setlocal enabledelayedexpansion
For /R C:\path\to\folder %%a in (*.jpg) Do (
Set filename=%%~na
tesseract "%%a" !filename!.txt -l Cyrillic
)
Предупреждение: я не проверял этот скрипт. Это требует некоторой настройки, если у вас есть файлы .jpg в подпапках указанной папки.
