Я пытаюсь установить Tesseract OCR на OSX 10.6 ...

Я дошел до установки leptonic (скачав src и установив с помощью ./configure; make; sudo make install), казалось бы, без проблем - но я не знаю, как это проверить.

Я также установил Tesseract OCR 3 (из Google Code с ./runautoconf; ./configure; make; sudo make install) также, казалось бы, без проблем - но опять же я не знаю, как это проверить.

Когда я запускаю tesseract input.jpg . Я получаю ошибку ...

 bash-3.2$ tesseract ~/Desktop/DCIM/101_FUJI/DSCF1043.JPG . 
 Tesseract Open Source OCR Engine with Leptonica
 Error in pixReadStreamJpeg: function not present
 Error in pixReadStream: jpeg: no pix returned
 Error in pixRead: pix not read 
 Error in fopenReadStream: file not found 
 Error in pixRead: image file not found
 Image file ######
 Exif cannot be read! 

Подобная ошибка, если я использую TIFF файл в качестве входных данных.

Я думаю, что мне нужны некоторые библиотеки - инструкции для Ubuntu говорят, чтобы установить libjpeg12-dev и т.д ...

У кого-нибудь есть детали как установить tesseract на OSX?

3 ответа3

2

Установите macports: см. Http://www.macports.org/ для загрузки и инструкции по установке.

Обновление дерева портов:sudo port selfupdate

Установить тессеракт:sudo port install tesseract

У порта tesseract, по-видимому, нет варианта, поддерживающего jpeg, поэтому вам необходимо установить конвертер графических файлов и пакет для настройки изображения (яркости, контрастности и резкости):sudo port install imagemagick

Конвертируйте ваш jpeg в формат tiff, затем выполните OCR для него с помощью tesseract: convert input.jpg input.tiff ; tesseract input.tiff ocr-text-ouput -l eng ; rm input.tiff

Полученный текст должен быть найден в файле ocr-text-ouput.txt.

ps, вы можете немного откорректировать изображение для потенциально лучшего распознавания текста, используя такие параметры конвертирования :convert -sharpen 1 -brightness-contrast 3X30 input.jpg input.tiff

2

Я использую homebrew на osx 10.7, и это было так же просто, как запуск этих двух команд:

brew install leptonica
brew install tesseract

На нем установлены leptonica 1.68 и tesseract 3.01 с их зависимостями

0

Работа одной команды решение для меня:

sudo brew install tesseract

Это установить тессеракт и все зависимости. sudo необходим для некоторых целей, таких как связывание пакетов jpeg.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .