1

Могу ли я автоматически повернуть изображение, содержащее в основном текст? Может быть, через OCR? Алгоритм или что-то еще нужно сканировать изображение и решить, нужно ли повернуть его на 90 °, 180 ° или 270 °

Я хочу включить эту функцию в существующий сценарий PowerShell, поэтому использование командной строки обязательно.

Я открыт для решений ImageMagick

пример


нажмите, чтобы увеличить

Я уже прочитал следующие вопросы. Но они вращают фотографии.
и я только пытаюсь вращать чистые текстовые сканы, у которых нет метаданных EXIF.

3 ответа3

1

Я в настоящее время сделать это с помощью тессеракта с помощью переключателей «-psm 0» , который будет определять ориентацию изображения.

Образец вывода:

Tesseract Open Source OCR Engine v3.04.00 with Leptonica
Orientation: 3
Orientation in degrees: 90
Orientation confidence: 3.94
Script: 1
Script confidence: 13.81

Затем я запускаю ImageMagick, чтобы повернуть изображение в правильную ориентацию. Это работает для большинства изображений, за исключением рукописных документов и фотографий.

Немного клёвый, но это намного быстрее, чем запуск OCR четыре раза.

0

Вы хотите convert ImageMagick . Просто беги

convert -rotate 90 image.png

и он будет повернут на 90 градусов и сохранен обратно под тем же именем файла.

0

Не самый элегантный способ, но вы можете попытаться использовать оптическое распознавание текста во всех четырех направлениях, и в зависимости от того, какая из них имеет наименьшее количество толку, правильная. Я сделал быстрый поиск и нашел несколько ссылок, в которых обсуждается использование такой техники, например:

Второй этап коррекции документа - контекстный автоповорот. Используя OCR для чтения всей страницы в нескольких ориентациях, программное обеспечение может определить, в какой ориентации качество считывания является лучшим. Это наиболее точный способ поворота документа. Документы с небольшим количеством текста или текста под разными углами являются единственными рискованными документами. В этих случаях программное обеспечение выбирает ориентацию наиболее удобочитаемого текста.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .