3

Я посмотрел на MyScript, но программа не принимает формат PDF.

У меня есть несколько документов (PDF), которые представляют собой сканы рукописного текста.

Мне нужна программа, которая может отсканировать PDF, использовать OCR и преобразовать его в текст.

Что-нибудь подобное существует?

3 ответа3

6

На самом деле, нет. Распознавание рукописного ввода - сложная проблема, и неспособность взломать его была одной из ключевых причин провала Apple Newton. Palm должен был создать псевдоскрипт под названием «Граффити», чтобы распознать его, и это было сделано по одной букве за раз на специальной клавиатуре, а не написано как скрипт.

Вы можете попробовать программу OCR - она может работать, но в лучшем случае вам, вероятно, придется потратить немало времени на исправление ошибок, допущенных программой.

В качестве альтернативы можно попробовать что-то вроде rentacoder.com и посмотреть, сможете ли вы заплатить кому-нибудь за ввод текста вручную. В развивающихся странах довольно много людей, которые работают через это, поэтому, возможно, можно будет сделать это довольно дешево. В качестве альтернативы, может также быть кто-то, у кого есть приложение Mechanical Turk, которое делает это.

0

Если документы не очень длинные, лучше сделать это вручную. Программа распознавания текста хороша только для печатных слов, не говоря уже о рукописных словах.

Если вы еще не написали текст, вы можете использовать определенные программные решения на основе пера, такие как ritePen. Здесь дело не в этом.

0

Типовое программное обеспечение, которое вы ищете, называется ICR (Intellgent Character Recognition), а не OCR. Тем не менее, это действительно очень эффективно только для печатного текста и в основном для тех форм, где вы заполняете поля по одной букве в каждом блоке.

Как и все остальное, сценарий не так хорош.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .