2

У меня есть 20 страниц экспериментальных данных измерений, которые мне нужно оцифровать. Результаты представлены в табличной форме, отсканированы с разрешением 600 точек на дюйм, и что касается сканирования, они получаются довольно чистыми и удобочитаемыми.

Вот пример того, как это выглядит:

... и мне нужно, чтобы это закончилось к воскресенью (<-o) <- смайлик в состоянии паники

(тогда почему ты не начал раньше?)... да, да ... Я знаю ... но это случилось поздно, и я не думал, что мне понадобятся и эти данные.

Итак, я ищу рекомендации. У меня нет большого опыта работы с программами OCR, за исключением сканирования одной или двух страниц чистого текста, но я просто не хочу тестировать каждую программу OCR. Так что это не "назови свой любимый OCR".

То, что я ищу, это совет от кого-то, кто сделал что-то подобное, и его / ее опыт о том, что было бы лучшим способом предпринять.

Мне нужны данные в виде текста, но так как их нужно будет проверить (нарисовав их и просто наблюдая, "выпрыгивают" ли некоторые точки), я, вероятно, сначала введу их в Excel.

1 ответ1

1

В прошлом я использовал страницы Omnipage и Finereader в ограниченной степени. По данным CNET:

«OmniPage Pro 12 Office улучшил перевод табличных данных, не только добавляя контент, но и воспроизводя правильные шрифты и форматирование. С длинными отрезками текста, он совершил удивительно мало ошибок распознавания - гораздо меньше, чем Abbyy FineReader ».

Обратите внимание, Omnipage сейчас в версии 17, поэтому я не знаю, какая из двух лучше, но я предполагаю, что Omnipage сделает то, что вам нужно.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .