2

Таким образом, у меня есть журнал (с несколькими страницами) в руках, и я хочу иметь получившийся файл, который сохранит всю диаграмму и изображение в целости, но все же позволит мне искать / находить и выбирать текст в нем.

Этот PDF - небольшой пример результата, который я хочу получить. Даже название можно выбрать! Похоже, что он создан для PDF, а не отсканирован, но вы поняли идею.

Файл результата не обязательно должен быть в формате PDF, хотя я сомневаюсь, что для этого есть лучший формат. Документ должен быть файлом (для чтения в автономном режиме) и максимально совместимым с платформой.

Есть ли (простой) решение этой проблемы ? Если нет, то как я могу хотя бы вручную выполнить распознавание текста?

1 ответ1

2

Редактирование: @Cawas сообщает, что программа просмотра PDF-Exchange успешно выполнила задачу, выполнив оптическое распознавание PDF и сделав его доступным для поиска.

Для перечисленных потребностей PDF, вероятно, является самым простым и наиболее кроссплатформенным. Другой, немного более неясный вариант - это формат DJVU, но в отличие от PDF, их поддержка значительно ниже, особенно в плане распознавания текста.

Существует ряд бесплатных программ оптического распознавания символов , которые доступны и просты в использовании. Однако, если вы ищете очень простое решение, для любого документа PDF, загруженного на Google Диск, автоматически будет выполнено распознавание текста. Есть ограничения на это, но это должно работать для коротких документов.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .