Я хочу быть в состоянии найти текст на следующем удивительном изображении и где текст находится в нем. Это не первый раз, когда я сталкиваюсь с такой проблемой, и, вероятно, время от времени у многих людей возникают подобные вопросы. Я думаю, что это хороший пример общего вопроса.
Есть много способов (1, 2, 3, 4 ...), чтобы добиться этого индивидуально, но есть ли какой-нибудь OCR , способный автоматически преобразовать это в текстовый PDF? Или любой другой формат для этого материала. Я цитирую PDF только потому, что это формат, созданный для обработки именно такого рода вещей.
Похоже, Cuneiform был бы идеальным инструментом, чтобы сделать это вручную, но я не смог скомпилировать его на Mac и не стал бы делать это для этого экземпляра, но держу пари, что какой-то неослабный стажер мог бы использовать его для дополнения OCR, что никогда не быть в состоянии идентифицировать изображения в этом.
Вот уменьшенный образец изображения, чтобы мы могли лучше представить актуальность вопроса: