Это графическое изображение, требующее громоздкого распознавания текста, которого нет у большинства ботов (очевидно)? Несмотря на это, это фиксированная графика, и на самом деле она не требует OCR, просто сопоставляя шаблон с библиотекой из одного элемента. Я просто не понимаю, как это создает непреодолимое препятствие, чтобы расстроить ботов.
2 ответа
Капча контролирует поведение мыши. В то время как бот легко нажимает на кнопку в форме, трудно имитировать беспорядочное движение мыши, перемещаемой человеком.
Тем не менее, это не невозможно: https://www.youtube.com/watch?v=fsF7enQY8uI
Текст в капче не был распознан OCR. OCR использовал стандартные правила распознавания текста.
Подходящий текст, как правило, искажается, а не проходит параллельно по прямым линиям; до горизонта и содержат случайный мусор, который OCR не может обработать.
то есть не соответствуют обычным правилам того, как должен выглядеть текст.
С распространением глубокого обучения становится только вопросом времени, когда капча не сработает ..
Существует много разных капч, некоторые требуют выбора нескольких графических изображений, имеющих тему (например, которые являются частями знака, которые впоследствии могут быть уточнены и затем добавлены в метод библиотеки ниже после того, как весь знак собран и текстовая графика извлеченный тем же методом), который компьютер не сможет распознать. С этим типом вас всегда просят идентифицировать известный сценарий и обычно неизвестного для добавления в библиотеку известных, как только достаточно идентичных ответов получено.
Наиболее распространенное использование изображений двумя способами:
1
Единственное случайно искаженное изображение, сгенерированное из слова, затем добавлено лишнее барахло, чтобы запутать распознавание Как "солить" список паролей, добавив "случайное" нежелательное слово, чтобы остановить радужную атаку.
2
Другая форма - это использование фотографий (обычно слов) чего-то, что люди должны были решить, что это такое, потому что изображение слишком сложное, чтобы автоматически его распознавать. Обычно это вне параметров компьютерного программирования того, что определяет текст (или знак, или что-то еще) и часто окружено случайной средой.
Для этого требуется большая библиотека фотографий с известным "текстом" или другими параметрами, например, которые являются частью знака и т.д.
Примечание:
Библиотека для второго метода увеличена за счет предоставления 2 изображений, которые пользователи пытаются правильно идентифицировать.
1 изображение является известным, а другое неизвестным.
Правильное решение известных доказывает, что вы не робот.
Достаточно людей, сопоставляющих / отвечающих на неизвестное с одним и тем же ответом, означают, что один из них теперь известен и может быть добавлен в известную библиотеку.
Так Google Maps определяет, что на самом деле являются знаками названий улиц / мест (а затем и текстом, который они содержат), и тексты проекта Гутенберга, которые не удалось распознать, были исправлены.