22

Из того, что я понимаю, капчи - это текст, искаженный применением фильтров, шумов и других ошибочных алгоритмов. Поэтому, чтобы выяснить, является ли способность человека к чтению способностью человека, вы сравниваете то, что они ответили, с тем, что является известным ответом.

Теперь, читая о ReCaptcha, он говорит, что слова, которые отображаются, это те, которые не могут быть переведены OCR. Кроме того, recaptcha используется для перевода этих изображений. Как он может определить, действительно ли вы правы в своем чтении или просто придумываете что-то?

Если бы он знал, что он сказал, он не был бы использован в резюме в качестве материала для перевода. Если он не знает, что говорит текст, то как он проверяет ваш ответ?

Я предполагаю, что это, вероятно, некоторый вероятностный анализ с огромными размерами выборки, прежде чем он помечает что-либо как переведенное.

Кто-нибудь знает, где ответ на это?

2 ответа2

33

Страницы книги в основном фотографически сканируются, а затем преобразуются в текст с помощью "Оптического распознавания символов" (OCR) и передаются в Интернет в виде изображения с одним словом, известным компьютерной программе за reCAPTCHA, и одним словом, которое не является еще известно.

Затем пользователь вводит оба слова, и, если они решают то, для которого известен ответ, система предполагает, что их ответ верен для нового. Затем система передает новое изображение ряду других людей, чтобы с большей уверенностью определить, был ли первоначальный ответ правильным. Следовательно, система - это самосовершенствующийся сервис, который со временем улучшается.

http://www.google.com/recaptcha/learnmore

22

Вот почему в reCaptcha вы вводите два слова. Одно из слов уже известно, а одно из слов не известно. Пройдите или не сдадите код проверки, зависит только от того, как вы ответите за известное слово. Ваш ответ для другого (неизвестного) слова будет использоваться вместе с другими ответами на то же слово, чтобы превратить его в известное слово.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .