Что такое капча? В чем разница между ReCaptcha v1, v2 и v3?


Капчи есть везде, от веб-сайтов электронной коммерции до порталов бронирования билетов. Бросая вызов вам доказать, что вы не робот на основе различных тестов, Captcha помогли контролировать спам-трафик в Интернете.

Captcha (или полностью автоматизированный общедоступный тест Тьюринга, позволяющий отличить компьютеры от людей) - это тест, предназначенный для различения людей и машин. Вначале Captcha использовала случайно сгенерированный текст в виде искаженного изображения, чтобы различать людей и машин. В то время это была серьезная проблема для компьютеров, которая не позволяла ботам оставлять спам-комментарии на веб-сайтах или создавать спам-адреса электронной почты.

Благодаря эффективности теста популярность Captcha выросла, и миллионы людей во всем мире решали Captcha для создания электронных писем или доступа к необходимому контенту. По словам доктора фон Ана, в 2006 году люди ежедневно решали 200 миллионов капч.

Recaptcha: Captcha для цифровой эпохи

Хотя Captcha помогала Интернету предотвращать атаки ботов, человеческие усилия по решению этих головоломок не использовались эффективно. Так родилась рекапча. Вместо использования случайно сгенерированных слов Рекапча использовал слова из старых книг, которые переводились в цифровую форму и не могли быть поняты компьютерами.

Recaptcha работала, показывая своим пользователям пару слов, оба из которых были из книги, оцифрованной. Одно из показанных пользователю слов может быть понято компьютером с помощью программного обеспечения оптического распознавания символов (OCR). Напротив, другое слово не может быть идентифицировано с помощью того же самого. Слово, которое может быть идентифицировано с помощью OCR, известно как контрольное слово и используется для проверки правильности ответа на неопознанное слово и проверки того, что человек является человеком.

Компьютер предполагает, что если пользователь правильно определяет контрольное слово, то и другое слово также является правильным и что пользователь - человек. После этого компьютер сохраняет ответ на неизвестное слово в базе данных. Эта база данных может иметь разные результаты и известна как пул проверки. Неизвестное слово с разными контрольными словами показывается разным пользователям, и результаты сравниваются с ответами в пуле проверки. Слово с наибольшим количеством совпадений помещается в проверенный пул, а слово, которое не удалось идентифицировать с помощью OCR, теперь проверяется с помощью Recaptcha.

Это было отличным нововведением, и в 2009 году Google купил Recaptcha. Он использовал Recaptcha для архивирования книг в архивах книг Google. Она также использовался Google для улучшения просмотра улиц Google, помогая картам Google эффективно отображать адреса в Картах Google.

Все это было здорово, но с развитием искусственного интеллекта и алгоритмов глубокого обучения компьютеры догоняли людей, и они могли разгадывать капчи с большой эффективностью. Фактически, данные из Captcha использовались для обучения сверхточных нейронных сетей с точностью 99,8%. Это было проблемой, потому что компьютеры могли решать капчи с текстовыми изображениями, и требовалось что-то новое.

Recaptcha V2: проще для людей, но не для ботов

Глядя на недостатки Recaptcha, Google придумал Nocaptcha Recaptcha или Recaptcha версии 2. Эта версия Recaptcha не просила пользователей вводить текст, который они видят на искаженных изображениях. Вместо этого все, что нужно было сделать пользователю, - это установить флажок.

Кажется странным, правда? Раньше вам приходилось идентифицировать текст с линиями и плохим фоном, а теперь все, что вам нужно сделать, это установить флажок, и вы не будете считаться роботом. Это связано с тем, что, когда вы устанавливаете флажок, Google использует предварительный анализ рисков на основе вашей активности в Интернете, чтобы определить, являетесь ли вы ботом или нет.

Recaptcha V2 также поставляется с невидимой версией, в которой пользователю не нужно устанавливать флажок, вместо этого скрипт Recaptcha запускается при нажатии кнопки на веб-сайте.

Если Google считает, что пользователь не является ботом, он перенаправляет пользователя на следующую страницу, в противном случае пользователю показывается проблема классификации изображений, которая очень сложна для ботов. Опять же, если пользователь решает проблему, он перенаправляется на следующую страницу.

Хотя Recaptcha V2 был лучше, чем Recaptcha, конечному пользователю это доставляло некоторые неудобства. Если по какой-то причине анализ рисков Google решил, что вы бот, вам нужно было найти светофор в наборе изображений или т.п.

Идеальна ли Recaptcha V3?

Recaptcha V3 - это новейшая версия Recaptcha, в которой пользователям не отображаются изображения или флажки. Фактически, эта версия Recaptcha полностью невидима и работает как сценарий в фоновом режиме веб-страницы в соответствии с потребностями веб-мастеров. Она может быть загружена вместе со страницей или при нажатии кнопки для входа в систему. Благодаря лучшему пользовательскому интерфейсу более 1,4 миллиона веб-сайтов используют Recaptcha версии 3.

Каждый раз, когда этот скрипт запускается, он генерирует оценку для пользователя на веб-сайте веб-мастеров на основе поведения каждого пользователя. Этот показатель варьируется от 0,0 до 1,0, причем верхний предел диапазона (1.0) соответствует активности человека, а нижний предел (0,0) - бот.

Увидев действие на странице, веб-мастер может решить, что нужно сделать с этим действием. Веб-мастер может запросить у пользователя двухфакторную проверку или любую другую форму идентификации, чтобы пропустить суеверные действия или полностью заблокировать такую ​​активность.

Для создания этой оценки Google использует адаптивный анализ рисков и, благодаря адаптивному характеру алгоритма, изучает, как люди взаимодействуют с конкретным веб-сайтом, и соответственно присваивает оценки. Из-за этого ботам сложно имитировать людей.

При этом Recaptcha v3 небезупречна, и ее можно обойти с помощью обучения.

Google рекомендует веб-мастерам встраивать скрипт Recaptcha V3 на несколько страниц, чтобы Google мог лучше анализировать трафик на веб-сайте.

Используя демонстрационный веб-сайт, на котором запущен скрипт Recaptcha, вы можете увидеть свои оценки, которые генерирует скрипт. Если вы откроете сайт в обычном веб-браузере, в который вошла ваша учетная запись Google, вы получите высокий балл 0,9. С другой стороны, если вы используете VPN вместе с браузером, в котором нет вашей учетной записи Google, ваша оценка может снизиться до 0,3. Это показывает, что алгоритм может быть смещен в сторону пользователей, которые используют VPN или блокировщики рекламы для повышения конфиденциальности, давая им более низкий балл.

Google сообщил Fastcompany, что сценарий также отправляет «информацию об оборудовании и программном обеспечении, включая данные об устройствах и приложениях, обратно в Google для анализа, и что служба используется только для борьбы со спамом и злоупотреблениями».


Хотя Google утверждает, что данные, собранные с помощью Recaptcha, не используются для рекламы, он по-прежнему собирает данные от своих пользователей с помощью скриптов, работающих на заднем плане веб-сайтов.

Глядя на Recaptcha V3, можно сказать, что это палка о двух концах. Google много работал над улучшением обнаружения ботов в Интернете, создавая беспроблемный опыт для пользователей, но он собирает данные и вторгается в конфиденциальность пользователей, чтобы обеспечить такой опыт.
Что такое капча? В чем разница между ReCaptcha v1, v2 и v3? Что такое капча? В чем разница между ReCaptcha v1, v2 и v3? Reviewed by Admin on августа 13, 2020 Rating: 5

Комментариев нет: