Зачем, для чего и кто создал Google-капчи ?!

Что такое капча ?

Ка́пча (от CAPTCHA — англ. Completely  Automated Public Turingtesttotel Computersand Humans Apart — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которая с лёгкостью решается человеком, но крайне сложна и трудоёмка для компьютера. По состоянию на 2013 год, каждый день пользователями по всей планете вводится примерно 320 миллионов «капчей»

Полезность капчи против спама !

Капча сама по себе не может остановить спамеров. С другой стороны, этот метод защиты может создавать большие неудобства людям.  К тому же капчей злоупотребляют, например, файловые хостинги, что несёт в массы сервисы по распознаванию капчи и делает её ещё более неэффективной.

Украинцы создали уникальный сервис по разгадыванию Google-капчи !

Разработчики из Performance-marketing агентства Promo.ua анонсировали запуск сервиса, который автоматизирует прохождение графической капчи и облегчит задачу SEO-специалистам, веб мастерам и всем, кто занимается пирсингом.  

DeepCaptcha — возможность обойти защиту Google путем распознавания визуальных ключей, при помощи которых поисковая система «отсеивает» ботов и роботов. Сервис работает на базе обучаемых нейросетей, ориентированных на определенный тип изображений. Вместо человека все делает машина — быстро, качественно и точно. В этой статье мы раскроем суть нового продукта и поговорим о его фишках.

Была ли жизнь до DeepCaptcha?

Проанализируем работу SEO-специалиста: при проверке 10 000 страниц выскакивает до 1000 капч. На расшифровку каждой из них уходит до 30 секунд. Таким образом, более 8 часов тратится впустую — просто на то, чтобы доказать машине, что ты не робот.

До сегодняшнего дня при необходимости парсинга в «промышленных» масштабах вопрос с капчей решался при помощи специальных сервисов.  Стандартный алгоритм: пользователь загружает капчу на сервер подрядчика, после чего к работе подключается сотрудник (чаще всего — жители стран третьего мира), который вручную расшифровывает код и отправляет ответ обратно на сервер. Оттуда его и забирает конечный потребитель. С одной стороны, использование дешевой рабочей силы дает возможность снизить стоимость услуги. С другой — процесс продвигается с задержками, так как скорость работы зависит от количества подключенных онлайн-сотрудников. При этом недобросовестные работники могут саботировать задачу или допускать ошибки, за что сразу же отправляются в бан

Как это работает ?

Выяснив ситуацию на рынке, команда специалистов Big Data SEO из агентства Promo.ua решила создать абсолютно новый продукт, который автоматизирует, улучшит качество, удешевит и ускорит процесс разгадывания капчи.

 В течение полугода разработчики парсили картинки, распределяли их по категориям и обучали нейронную сеть распознавать каждый тип иллюстрации.

 Результатом стал «думающий» автоматизированный сервис, который моментально определяет соответствие картинки (светофора, гидранта, витрины, дорожного знака) и предлагаемого запроса, после чего кликает на нужное изображение. Больше нет лишнего звена в лице наемного работника. Таким образом, потребность использовать для решения задачи ручной труд отпадает.

 Процесс происходит в несколько этапов:

•    клиент отправляет на сервер ссылку на защищенный капчей сайт и Site Key;

• используя эти параметры, DeepCaptcha заходит на сайт и расшифровывает капчу при помощи искусственных нейросетей;

•    готовое решение отправляется на парсер клиента.

Погрешность такого подхода составляет 2%: это происходит из-за того, что в некоторых случаях поисковик может идентифицировать бота и продублировать защиту. В целом, автоматизация помогает удешевить прохождение своеобразного «теста Тьюринга», исключить влияние человеческого фактора и свести к нулю количество забаненных IP.

То, что нужно вашему бизнесу !

DeepCaptcha подходит для сервисов автоматизации сбора и анализа данных, также разработка будет полезна маркетинговым агентствам, вебмастерам, SEO-специалистам и всем пользователям программ, применяемых для парсинга (съемщики позиций, кластеризаторы и др.). Главное условие — это должны быть сервисы, которые можно подключить по API.

Часть контента использовалась с источника  — Корреспондент.net.

Freelancehunt