Сервисы автоматического распознавания капчи (антикапчи)

Содержание:

RuCaptcha (Рукапча): стоимость, время, плюсы и минусы сервиса

RuCaptcha — антикапча-сервис, популярный на территории Российской Федерации, Украины и стран СНГ. Он заявляет быструю расшифровку не только капчи, но и зашифрованного текста с отсканированного документа или чека.

Характеристика Рукапчи:

Поддержка разных видов капчи.

Сервис распознаёт простые текстовые, графические ReCaptcha V2, KeyCaptcha, FunCaptcha, reCaptcha V3, GeeTest и другие новые системы капч, которые могут использовать площадки. Сервис периодически обновляют, так что новые капчи не станут препятствием. Ещё он распознаёт сканы и документы.

API.

Сервис можно интегрировать в любой инструмент благодаря API, так что процесс распознавания для клиента полностью автоматический.

Расшифровка от 18 рублей за тысячу капч.

Цена тысячи простых распознанных капч, которые используют большинство систем, стоит от 18 рублей. Лимит — 44 рубля, выше цена не поднимется.

За тысячу расшифровок более сложного вида капчи «ReCaptcha V2 images» нужно заплатить 50 рублей, а за самый сложный вид «ReCaptcha V2 token» — 160 рублей. При этом клиент платит только за те капчи, которые ему расшифровали, абонентской платы нет.

Точность распознавания — 99–100%.

В процессе расшифровки принимают участие тысячи фрилансеров, а если капча сложная, над ней работают несколько сотрудников: система сравнивает их ответы.

Сервис русскоязычный.

Все работники знают русский, поэтому с капчами, где используются буквы русского языка, проблем нет — они решаются также быстро.

Скорость распознавания — 9–30 секунд в зависимости от вида капчи.

Сложные большие капчи требуют до 30 секунд, но в целом скорость зависит от нагрузки на сервер. Если один работник не справляется с символами быстро, то переключает задачу на другого, поэтому работа не простаивает.

Статистика распознаваний и нагрузки на сервер.

В личном кабинете на сайте можно отслеживать общую статистику по разгадыванию капч с ценами.

В RuCaptcha регистрируются обычные пользователи для заработка на расшифровках, вебмастера, чтобы пользоваться решениями, и владельцы софта, интегрирующие сервис в свои программные продукты.

Для работы с сервисом нужно зарегистрироваться в проекте, а затем из личного кабинета пополнить счёт и получить ключ для установки API. Список программ, которые интегрированы с RuCaptcha, выложен на официальном сайте сервиса.

Как это работает?

Большая часть программ, которая сотрудничает с онлайн-сервисами (Вордстат, Гугл Аналитика и т. д.), требует постоянного ввода капчи. Таким онлайн-проектам не выгодно, чтобы с ними работали боты, поэтому они всеми силами пытаются с этим бороться.

Но как быть простым вебмастерам, которые решили собрать семантику или спарсить данные с сервисов аналитики? Делать вручную? Не очень разумное решение, тем более, что сейчас полным-полно программ для расшифровки капчи, причем бесплатных.

Капчу разгадывают реальные люди, получая за это вознаграждение. Они работают в специальном окне, скрипт которого перенаправляет капчу из вашей программы прямо к ним. При правильном вводе происходит автозаполнение. Ваше приложение работает без перебоев и вам больше не надо беспокоиться по этому поводу.

Сайты распознавания капчи предлагают своим работникам фиксированную ставку за капчу. Вам, как клиентам, нужно внести определенную сумму на баланс. Потихоньку она будет убывать.

С помощью специальных кодов или данных от аккаунта на таком сайте, вы сможете интегрировать нужное приложение с сервисом.

Сравнение производительности

Тестирую Рукапчу уже больше месяца и заметил, что капчи разгадываются быстрее, но как красиво замерить в работе с ежедневным софтом не придумал. Капчи идут неравномерно, нужно заморачиваться с логированием времени и ответов, отвлекаясь от основной работы.

Отговорок могу придумать массу, но на самом деле было просто лень.

Но как же без теста, верно? Набросал простой скрипт для работы с rucaptcha.com и anti-captcha.com, подготовил простейшую капчу, на русском. Вот такую:

Отправлю 5 раз эту капчу и посмотрю что будет. Замер делал примерно в 17:00-18:00 по Москве, во вторник. В настройках указал распознавание без учёта регистра, русский язык.

Скорость rucaptcha.com

Стоимость каждой капчи — 0,044₽.

  • 1 капча: 15 секунд;
  • 2 капча: 23 секунды;
  • 3 капча: 14 секунд;
  • 4 капча: 8 секунд;
  • 5 капча: 13 секунд.

Скорость anti-captcha.com

Стоимость каждой капчи — $0,0007, примерно 0,045₽.

  • 1 капча: 34 секунд;
  • 2 капча: 13 секунды;
  • 3 капча: 18 секунд;
  • 4 капча: 13 секунд;
  • 5 капча: 38 секунд.

Результат

Среднее время у rucaptcha.com — 14,6 секунд, у anti-captcha.com — 23,2 секунды. Почти 10 секунд разницы, сильно!

Да, такой отчёт дико репрезентативен. Идеально было бы погонять несколько сотен капч, разных, в разное время.

Но лень. Да и зачем, когда . Да, ты дочитал до самой приятной части статьи.

Регистрация на сервисе

  1. Для регистрации на сервисе антикапча перейдите на главную страницу сайта и нажмите на большую кнопку Регистрация.
  2. Для регистрации на сайте вам понадобится придумать логин, а также иметь действующий почтовый ящик.
  3. Напишите свой логин и емейл в специальных полях формы и нажмите на кнопку ниже для подтверждения своих данных.
  4. На следующем шаге сервисом будет предложено ввести captcha. Напишите символы с картинки в поле ниже и нажмите Подтвердить.
  5. В случае правильного введения капчи вы получите сообщение об успешном прохождении вами регистрации. Вам будет предложено заглянуть в почтовый ящик, указанный при регистрации для получения пароля.
  6. Скопируйте ваш пароль, перейдите слова на главную страницу сайта и авторизуйтесь используя его и указанный вами логин для регистрации.

Инструкция по работе с сервисами

После того, как вы выберете онлайн-сервис антикапчи, вам нужно будет как-то его использовать. Обычно в таких сервисах есть специальные ключи – их вы получаете в своем аккаунте, после чего вводите в специальное поле приложения. В рамках сегодняшнего материала я рассмотрю РуКапчу.

Переходим в раздел “API вебмастеру”, где видим примерно такую картину.

Здесь есть поле “captcha KEY” – оно-то нам и нужно. Копируем этот ключик и идем в настройки антикапчи нашей программы.

Ставим галочку “Использовать сервис антикапчи”, выбираем сервис из выпадающего списка и вставляем ключ. Готово! Теперь наше приложение будет автоматически “разгадывать” капчу при помощи соответствующего сервиса. Больше никаких действий от вас не требуется. Только своевременно пополняйте счет на сайте.

Как работает капча и за что платят деньги

Простой пример: на большинстве сайтов при регистрации просят ввести капчу. Это сделано для того, чтобы злоумышленники не могли различными автоматизированными программами создавать новых пользователей и рассылать спам.

Но также в интернете есть полезные инструменты, например, программа, позволяющая определить уникальность текста, которая с помощью специального скрипта анализирует тысячи запросов на совпадение текста по всему интернету. Из-за большого обращения этой программы к поисковым системам происходит автоблокировка капчей.

Те, кто делают такую проверку текста этой программой, могут решать вводить капчу самостоятельно вручную либо, чтобы не тратить время, поручить эту работу специальным платным сервисам для автоматического ввода капчи.

На этих сервисах работают обычные люди, которые разгадывают капчу за деньги. Получается так, что программа отправляет капчу на сервис, человек её разгадывает, отправляет обратно и анализ текста продолжается. Пользователь программы платит сервису, а сервис платит работникам за каждую решённую капчу.

Здесь совершенно нет никакого подвоха и развода.

Обычная графическая капча

Для обычный капч-картинок необходимо вызвать контекстное меню (кликнуть правой клавишей мышки) на картинке капчи и в меню выбрать «Отметить картинку как содержащую капчу» (1), или нажать комбинацию CTRL+SHIFT+3. На картинке должен появиться значок AntiCaptcha plugin, обозначающий, что все подобные картинки для данного сайта будут интерпретироваться как содержащие капчу.

Также необходимо вызвать контекстное меню на поле ввода ответа на капчу и выбрать в списке «Отметить поле получателем решения капчи» (2), или нажать комбинацию CTRL+SHIFT+3. Рядом с полем ввода тоже появится значок плагина.

Присутствует функция автопоиска картинки с капчей при нажатии комбинации клавиш CTRL+SHIFT+6 на поле ввода капчи, аналогичная функционалу в WebVisum. После разгадывания капчи результат будет сразу помещен в поле ввода.

Автоматическое разгадывание начнется и будет проходить для всех новый страниц данного домена, содержащих указанные картинку и поле ввода. Чтобы впредь процесс разгадывания не повторялся достаточно кликнуть мышкой на один из значков плагина рядом с картинкой или рядом с полем ввода. При наведении на этот значок на нем появится буква X и при нажатии пометка удалится.

Интернет-маркетинг от GeekBrains

Что делать, если системные прерывания грузят процессор

Чаще всего, когда в диспетчере задач появляется неестественно высокая нагрузка на процессор, причиной является что-то из:

  • Неправильно работающее оборудование компьютера
  • Неправильная работа драйверов устройств

Почти всегда причины сводятся именно к этим пунктам, хотя взаимосвязь проблемы с устройствами компьютера или драйверами не всегда очевидна.

Прежде чем приступать к поиску конкретной причины, рекомендую, если это возможно, вспомнить, что выполнялось в Windows непосредственно перед появлением проблемы:

  • Например, если обновлялись драйверы, можно попробовать откатить их.
  • Если было установлено какое-то новое оборудование — убедиться в правильности подключения и работоспособности устройства.
  • Также, если ещё вчера проблемы не было, а с аппаратными изменениями связать проблему не получается, можно попробовать использовать точки восстановления Windows.

Поиск драйверов, вызывающих нагрузку от «Системные прерывания»

Как уже было отмечено, чаще всего дело в драйверах или устройствах. Можно попробовать обнаружить, какое из устройств вызывает проблему. Например, в этом может помочь бесплатная для бесплатного использования программа LatencyMon.

Скачайте и установите LatencyMon с официального сайта разработчика http://www.resplendence.com/downloads и запустите программу.
В меню программы нажмите кнопку «Play», перейдите на вкладку «Drivers» и отсортируйте список по колонке «DPC count»
Обратите внимание на то, какой драйвер имеет наибольшие значения DPC Count, если это драйвер какого-то внутреннего или внешнего устройства, с большой вероятностью, причина именно в работе этого драйвера или самого устройства (на скриншоте — вид на «здоровой» системе, т.е

более высокие количества DPC для приведенных на скриншоте модулей — норма).
В диспетчере устройств попробуйте отключить устройства, драйверы которых вызывают наибольшую нагрузку согласно LatencyMon, а затем проверить, была ли решена проблема
Важно: не отключайте системные устройства, а также находящиеся в разделах «Процессоры» и «Компьютер». Также не стоит отключать видеоадаптер и устройства ввода

Если отключение устройства вернуло нагрузку, вызываемую системными прерываниями в норму, удостоверьтесь в работоспособности устройства, попробуйте обновить или откатить драйвер, в идеале — с официального сайта производителя оборудования.

Обычно причина кроется в драйверах сетевых и Wi-Fi адаптеров, звуковых карт, других карт обработки видео или аудио-сигнала.

Проблемы с работой USB устройств и контроллеров

Также частой причиной высокой нагрузки на процессор со стороны системных прерываний является неправильная работа или неисправность внешних устройств, подключенных по USB, самих разъемов или повреждение кабелей. В этом случае в LatencyMon вы навряд ли увидите что-то необычное.

При подозрениях на то, что причина в этом, можно было бы рекомендовать поочередно отключать все USB-контроллеры в диспетчере устройств, пока в диспетчере задач не упадет нагрузка, но, если вы начинающий пользователь, есть вероятность, что вы столкнетесь с тем, что у вас перестанут работать клавиатура и мышь, а что делать дальше будет не ясно.

Поэтому могу рекомендовать более простой метод: откройте диспетчер задач, так чтобы было видно «Системные прерывания» и поочередно отключайте все без исключения USB устройства (включая клавиатуру, мышь, принтеры): если вы увидите, что при отключении очередного устройства нагрузка упала, то ищите проблему в этом устройстве, его подключении или том USB-разъеме, который для него использовался.

Способ явного прописывания ключа сервиса Антикапчи

По запросам наших пользователей мы реализовали альтернативный способ указания API ключа — через прописывание его в конфигурационном файле.

Для этого необходимо скачать код плагина в ZIP формате и распаковать этот архив. Внутри, в директории js вы найдете файл config_ac_api_key.js.

Откройте его в любом редакторе и в значение переменной antiCapthaPredefinedApiKey впишите ваш anti-captcha.com API ключ.

Например:
var antiCapthaPredefinedApiKey = ‘12345678901234567890123456789012’;

Обратите внимание, что помимо ключа в этом файле присутствует еще переменная defaultConfig, в которой перечислены значения всех опций плагина по умолчанию. Не стесняйтесь менять их по своему усмотрению, описание значения каждой конкретной опции можете подглядеть в статье по работе с API нашего плагина, в методе setOptions.

Разве что в статье имена опций представлены в camelCase, а в файле настроек через_подчеркивания (useRecaptchaPrecaching ~ use_recaptcha_precaching).. Последнее, что надо сделать — запаковать обратно весь код плагина в ZIP архив и указать путь именно до него в методе add_extension (смотрите выше наш файл captcha_solve.py).

Ну и, конечно, строки начиная с 37 по 50 нам в этом случае не нужны.

Последнее, что надо сделать — запаковать обратно весь код плагина в ZIP архив и указать путь именно до него в методе add_extension (смотрите выше наш файл captcha_solve.py).

Ну и, конечно, строки начиная с 37 по 50 нам в этом случае не нужны.

Надеюсь данное руководство было вам полезно. Если возникли какие-то проблемы, то не стесняйтесь обращаться в нашу службу поддержки, мы вам ответим!

Капча: что это?

Итак, капча – это ни что иное, как специальная картинка, содержащая проверочный код для определения того, кто именно пытается совершить определенное действие в сети, — человек или робот. Чаще всего расшифровать код предлагают в тех случаях, когда происходит многократное выполнение одного и того же запроса на сервисе. К примеру, поисковики вроде Яндекса или Гугла регулярно предлагают нам расшифровать captcha, когда мы задаем им одни и те же вопросы. Нельзя назвать капчу редким гостем и в среде скриптов: парсеров, кликеров, постеров и так далее.

Главная задача captcha – предотвращение автоматического действия роботов. Чтобы отсеять ботов, сервисы предлагают пользователям разгадать код, зашифрованный в витиеватом рисунке. Справиться с поставленной целью способны лишь реальные пользователи, боты, увы, делать это не умеют. Именно поэтому при работе со скриптами капча становится настоящей проблемой, не позволяющей взаимодействовать с большим объемом данных. Однако, не стоит отчаиваться и опускать руки. Всякая проблема разрешима, и ввод captcha – не исключение.

Чем Rucaptcha лучше других сервисов антикапчи?

Аналогов у Рукапчи хватает, о них мы расскажем ниже, но лучше не рассматривать прочие варианты. В этой системе масса инструментов и есть всё, что необходимо для комфортного использования. В настройках удается указать максимальную ставку, можно активировать 100% распознавание и режим для тестирования (сам будешь вводить капчу):

Есть расширенные настройки при использовании API, а для клиентов подготовлен подробный FAQ. Кроме этого, поддержка отзывчивая, оперативно решают проблемы. Даже если раньше вы не пользовались такими услугами, быстро во всём разберетесь:

Работников здесь всегда много, среди конкурентов в Рунете, это самый популярный проект. На сайте представлен каталог программ, для которых можно использовать сервис, в их число входят:

  • ;
  • ;
  • ;
  • ;
  • ;
  • ;
  • ;
  • ;
  • ;
  • ;
  • .

Просто добавьте ключ антикапчи в этот софт и экономьте уйму времени. Только в этой системе удается детально анализировать свои расходы и не переплачивать. Главное разобраться с настройками и лучше не включать 100% распознавание.

Anti-Captcha (Antigate): стоимость, время, плюсы и минусы сервиса

Сервис Antigate распознаёт текст с изображений, в расшифровке тоже участвуют живые люди, которые могут справиться с капчей, в отличие от роботов. Условия несколько отличаются от Рукапчи.

Характеристика Antigate:

Поддержка разных видов капчи.

API.

Поддерживает API-протоколы, с помощью которых его можно интегрировать с популярными сервисами.

Стоимость расшифровки — около 100 рублей за тысячу решений.

Действует принцип аукциона: можно добиться более низкой цены, но у такого распознавания будет медленная скорость. На сайте заявлено, что начальная цена 40 рублей. Абонентских платежей нет, клиент оплачивает только решённые капчи.

Иностранные работники.

Статистика на сайте показывает, что большинство работников сервиса из Венесуэлы, Индонезии и Вьетнама.

Скорость распознавания — в среднем 30 секунд.

Скорость зависит от сложности шифра и допустимой ставки, в среднем это 30 секунд. Ускоренного режима можно добиться повышением ставок. Разгадывание происходит по аукционному принципу, поэтому заказ может простаивать, если другой пользователь предложит большую цену.

Статистика.

В личном кабинете можно посмотреть статистику загрузок.

Работа с сервисом типичная: для начала нужно зарегистрироваться в системе, пополнить баланс и приступать к работе после получения на почту специального ключа.

Для наглядности составили таблицу по ключевым характеристикам:

Подборка лучших сайтов

RuCaptcha

RuCaptcha.com – самый популярный российский сайт, который платит за распознавание капчи.

Чтобы начать зарабатывать, нужно зарегистрироваться и в правом верхнем углу выбрать вкладку “Я работник”.

Более подробную инструкцию вы найдёте в статье-обзоре Рукапчи.

  • Простой и понятный интерфейс.
  • Оплата зависит от сложности задачи — от 1 до 35 копеек за одну решённую капчу.
  • Есть обучающая тренировка для начинающих.
  • Рейтинговая система, которая позволит ответственным и опытным работникам получать более дорогие капчи.
  • RuCaptcha Bot — специальная программа поможет зарабатывать больше, решая не только обычные капчи “картинки”, но и капчи “с галочкой”.
  • Мгновенный вывод заработанных денег. Минимальная сумма (минималка) для вывода составляет 15 рублей.
    Работает с платёжными системами: Вебмани, Яндекс Деньги, Киви, Payeer, Биткоин и счёт мобильного телефона.

Пообщавшись с опытными работниками на Ру капча, выяснил, что для того, чтобы здесь зарабатывать больше, нужно работать в ночное время. Система устроена так, что чем больше активных работников, тем ниже ставка за 1 000 разгаданных капч.

На главной странице сервиса вы можете найти “Статистику системы” за сутки и на графике посмотреть максимально выгодное время с высокими ставками.

2Captcha

2Captcha.com – англоязычная версия Рукапча. Полностью идентичный интерфейс только на английском языке. Рассчитан на зарубежную аудиторию, поэтому оплата здесь в долларах.

  • Ставка в среднем 0,0004–0,0005 $ за 1 капчу.
  • Для вывода средств используются такие системы, как WebMoney (минималка 50 центов), PayPal, Payza.

Kolotibablo

Kolotibablo.com – ещё один популярный сервис, где платят за ввод капчи. Как я понял, работники этой площадки разгадывают капчу для сервиса Anti-captcha.com.

  • Удобный и функциональный интерфейс.
  • Плагин для разгадывания рекапч.
  • Постоянные обновления и добавление новых функций.
  • Возможность зарабатывать не только на вводе капчи.
  • Для вывода необходимо решить 500 капч и накопить минимальную сумму 1 доллар.
  • Системы для вывода денег: Яндекс Деньги, Qiwi, Биткоин, PayPal, Payza, Okpay USD, W1 RUR.

Читайте отдельную инструкцию по работе на сервисе Колотибабло.

Аналоги похуже

На этих сервисах я попробовал работать, но они не так популярны и заданий на них либо нет совсем, либо очень мало.

  • LeoWork – новая площадка, только набирает свою популярность.
  • Socialink – ищите работу в разделе “Антикапчинг”.
  • MegaTypers.com – чтобы зарегистрироваться нужно ввести пригласительный код – DISH.
  • ProTypers.com – брат-близнец предыдущего сайта, можете даже использовать для входа тот же логин и пароль. У них объединённый аккаунт (для новой регистрации так же используйте код – DICH).

Решаем первую капчу в Selenium

Скачивание плагина AntiCaptha

В первую очередь нам необходимо зайти на страницу скачки плагина для решения капчи, выбрать браузер, на котором мы будем решать капчу (Хром, Фаерфокс) и скачать соответствующие файлы с кодом плагина.

Для Chrome это будут CRX или ZIP. Для Firefox — XPI формат, может подойти и ZIP, но лучше все-таки XPI.

Скачанный файл требуется положить в какую-нибудь директорию проекта, далее в нашем скрипте мы будем прописывать до него полный путь.

Код решения рекапчи на Selenim под Python

Остановимся на одном моменте. Для работы плагина необходим Anti-Captcha.com ключ учетной записи (Anti Captcha Api Key).

Обычно он вручную выставляется в опциях плагина каждым нашим пользователем. При работе через Selenium такой возможности нет.

Для установки ключа используется отправка API сообщений в плагин, а именно метод setOptions.

Метод acp_api_send_request в коде ниже как раз отправляет подобное сообщение в строке номер 43.

Отметим, что помимо вышеуказанного, есть и более . Какой удобнее выбирать вам.

Итак, выполните представленный ниже код в интерпретаторе Питона (python3 или python.exe), предварительно поменяв пути до файлов плагина и chromedriver‘а, а также вписав свой ключ учетной записи Anti-Captcha.

Представленный ниже код снабжен комментариями на русском языке.

Сохраним наш код в файл captcha_solve.py и выполним в консоли команду:

Если все пошло нормально, то откроется браузер и начнет магическим образом решать Капчу =)

Другие сервисы антикапчи

К любой системе нужно прилагать список альтернатив, чтобы избежать всевозможные неудобства и проблемы. Помимо Рекапчи, сэкономить время помогают:

  • – аналог Рукапчи под зарубежные капчи, средняя ставка 0.5$ за 1000 распознаваний. Идеальный вариант для решения англоязычных капч.
  • – за 1000 распознаваний плата от 0.5$ (зависит от объема). Аптайм с 2007 года остается на уровне 99.99%, готовы решать капчу от Гугла (Recaptcha).
  • – зарубежный сервис, за 1000 распознаваний оплата от 4 центов, работает с 2009 года, разгадывают даже китайские иероглифы.
  • – платить будете от 0.7$ до 1.29$ за 1000 капч. Сайт переведен на несколько языков, удобно настраивается API.
  • – цены в этой системе начинаются с 14 рублей за 1000 разгадываний. Если в течение 60 секунд нет ответа, деньги возвращаются.

Этого набора должно быть достаточно, чтобы найти замену Рукапче. Пока ни один из конкурентов не обладает такой же популярностью (по крайней мере в Рунете), поэтому их стоит рассматривать только со второго плана.

Антикапча на Рукаптча помогает сэкономить кучу времени, а стоимость её использования не такая большая, чтобы отказываться от услуг. Пробуйте подключить, оцените и уже не сможете вернуться обратно. Проще отдать 5 копеек, чем постоянно отвлекаться на эти проверки ботов.

Советую посетить следующие страницы:

Что такое Captcha и почему она появляется?

Капчой называют специальное изображение с комбинацией из цифр и букв либо несколькими картинками. Человеку нужно выбрать, что изображено или ввести код. Есть и более оригинальные виды защиты: решить пример или собрать пазл, например.

Главной задачей капчи служит исключить возможность автопостинга при помощи скриптов или роботов. К сожалению или счастью, даже современные боты еще не научились разгадывать капчу.

Поэтому, если вы пользуетесь скриптами, быстрое прохождение Captcha становится настоящей проблемой. На самом деле, решить проблему можно, используя antigate-сервисы.

Основные возможности

Как убрать капчу в Яндекс Вордстате?

Да также, просто выключаете этот (или любой другой) блокиратор на данном сервисе, и у вас сразу пропадёт эта надоедливая капча. Особенно она надоедает, если в этот сервис нужно много вводить фраз, и соответственно капч!

Что интересно, Яндекс об этом молчал, хотя бы намекнул, что, мол: — Дорогой друг, а не желаете ли вы выключить АнтиБлок на наших сайтах? Сами внедрили, и сами наказывают.

Для того, чтобы подобные капчи в Яндекс Вордстате пропали, достаточно один раз его выключить, просканировать слова, и капчи исчезнут. Хотя, я бы вам всё же посоветовал на всех страницах Яндекса отключить данный блокиратор. Яндексу нужно зарабатывать, а вы мешаете ему своим блокиратором.

Антикапча: когда нужны сервисы ручного распознавания капчи?

Давайте представим ситуации, когда ввод капчи может стать проблемой, отнимающей наше время. Если вы работали над созданием своего блога или занимаетесь оптимизацией профессионально, программа для сбора семантического ядра Key Collector знакома вам не понаслышке. При работе с ней мы неоднократно обращаемся к Яндексу, на что поисковая система выдает нам капчи, которые необходимо вводить. В противном случае парсинг прекращается.

Аналогичная ситуация может возникнуть, если вы используете различные программы, которые осуществляют автоматически:

Согласитесь, что прочесть и заполнить тысячи капч – процесс времязатратный. И чтобы обойти механизмы, защищающие от спама, подобные инструменты предлагают подключение сервисов антикапчи.

Антикапча – это сервис для распознавания и ввода данных с графических изображений капчи вручную в режиме реального времени. Иными словами, живые люди разгадывают цифры и буквы вместо вас на отдельном ресурсе.  Вы же, как пользователь данной услуги, получаете полностью автоматизированный процесс.

Узнать подробнее, как работает антикапча, мы сможем на примере сервиса ruCaptcha.

Какой сервис выбрать

Antigate появился раньше Рукапчи, но последняя популярнее в Рунете, потому что это русскоязычный сервис и все работники знают русский. В Antigate используют труд преимущественно иностранных рабочих, поэтому с русскими капчами могут возникать очереди и задержки. Оба сервиса поддерживаются большинством популярных инструментов, для которых может понадобиться распознавание капчи. Есть программы, с которыми Рукапча пока не сотрудничает, но этот вопрос можно решить, выполнив некоторые изменения в файле hosts.

Если вам не критично время ожидания, попадаются капчи без русских букв и есть бюджет на перебивание ставок, то разница не очень велика — выбирайте Рукапчу или Antigate. Если хочется сэкономить, не теряя во времени, рекомендуем RuCaptcha — он всё-таки справляется быстрее и стоит дешевле, а лимиты не дают ставкам подниматься выше положенного.

Какое назначение клавиш на клавиатуре

Anti-Captcha

Что такое Anti-Captcha? Это популярный проект распознавания капчи с отличной клиентской поддержкой, удобным интерфейсом, данными об API, подробной статистикой.

Особенности и преимущества

  • Поддерживается рекапча от Гугла. Ее стоимость вполне доступна, 119 рублей.
  • Более высокая скорость распознавания капчи.
  • Более серьезный контроль над работниками, нежели у конкурентов.

Недостатки

У сервиса достаточно недостатков. Некоторые довольно не значительные, но другие могут подпортить впечатление от использования Anti-Captcha.

  • Время расшифровки капчи, согласно официальным данным портала, составляет примерно 9 секунд. Однако такая скорость при значительных нагрузках на проект, к сожалению, доступна лишь при более высокой оплате услуг, нежели у прочих заказчиков. То есть, Anti-Captcha функционирует как аукцион. Придется подождать, если вы не желаете тратить слишком много денежных средств.
  • Цена распознавания тысячи капч составляет 41,6 рубля. Однако, чтобы капча не висела в очереди и более быстро обрабатывалась, придется ставить немного больше.
  • Возможные редкие, но регулярные сбои в работе программы.
  • В основном, свободных работников на этом сервисе меньше, чем у конкурентов.

Usage

Solve recaptcha

Example snippet for Recaptcha:

from python_anticaptcha import AnticaptchaClient, NoCaptchaTaskProxylessTask

api_key = '174faff8fbc769e94a5862391ecfd010'
site_key = '6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-'  # grab from site
url = 'https://www.google.com/recaptcha/api2/demo'

client = AnticaptchaClient(api_key)
task = NoCaptchaTaskProxylessTask(url, site_key)
job = client.createTask(task)
job.join()
print job.get_solution_response()

The full integration example is available in file .

If you only process few page many times to increase reliability, you can specify
whether the captcha is visible or not. This parameter is not required, as is the
system detects invisible sitekeys automatically, and needs several recursive
measures for automated training and analysis. For provide that pass
parameter to or eg.:

from python_anticaptcha import AnticaptchaClient, NoCaptchaTaskProxylessTask

api_key = '174faff8fbc769e94a5862391ecfd010'
site_key = '6Lc-0DYUAAAAAOPM3RGobCfKjIE5STmzvZfHbbNx'  # grab from site
url = 'https://losangeles.craigslist.org/lac/kid/d/housekeeper-sitting-pet-care/6720136191.html'

client = AnticaptchaClient(api_key)
task = NoCaptchaTaskProxylessTask(url, site_key, is_invisible=True)
job = client.createTask(task)
job.join()
print job.get_solution_response()

Solve text captcha

Example snippet for text captcha:

from python_anticaptcha import AnticaptchaClient, ImageToTextTask

api_key = '174faff8fbc769e94a5862391ecfd010'
captcha_fp = open('examples/captcha_ms.jpeg', 'rb')
client = AnticaptchaClient(api_key)
task = ImageToTextTask(captcha_fp)
job = client.createTask(task)
job.join()
print job.get_captcha_text()

Solve funcaptcha

Example snippet for funcaptcha:

from python_anticaptcha import AnticaptchaClient, FunCaptchaTask, Proxy
UA = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 ' \
     '(KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'

api_key = '174faff8fbc769e94a5862391ecfd010'
site_key = 'DE0B0BB7-1EE4-4D70-1853-31B835D4506B'  # grab from site
url = 'https://www.google.com/recaptcha/api2/demo'
proxy = Proxy.parse_url("socks5://login:password@123.123.123.123")

client = AnticaptchaClient(api_key)
task = FunCaptchaTask(url, site_key, proxy=proxy, user_agent=user_agent)
job = client.createTask(task)
job.join()
print job.get_token_response()

Report incorrect image

Example snippet for reporting an incorrect image task:

from python_anticaptcha import AnticaptchaClient, ImageToTextTask

api_key = '174faff8fbc769e94a5862391ecfd010'
captcha_fp = open('examples/captcha_ms.jpeg', 'rb')
client = AnticaptchaClient(api_key)
task = ImageToTextTask(captcha_fp)
job = client.createTask(task)
job.join()
print job.get_captcha_text()
job.report_incorrect()

Custom tasks

There is support for your own (captcha) forms. It allows you to analyze any data in various ways, eg. classify offensive
image, count elements on the image, etc. The scope of the data, the form to describe them, you specify yourself.

For details, go to ‘Custom fields’ section in the documentation.

Setup proxy

The library is not responsible for managing the proxy server. However, we point to
the possibility of simply launching such a server by:

pip install mitmproxy
mitmweb -p 9190 -b 0.0.0.0 --ignore '.' --socks

Next to in your application use something like:

proxy = Proxy.parse_url("socks5://123.123.123.123:9190")
69.65.41.21
209.212.146.168

Error handling

In the event of an application error, the AnticaptchaException exception is thrown. To handle the exception, do the following:

from python_anticaptcha import AnticatpchaException, ImageToTextTask

try:
    # any actions
except AnticatpchaException as e:
    if e.error_code == 'ERROR_ZERO_BALANCE':
        notify_about_no_funds(e.error_id, e.error_code, e.error_description)
    else:
        raise
Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector