Несмотря на более-менее налаженный механизм борьбы с капчей, ежедневно уходящая в фонд поддержки ручного труда Индии сумма в $1000 волей-неволей побуждала искать другие способы решения этого вопроса.
Надежду подавали высоты, достигнутые в области OCR – алгоритмов оптического распознавания символов. Подобным решением для ВК-капчи я успел попользоваться в последние пару недель своей работы в этой социальной сети. Как вы помните, стоило оно немало ($300) и имело не прямо чтобы блестящую 50 %-ную эффективность, но работало исправно и, кроме ресурсов процессора компьютера, больше ничего не просило. Однако общение с разработчиками этого модуля выявило отсутствие интереса у них создавать подобное решение для капчи из ОД (видимо, вследствие невысокой популярности Одноклассников).
Разработчики ZennoPoster (известного конструктора для автоматизации действий в интернете) в то время анонсировали свой новый инструмент автоматического распознавания капч – CapMonster. Проведенные мною тесты подтвердили честные предупреждения создателей о том, что на данном этапе развития программы стоит ожидать от неё верного разгадывания разве что самых простых капч, кривые символы из ОД к которым, конечно же, не относились.
Как-то на Хабре я прочел статью о серьёзных победах алгоритмов OCR над первыми версиями ReCaptcha – одним из самых лютых проявлений капч в интернете. Известия пришли с западных спам-фронтов, однако, как это часто бывает, без участия наших соотечественников тут не обошлось (чему, собственно, статья и была посвящена). Попытки связаться с упоминаемыми персонажами ни к чему не привели – мне ответили, что ничем помочь не могут. Даже несмотря на то, что я готов был предложить очень хорошее вознаграждение за решение больного вопроса тому, кто избавит меня от необходимости расходовать по $1000 на капчу каждый день. В месяц это экономило бы мне порядка $30 000, большей частью которых я был готов поделиться со светлыми OCR-умами.
Но, как говорится, что ни делается – всё к лучшему. В чём я вскоре смог убедиться, потому что до разработчиков ОД наконец-то стало доходить, что требовать от своих пользователей бесплатно работать индусом-разгадывателем капчи при каждом приглашении человека в группу – это далеко не образец лучших практик построения дружественных интерфейсов.
И в один (действительно прекрасный) день здравый смысл восторжествовал, и капча с приглашений была убрана. Однако сделано это было только в полной версии сайта, а я ведь тогда работал исключительно через мобильную. Здесь надо отметить, что полная и мобильная версии одной и той же социальной сети ОД – это, несмотря на внешнюю схожесть, два совершенно разных мира, два различных сайта. И, как это хорошо видно на примере с отменой капчи, в первую очередь цивилизация приходила именно в версию настольную.
Главной сложностью работы одновременно с обеими версиями ОД были динамические идентификаторы всего, что только можно: профилей, групп, записей и прочего – все они заново генерировались для каждой сессии и, соответственно, всегда были разными. Поначалу этот зоопарк порождал проблемы разве что в вопросе создания точного списка отработанных пользователей. Теперь было необходимо научиться отыскивать одни и те же объекты в двух разных мирах постоянно меняющихся указателей.
Желание насладиться свободой от капчи, дарованной настольной версией ОД, в итоге привело к обнаружению какого-то постоянного вспомогательного идентификатора, связанного с главной фотографией пользователя. Путем блуждания сложных перекрёстных запросов, я смог собирать пользователей, находящихся в онлайне с мобильных устройств из поиска мобильной версии, а приглашения им отправлять уже из версии полной, поставив тем самым жирную точку в конце наших отношений с Антигейтом и открыв новую главу в отношениях с интернет-провайдером.
Так как теперь часть работы софту приходилось проделывать, находясь в полной (вечно тормозящей) версии ОД, значительно, просто в разы, вырос объём трафика, и теперь слабым местом системы стала пропускная способность моего интернет-провайдера. Тут я впервые увидел причину реальной необходимости покупки самого дорогого тарифа – в те времена это была скорость в 40 Мбит/с за пару тысяч рублей в месяц. Совсем небольшая цена по сравнению с былыми тратами на капчу в Антигейте.
Иногда я пересматривал свой код перекрёстных запросов и сам уже не понимал, как он работает. Определённо, эта технически сложная победа была одной из выдающихся на фронте моей деятельности, достижение которой при использовании принципа «Сэкономил – значит заработал» позволило при прочих равных практически удвоить чистую прибыль.