Big data простым языком

Благирев Алексей

Хапаева Наталья

Глава 4

Регулирование данных

 

 

Р – регулирование.

Данные и капитализм.

Штука бесполезная и беспощадная во всех отношениях. Ценности в регулировании де-факто мало, оно лишь снижает скорость развития в цифровой экономике.

Нет однозначной истории, как же регулировать данные.

Во-первых, с юридической точки зрения надо определить, что такое данные. А с этим не только в нашей стране беда, но и в международном пространстве нет единства и понимания по таким вопросам.

В США, например, нет законов, прямо регулирующих Большие данные. Иными словами, ты можешь пострадать, только если косвенно затронешь чьи-то интересы, и они это докажут.

В самом начале я говорил, что есть две стратегии работы с данными:

1. Либо нападение – то есть используем те данные, которые есть, с целью побольше заработать.

2. Либо защита – сидим на данных, никому не даем и защищаемся от всячески возможных рисков и возникающих сложностей.

Итак, родина капитализма, конечно же, предпочла первый вариант. Что там делают с вашими данными – похоже на какофонию и безумную спонтанную оргию организаций, которых вместе никто не собирал и к сотрудничеству не приглашал.

Конечно, есть небольшие исключения, и это хорошо. Они как раз структурируют и задают общий тон того, что делать можно, а что – не очень.

Кстати, именно в США в 2010 году был известный скандал в магазинах Target, когда их точнейшие аналитические алгоритмы определили, что несовершеннолетняя школьница ждет ребенка. Конечно, первым прибежал ее отец и чуть не поубивал менеджеров Target за непристойный контент и предложения школьнице рожать.

А все началось с Эндрю Пола, который в 2002 году работал статистиком в Target. К нему подошли его коллеги и спросили его, «может ли он выяснить, беременный покупатель или нет, даже он не хочет, чтобы мы как магазин знали?».

Эндрю имел магистерскую степень по статистике и еще одну – по экономике, и, конечно же, был повернут на анализе поведения пользователей с использованием данных.

Спустя 16 лет с того безумного вопроса, ответ на который сделал Эндрю Пола мегазнаменитым и успешным гостем выпусков новостей и ток-шоу в связи с эпичным скандалом, он ушел из ритейла в банкинг. Он вышел работать вице-президентом по персонализированной аналитике в пятый по величине банк США, USBank. Чем-то похоже на наш топ-5 банк, за одним исключением, что USBank ровно в десять раз больше, чем банк, находящийся на 5 месте в РФ, и даже больше, чем известный банк находящийся на первой строчке рейтинга в России. В USBank Эндрю будет развивать совершенно новое направление. Кстати, Target – это пятый по величине ритейлер в США, так что тенденция у Эндрю на лицо.

Но вернемся назад, в начало 2000-х. Сакральная мысль позади идеи взлома и анализа поведения беременных покупателей была крайне простой – молодые родители, считались Священным Граалем для сети Target. Обычно покупатели не берут все в одном магазине, они покупают везде понемногу. При этом, сеть Target продавала все виды товаров: от питания до мебели.

И, конечно, их главная мысль была стать брендом первого выбора, чтобы за любым предметом люди шли в Target. Абсолютно такая же крамольная идея лежит и в головах банкиров – стать банком первого выбора, чтобы везде платили только их карточкой.

Как мыслили тогда маркетологи: обычно человек в рутине, и до него сложно достучаться. Есть только несколько моментов в жизни, когда эта обыденность отступает, – покупатель прислушивается и готов покупать все подряд. Один из таких моментов – рождение ребенка. Тогда родители готовы перевернуть магазин вверх дном, чтобы найти самую крутую колясочку и самую прикольную кроватку. Другие события, когда человек выныривает из рутины, – например, когда слышит любимую музыку.

И тут великие маркетологи сказали Эндрю, что важен момент. А именно, момент до рождения, который потом будет занесен во все публичные источники и базы данных. Нужно ловить пап и мам тогда, когда их чадо еще не увидело свет. Было бы идеально, если бы Эндрю смог разработать модель, позволяющую вычислять второй триместр беременности, чтобы приклеить к себе покупателя на годы.

Данные, которые собирались, привязывались к общему идентификатору программы лояльности. Собственно, как и в других магазинах в любой стране мира. Идентификатор карточки лояльности обычно связан с простеньким соцдемом – возраст, пол, есть ли дети и так далее. Дальше, используя номер телефона, например, можно взять данные из базы резюме и прикинуть, сколько человек получает на той или иной позиции. Для этого существует целая тонна обзоров и прочих сервисов.

Напомню, телефонный номер, по которому можно получить эту информацию из баз данных HeadHunter и других ресурсов, не является объектом закона о персональных данных в России.

Таким образом, мегамоллы могут быстро прикинуть, какой у вас доход, а данные операторов, помогут рассчитать, как далеко вам нужно добираться до дома. А дальше происходит простая магия чисел и вычислений. В основу модели Эндрю легли 25 продуктов, которые будущие мамы покупали в сети. «Большой бум» произошел в том, как люди пытаются предсказать поведение других людей.

Люди смогли предсказать, что нужно делать, чтобы перестать кусать ногти, или почему одни любят ходить на работу, а другие прокрастинируют каждое утро. Причем те, кто прокрастинируют, как раз и грызут свои ногти.

Есть в этом что-то позитивное, когда пытаешься предсказать поведение пользователей. Ищешь новые знания и все-такое. Конечно, доступ к данным тут является лютым и самым важным обстоятельством. Нейрофизиология вообще как область науки, важна для ответа на вопрос «почему мы действуем сегодня так, а не иначе».

Для получения данных по медицинским исследованиям придется разобраться в структуре закона о «Страховании здоровья и ответственности» (HIPPA), который был принят в 1996 году Конгрессом и объединил регулирование как в отношении сотрудников, так и в отношении предоставления медицинских сервисов широким слоям населения. Идея HIPPA проста – стимулировать появление медицинских планов для всех групп пациентов. Основой, на которой предполагалось выполнять такое стимулирование, стал электронный документооборот истории болезни.

Спустя двадцать лет, конечно же, возникли проблемы, так как все перешло в цифровую среду. Например, те же фитнес-трекеры, которые собирают медицинскую информацию о сердцебиении, и GPS-координаты – должны соответствовать требованиям конфиденциальности медицинских данных по итогам пересмотра HIPAA в HITECH Act в 2009 году. Это, кстати, единственное, чему они должны соответствовать сегодня в США.

В законе нет общих правил нарушения, каждый кейс должен рассматриваться индивидуально. Есть только общий штраф за нарушения в размере 250 тысяч долларов, если это произошло в первый раз, и полутора миллиона долларов, если нарушение использования данных продолжается. Единственное, закон не так сильно соблюдается и мониторится со стороны властей.

А чтобы можно было работать с данными о финансовых транзакциях, Соединенные Штаты предлагают действовать в рамках требований по конфиденциальности в части Грэмм-Лич-Блайли акта. Этот закон инициировали республиканец Фил Грэмм и конгрессмены Джим Лич и Том Блайли. Потому что там участвовала республиканская партия, я думаю, понятно, что закон направлен на снятие ключевых барьеров в развитии банковского сектора.

Конечно, любая такая идея всегда упирается в деньги. Всегда. Просто потому, что деньги были и пока остаются единственным интерфейсом, как люди одной профессии ставят людям другой профессии разные задачки. Так, когда Эндрю Полу поставили задачку, то он представил своего виртуального покупателя, девушку, которая тратит в год не более тысячи долларов. Пол прикинул, что будет, если, например, она выйдет замуж и у нее появятся дети, увеличится ли сумма ее ежегодных трат до пяти тысяч долларов [89]#i_083.png .
? А если сравнить ее с неким виртуальным клиентом, мужчиной, который продолжает по-прежнему тратить только тысячу долларов, то логичнее было бы для Target не тратить деньги на рекламу, сегментирование таких низкодоходных клиентов и выпуск специальных предложений вроде купонов на покупку. При правильной игре такая модель, как уже понятно, позволит увеличить доход на клиента в пять раз. Вдумайтесь, в пять раз.

Чтобы построить такую модель, которая дает точность в 86,5 процента, потребовалось добыть конкретные данные. Сама модель при этом оставалась возобновляемой, и ее можно было воспроизвести в разных сегментах розничной торговли, банкинге или финтехе. Ключевыми данными тут выступили:

• идентификатор карты лояльности в сети Target,

• имя и адрес проживания,

• банковская карта,

• история покупок в магазине,

• история онлайн покупок,

• номер мобильного телефона,

• действия, предпринятые пользователем в ответ на электронные письма Target в почтовом ящике (клики, переходы и так далее),

• куки и активность по поисковым запросам и просмотрам в Интернете.

Полное видео с выступления 2010 года Эндрю Пола можно увидеть по ссылке. Позади таких исследований всегда стоит основная гипотеза, которая постепенно превратилась в аксиому «что есть паттерны поведения». Как только мозг сталкивается с определенной ситуацией, в которой он уже был, он автоматически включает определенный паттерн. Изучив такие паттерны, можно управлять знанием, экономикой и покупательской способностью. Поэтому данные будут собирать, поэтому данные будут покупать. Это гонка, и она будет только ускоряться.

Стоит отметить, что это лишь малая часть данных, которые мы оставляем о себе, и не все из них попадают под регулирование. Так, номер мобильного телефона сам по себе не является объектом регулирования для закона о персональных данных в РФ.

 

Суровые европейские консерваторы

Гонку сбора данных и их использования, которая началась на другом континенте, в старой доброй Европе остановили с помощью бетонной стены, которая называется GDPR – основной закон по защите данных, состоящий из 99-ти глав (!). Он вступил в силу 25 мая 2018 года. Именно в эту бетонную стену врезалось большинство продавцов данных.

Не так давно я посетил один чешский банк, и оказалось, что он не может просто так купить данные у кредитных бюро (чем он занимался постоянно) и провести скоринг потенциальных клиентов на возможность выдачи займа.

28 января 2016 года, 47 стран участников ЕС праздновали десятую годовщину Европейского Дня Защиты Данных. Этот небольшой праздник посвящен подписанной в Страсбурге членами ЕС 28 января 1981 года конвенции № 108, посвященной правилам и требованиям обработки персональных данных. Этот небольшой по объему документ вводит основные понятия: что такое персональные данные, что такое обработка файлов, что такое контроль обработки файла.

И это все, представьте себе, было больше 37-ми лет назад, когда еще и Интернета толком не было. Конвенция также вводила специальные определения данных, например, в отношении данных по здоровью, где запрещала их обработку в случае, если страна-участник ЕС не гарантирует их конфиденциальности. Саму конвенцию, в итоге, ратифицировали (в том числе и за пределами ЕС) такие страны как Мексика, Марокко, Кабо Верде, Маврикий. Огромное количество наблюдателей из других стран также сформировало свою позицию (Австралия, Япония, Корея, Израиль и другие). Сегодня Конвенция уже обновлена и актуализирована в духе времени.

Первая директива по защите данных появилась впоследствии в ЕС, в 1995 году, и была введена 13 декабря 1995 года с обязательным периодом старта применения участниками ЕС с 24 октября 1998 года. Это был достаточно масштабный по своим меркам документ, подробно описывающий как категории данных, так и категории потребителей, а еще методы защиты, арбитража работы с данными и организацию службы специальных контроллеров, которые проверяют применение директивы в каждой из стран ЕС.

Как это обычно бывает, контроль сам по себе и иезуитские методы, которые он подразумевает, крайне сложно масштабируются и спускаются на уровень конкретных исполнителей. Отчасти поэтому первого декабря 2009 года была выпущена специальный дискуссионная бумага ЕС о будущем – «Future of Privacy».

Глобальный посыл был такой – текущее регулирование опять не работает, его нужно усложнить и обновить различными инновационными практиками, такими как «privacy by design» (приватность через дизайн) и другими.

ЕС – это сложная экосистема. Если какой-то веб-сайт обрабатывает данные резидентов/нерезидентов и находится за периметрами ЕС, то он не подпадает под регулирование Директивы 1995 года. Дискуссионная бумага подняла обсуждение о создании единого стандарта для приватности и управления данными, чтобы другие страны могли управлять своими требованиям к данным, руководствуясь общими принципами. По аналогичной схеме пошли в свое время (в далеком 1971 году) и бухгалтера, и финансисты, когда основали IASB, – специальное общество, которое впоследствии выпустило Международные стандарты финансовой отчетности (МСФО). МСФО сегодня – основа для любой финансовой публичной отчетности.

Директива 1995 года не предусматривала описания подходов, которые бы рассказали, как нужно брать с пользователей согласие на обработку данных. Поэтому нужен новый подход по работе с согласием пользователей. В общем, было много и других различных деталей, смысл обсуждения которых сводился опять же к тому, что регулирование не работает должным образом. Все это вылилось в то, что четвертого ноября 2010 года ЕС определил единую новую стратегию по защите персональных данных и начал работу по ее реализации.

Дальше, если не вдаваться в подробности, был большой спор между ЕС и США, где США хотели сохранить интерес своих компаний на территории ЕС, так что текст проекта закона менялся несколько раз крайне существенно. Пока все вокруг пытались разобрать, сколько же они тратят на комплаенс по защите данных (87 % опрошенных бизнес-субъектов не смогли определить точно цифру затрат на выполнение требований текущего и будущего законодательства), 12 марта 2014 года Европарламент общим большинством (621 за, 10 против и 22 воздержалось) утвердил реализацию GDPR, обязательную для участников ЕС с 2018 года.

Регулирует GDPR специальный офис (Informational Commisioners Office) – не путать с брутальным термином ICO, ввергающим в панику большинство традиционных банкиров. Это совсем другое.

ICO каждой страны участника ЕС входит в единый совет – European Data Protection Board.

GDPR говорит, что все публичные компании обязаны назначить специальную роль Data Protection Officer (DPO). Такие парни стали обязательными для организаций, в которых работает более 250-ти человек и обрабатываются более пяти тысяч объектов персональных данных в год.

У любой организации есть всего лишь 72 часа на то, чтобы сообщить об утечке или нарушении GDPR в организации в случае их возникновения. Правило 72-ух часов стало новым для всех участников.

Что именно оно означает?

В течение этого срока организация, которая допустила нарушение GDPR, обязана за 72 часа (три дня) провести внутреннее расследование, информировать об этом регулятора и всех затронутых владельцев данных, а также подготовить план возмещения и купирования возникающих убытков (рисков).

Исследование в обязательном порядке должно содержать информацию о том, кто и когда имел доступ к данным, как и какие данные пользователей оказались под нарушением, каким образом эти данные были использованы.

Как человек, который занимался данными достаточно долго, с уверенностью могу сказать, что львиную часть работы в этом случае будут возлагать на директора по данным, ибо кто-то должен наладить необходимый сбор данных для регулятора.

Скорость, с которой теперь должны реагировать организации, становится феноменальной. Она соизмерима со скоростью работы комплаенса банковского сектора.

GDPR собирает лучшие практики и требования к работе с данными, в особенности к публичным компаниям.

Все проблемы и риски в отношении GDPR необходимо рассматривать на уровне Правления организации. Теперь все сделки по слияниям и поглощениям будут в обязательном порядке начинаться с анализа соответствия GDPR, так как штрафы за нарушения достаточно внушительны, вплоть от десяти миллионов долларов и до четырех процентов от годовой выручки. Неудивительно, что такая надгробная плита притормозила и припарковала развитие множества цифровых сервисов в ЕС.

«Compliance First!»

Увидеть мир в частице песка

В совокупности регулирование GDPR стало самым продвинутым с точки зрения глобального контекста. Но я все равно бы разделил мир на страны, где с точки зрения регулирования проще идти со стратегией «развития и атаки» (монетизации данных) – США, Индия, Япония, Южная Корея, Африка, Канада и страны, где преобладает стратегия «защиты» (снижения возможных рисков и потерь) – Европа, Россия, Китай, и другие.

Различное регулирование дает различную корпоративную структуру.

Отдельно стоит отметить Великобританию, которая некогда была своего рода оазисом в части принципов корпоративного управления, задавая стандарты с помощью «Combined Code», обязательного к применению всеми публичными компаниями, размещенными на Лондонской бирже. Сегодня «Combined Code» абсолютно ничего не говорит в отношении данных, этот вакуум как раз был призван решить GDPR, но в связи с выходом Великобритании из ЕС, могу сказать, что там с данными можно творить все, что угодно, как, например, в Индии.

Крупнейший в истории человечества взлом данных, как оказалось, произошел именно в Индии. Из платформы Aadhaar, которую приводят всем как образец биометрической системы, собирающей отпечатки пальцев, были украдены практически все записи пользователей – более одного миллиарда.

Идея создания платформы Aadhaar появилась в начале 2000-х из-за такой проблемы, как осуществление выплат социальных пособий населению Индии, не имеющему документов (паспортов). В 2009 году Правительство Индии создало единую идентификационную карту для жителей Индии. Дальше дело было за малым – привязать каждого жителя Индии к его идентификатору. И здесь самым верным решением оказался отпечаток пальца. Тогда была придумана Adhaar. За четыре года сорок процентов населения были записаны на новую платформу. А девятого октября 2013 года Национальная Платежная система Индии запустила поддержку платежных сервисов, привязанных к Aadhaar счетам для небольших сумм (не более семидесяти долларов). По итогам 2018 года Aadhaar – крупнейшая в мире база данных биометрических записей (отпечатков). Кстати, запуск Единой Биометрической Системы в России начался с анализа кейса Индии по созданию аналогичного сервиса.

Но вернемся к нашим проблемам. В 2018 году совокупно было украдено порядка двух миллиардов записей из разных источников.

Вторую строчку после Aadhaar занимает проект Exactis, который выступает брокером данных для осуществления маркетинговых компаний.

На третьем месте находится компания Under Armour, которая выявила утечку данных более 150-ти миллионов пользователей, где помимо их персональных данных (имени, пароля, водительских прав и так далее), были еще и их медицинские данные – сердечные ритмы, нагрузки, калории и прочие данные, что каждый из нас заносит в фитнес-трекер.

Следующим лидером вслед за введением GDPR стал Китай. Пекин ввел обязательное требование держать данные о всех своих жителях на территории Китая, чтобы они стали частью единой платформы по социальному скорингу. Кто смотрел сериал «Черное Зеркало» сразу поймет, о чем речь, кто нет, – поясню. Поступки каждого жителя Китая теперь влияют на его жизнь, на то, какую работу он сможет выбрать, в какие университеты поступить, какие услуги получить от общества, какой дом купить, влияние распространяется даже на то, какой билет на высокоскоростной поезд может себе позволить человек.

Платформа социального скоринга впервые была предложена в 2014 году, когда Пекин обозначил, что на основании данных будет рассчитываться единый рейтинг жителя, а в 2020-м эта схема станет обязательной для всех жителей Поднебесной, всех 1,4 миллиарда человек. Это самая настоящая система тотального контроля за гражданами, где следующий шаг после выявления нарушения – наказание. А наказывать жителей Китая могут за то, что, например, они жульничали в компьютерных играх или забронировали столик в ресторане, но не пришли. Для поддержки и обеспечения работы этой платформы Пекин разрабатывает поправки в регулировании на базе существующего законодательства E-Commerce Law, драфт которого был разослан ключевым игрокам рынка в начале 2018 года.

Новый закон четко выделяет три блока применения регулирования:

• Сетевые операторы

• Критическая информационная инфраструктура

• Провайдеры сетевых продуктов и услуг

В каждый из трех блоков попадает, к примеру, компания WeСhat, – один из крупнейших в мире мессенджеров. WeСhat представляет сегодня экосистему, позволяющую оплачивать покупки через qr-коды даже на овощных рынках. Qr-коды заменяют даже визитки, которые жители Китая могут дать друг другу при знакомстве. Китайское общество в своем роде перепрыгнуло эру пользования банковскими картами, так как покрытие финансовыми сервисами оставляло желать лучшего, а телефоны стали мегадоступными. Результат не заставил себя ждать.

Каждый житель Поднебесной живет и пользуется в своей бытовой жизни исключительно такими сервисами как WeChat. К слову, стоит отметить, что большая часть продуктов WeСhat находилась вне правовых рамок или попросту была незаконна до тех пор, пока не стала поистине массовой. Властям ничего другого не осталось, кроме как легализовать использование цифровых сервисов таких компаний как WeChat, Baidu и Alibaba.

Новое регулирование теперь наложит на эти компании определенные обязательства, в том числе и штрафы. Но по сравнению с Европой они, конечно, меньше (до трехсот тысяч долларов).

Россия – страна других взглядов.

Если в США известный всем парень Дуэйн «Скала» Джонсон запускает свою собственную линию одежды и кроссовки от компании Under Armor, то их раскупают менее чем за двадцать часов в день релиза коллекции. Вот это скорость! Сумасшедшая. Раскупают все подчистую, так, что кроссовок таких просто нет. Ни интернете, ни в магазинах. Не то что в РФ. В фирменных магазинах Under Armor в Москве чудо-кроссовки стоят нетронутыми, и никто их не берет. На них даже сделали сезонную скидку в двадцать процентов. Вот тебе бизнес: покупай в России неликвид и продавай в США изделия, которые делают в Китае.

Продавцы говорят, что люди интересуются и не покупают, потому что пятка в этих чудо-кроссовках проминается, а это риск. Общество у нас и так всегда под риском, и на новый еще не готово.

К чему это все? А к тому, что поведение пользователей разных стран сильно отличается, и законы тут вовсе не причем. Законы, скорее, помогают наводить порядок и определять те границы, которые сильно размыты.

Так уж повелось, что по ряду вопросов мне пришлось консультироваться с Администрацией Президента. Мне стало интересно мнение коллег и экспертов от АП, понять, как они относятся к законам. Признаться, мой собеседник оказался крайне образованным и эрудированным человеком, и он натолкнул меня на мысль о том, как должны строиться законы.

Право, которое строится на традициях, поддерживает и раскрывает взаимоотношения общественных институтов и самого общества. Под традициями каждый может понять много чего, поэтому я, конечно, тут рассматриваю все в плоскости сугубо цифровой. Что можно делать там, где еще никакой этики или традиций не существует. А что делать нельзя, даже если технология позволяет? Это пока не определено. Поэтому все существующие законы просто не раскрывают суть цифровых взаимоотношений.

Мой хороший друг, эксперт в области данных, управляющий директор по инновациям в Газпромбанке, Екатерина Фроловичева, на открытом рабочем столе Аналитического Центра по регулированию данных в сентябре 2018 года сформулировала, что данные – это валюта.

Другие эксперты сказали, что данные – это актив. Мне нравится эта формулировка, потому что в основе любого взаимодействия в цифровой среде должна лежать сделка. Сделка по использованию данных любого человека или организации третьим лицом.

В РФ есть закон, например, № 112 от 7 июня 2013 года, который вносит изменения в основной закон, определяющий порядок доступа к информации о деятельности государственных органов и органов местного самоуправления. Доступ к данным определили, а что такое данные – нет, хотя закон ввел понятие «открытые данные».

Как облагать налогом платные сервисы, которые строятся на открытых данных?

Вернемся к тенденциям, нормам, привычкам и традициям пользователей. Опираясь на опыт Поднебесной, стоит явно отметить, что драйвером регулирования должен быть в первую очередь продукт с использованием данных, которые сегодня уже во многом представлены алгоритмами с использованием машинного обучения.

Наиболее популярные алгоритмы, которые стоит рассмотреть в регулировании:

• Рекомендация и оптимизация контента – такие платформы как Spotify, Netflix, Amazon, Ozon используют алгоритмы, которые постоянно наблюдают за нами. Они исследуют, как долго, часто и что именно мы смотрим, что нам нравится. Алгоритмы могут анализировать картинку, могут дать описание к ней, могут спроектировать картинку на основании наших любимых фильмов и актеров, чтобы продать нам новую услугу или товар.

• Высокочастотный трейдинг – такие специальные алгоритмы, которые перехватывают запросы пользователя, совершают покупку за тысячные доли секунды и продают их обратно пользователю, но с небольшой накруткой. Некоторые эксперты рынков капиталов называют HFT (высокочастотный трейдинг) паразитами, так как при выставлении ордеров пользователь фактически не может купить по текущей цене с рынка тот или иной инструмент. Рекомендую изучить историю ребят Investors Exchange – они первые, кто придумал биржевую площадку, где нет таких пакостных посредников.

• Реклама – все поведенческие паттерны строятся на куках, ваших специальных идентификаторах внутри Интернета. Выбрали книгу в электронном магазине о криптовалюте, передумали и ушли, потом зашли на видеохостинг, а в стоке вам показывают фильмы про криптовалюту. Совпадение? Не думаю. В Интернете как таковом нет своей памяти, но есть куки. Куки представляют собой ячейку памяти, только эту память видят все участники Интернета. Все рекламщики используют ваши куки, вы даже можете об этом не знать. Более того, они подсовывают свои собственные куки в ваши куки, чтобы сказать всем своим партнерам, что вы были у них. Существует много трекинговых методов, например флэш-куки, которые сложно удалить. Не всем хочется, чтобы кто-то знал, как в случае с Target, что вы ждете ребенка раньше, чем об этом узнают ваши близкие.

• Поисковые запросы – представьте, что выборы близко, а вы гипотетически никак не определились (опустим, что все уже предрешено). Попробуем перенестись в мир неограниченных возможностей и представить, что ваш голос еще по-прежнему учитывают. Вы вбиваете в поисковике имя потенциального кандидата, и вот уже сотни разных ссылок показывают информацию по этому человеку. И вроде бы все круто – теперь вы проинформированы, а значит, вооружены. Но представьте на минутку, что вам показывают один мусор, только плохие статьи и прочую грязь, так как именно в этот момент алгоритм поиска дал сбой. Как сильно это повлияет на ваше мнение о кандидате? Согласно одному из экспериментов в области психологии выбора, Роберт Эпштейн, психолог Американского Института Исследования и Технологий Поведения, выявил, что если человек в данной ситуации увидит позитивные новости о кандидате, то он проголосует за него с вероятностью более 48-ми процентов. И наоборот. Эпштейн назвал это явление Voting Manipulation Power – сила для манипулирования голосованием. Конечно, все это было в рамках лаборатории. Поэтому в 2014 году исследователи отправились на выборы в Индию, где в голосовании были задействованы восемьсот миллионов человек. Из них реально оказали участие порядка 430 миллионов. Исследователи провели очередной эксперимент на тех голосующих, которые не решились с выбором. В зависимости от того, какую информацию исследователи показывали людям, сила VMP оказывала на них влияние. Влиянию поддались от 24-х до 72-х процентов людей, участвующих в эксперименте. Впоследствии они назвали это эффектом Fox News – определяющим, как жители города, с консервативным кабельным каналом, становились более консервативными в своем выборе. В 2010 году Facebook мотивировал проголосовать более 340 тысяч человек, поставив на странице простую кнопку «I voted» (я проголосовал). Целевая аудитория составила 61 миллион пользователей. Из них 611 тысяч (один процент) получило сообщение, стимулирующее к голосованию, в топ-списке новостей. Другие шестьдесят миллионов человек получили специальное «социальное» сообщение, практически аналогичное, за исключением того, что оно включало в себя профили проголосовавших друзей. Люди, увидевшие «социальное» сообщение, с вероятностью в два процента чаще кликали на кнопку «I voted», в отличие от первой группы, где реакция составила 0,4 процента. Такое «социальное» сообщение обернулось в шестьдесят тысяч голосов. В среднем у пользователей Facebook в 2010 году было около 150-ти друзей, из них близкими были только десять (для территории США), и эксперты сошлись на мнении, что такие компании как цифровой «стук в дверь» могут увеличить количество избирателей на восемь процентов. Но что, если бы Facebook не ставил кнопку «I voted», а вместо этого бы просто попросил проголосовать за конкретного кандидата? Такой эксперимент предложил профессор Гарварда Джоннатан Зитрейн, назвав это феноменом цифровой избирательной географией. Например, в январе 2012 года Google заменил главную картинку в поисковике на специальный логотип, при нажатии на который можно было попасть на страницу с подачей петиции против онлайн-пиратства. В результате этой петиции появился специальный законопроект (SOPA), который расширил полномочия американских правоохранительных органов и правообладателей и ввел жесткие наказания. Проект в итоге застрял в Конгрессе и так и не был принят, но факт остается фактом, траффик перенаправлялся и накачивал петицию.

Возвращаясь к вопросам регулирования, хочу в первую очередь отметить, что все существующее регулирование не рассматривает, к сожалению, пользователей с точки зрения их жизненного цикла, не учитывает продукты с использованием алгоритмов.

Большинство стран фокусируется на создании базовой инфраструктуры для управления рисками, нежели точного управления регулированием конкретных кейсов, в том числе и те, которые привел я, несмотря на то, что каждому из них уже более пяти лет.