Глава 2. Знаки и значения. Противостояние между цифровым частным и цифровым честным. «BIG DATA. Вся технология в одной книге»

Вы – это созданная вами информация?

Как и многие из тех, кто в наши дни экспериментирует с социальными данными, по образованию я – физик. Если вдуматься, в этом нет ничего особенно удивительного: цифровые следы, которые мы оставляем в интернете или при использовании мобильных телефонов, очень похожи на «хвосты» и импульсы, которые улавливает детектор частиц. Опыт экспериментальной работы в физике элементарных частиц – действительно идеальная тренировочная база для того, чтобы в дальнейшем заниматься тем же в электронной коммерции.

В физике высоких энергий наблюдать за частицами как таковыми невозможно. Можно лишь наблюдать за их взаимодействием с созданным вами детектором. Анализируя это взаимодействие, физики приходят к выводам о свойствах частиц. Студентом-старшекурсником я работал в лаборатории физики элементарных частиц ЦЕРН под Женевой. Я занимался данными, полученными в опытах с пузырьковой камерой, в том числе изучением траектории и радиуса микроскопических пузырьков, образующихся при попадании частицы в камеру и ее взаимодействии с почти кипящей жидкостью. Пробег и размер пузырьков использовались для расчета электрического заряда и массы частицы. Этот принцип косвенного наблюдения применяется во всех экспериментах физики элементарных частиц: никто никогда не увидит бозон Хиггса, но полученные косвенные данные дают подавляющему большинству физиков основание считать, что эта частица существует.

Следы протона, создающего двадцать шесть заряженных частиц в эксперименте с пузырьковой камерой в fermilab.

Подобно элементарным частицам, люди обладают свойствами, в которых можно убедиться, лишь наблюдая, как они взаимодействуют с другими людьми и оценивают их. Это несколько напоминает главного персонажа романа Роберта Музиля «Человек без свойств» – математика, черты характера которого определяет окружающий мир. Оставленные нами следы говорят о нас очень многое, что ставит под вопрос саму возможность сохранения тайны личной жизни. Эти следы также позволяют инфопереработчикам наблюдать за нашим поведением и интерпретировать его, а затем прогнозировать наши действия и области интереса, причем вне зависимости от того, известно нам об этом или нет.

Новые социальные платформы, где мы активно делимся созданной нами личной информацией, предоставляют невиданные ранее возможности для самовыражения. Мы можем тщательно подбирать атрибуты для демонстрации своей персоны, причем не только внешние вроде прически или стиля одежды, как это происходило раньше в рамках так называемого показного потребления. Теперь происходит то, что я называю показной коммуникацией: мы можем с легкостью изменять характерные признаки своего цифрового образа, от фото в профайле до псевдонимов, используемых на разных платформах. На заре интернета нам казалось, что анонимность предоставляет поразительную новую свободу, однако смена образов не проходит даром. Желание оградить себя от риска злонамеренного использования подлинных личных данных вполне естественно, но в то же время сохранение анонимности сокращает возможности использовать эти данные с выгодой для себя.

Для многих людей инстинктивной реакцией на возможность использования их данных против них самих является требование усилить меры защиты личной информации, поскольку личная информация должна быть неприкосновенна. Однако многие из подобных мер на самом деле лишь ограничивают возможность возложить ответственность на конкретного человека. Дефицит ответственности идет вразрез с теми принципами прозрачности и свободы выбора, которые призваны помогать нам извлекать выгоду из своей личной информации. В мире социальных данных старые правила уже не работают. Экономика повсеместного создания и распространения информации требует от нас создания новых норм и идеалов.

Но прежде чем заглянуть в будущее, давайте исследуем историю такой категории, как неприкосновенность личной информации. Оказывается, само это понятие появилось относительно недавно как следствие развития технологий. И заложенные в нем принципы и стандарты неспособны обеспечить нашу безопасность в эпоху открытости социальных данных. Не надо бороться за неприкосновенность личной информации только потому, что сто лет назад подобная борьба считалась действенным способом решения проблемы.

Краткая история недолгой истории приватности

Большую часть истории человечества люди жили у всех на виду. Мы жили не только с самыми близкими, но и со всей семьей, собиравшейся вокруг домашнего очага и знавшей всю нашу подноготную. Такое «добрососедство» означало постоянное пристальное наблюдение за нами. Нарушение общественных норм влекло за собой безжалостное осуждение и сплетни, а тех, кто действительно пошел наперекор правилам, в лучшем случае изгоняли.

Вполне возможно, что первым технологическим средством обеспечения тайны личной жизни стали камины. В XVII веке они получили широкое распространение в домах европейцев, что позволило многим семьям разделить дома на отдельные комнаты со стенами и дверями, отгораживавшими людей от любопытных глаз родственников. Примерно тогда же целая серия инноваций в сельском хозяйстве изменила способы заработка на жизнь. К середине XVIII века темпы роста производства продуктов питания опережали темпы роста населения. Многие люди переезжали в города, где появлялись первые фабрики эпохи промышленной революции.

Жители городов вели обособленный образ жизни и держали двери запертыми. У этой новообретённой приватности были издержки: конструкция каминов, обычно достаточно глубоких, чтобы ставить на огонь кухонные котлы, была крайне неэффективной, и в небольших помещениях скапливался дым. Такова была цена обособленности жилья. В 1740-х годах условия наконец начали улучшаться. Не кто иной, как Бенджамин Франклин, предложил конструкцию так называемого Пенсильванского камина, который быстрее обогревал помещение и имел дымоотведение в дымоход. Наконец-то и обычные люди получили возможность захлопывать свои двери, не рискуя задохнуться угарным газом. Дом стал святая святых, местом, где люди могли рассчитывать на некое подобие приватности и покоя. Франклин и остальные «отцы-основатели» пошли еще дальше: Четвертая поправка в Конституцию США законодательно закрепила право на неприкосновенность жилища. Она запретила обыск и арест по месту жительства без наличия законных оснований.

Домашняя жизнь становилась все более частной и изолированной, чего нельзя было сказать о политической. В самых ранних демократических опытах человечества голосование являлось публичным действием. Идея заключалась в том, чтобы поощрять свободу волеизъявления обычных людей. Как рассказывает профессор истории Гарвардского университета Джилл Лепор, в первые годы существования Соединенных Штатов голосование происходило прилюдно путем поднятия рук или построения у одной из стен помещения. В штате Айова, например, до сих пор именно так организовано голосование на президентских кокусах (caucus, кокус – собрание членов или сторонников политической партии или политического движения). По мнению Лепора, «тайное голосование считалось чем-то трусливым, нечистоплотным и недостойным», компрометирующим то, что многие философы считали одним из основных элементов демократической системы – прямое и непосредственное информационное взаимодействие. Например, в 1850-х годах английский философ Джон Стюарт Милль утверждал, что тайное голосование подвержено «эгоистическим» интересам и что «нормой должна быть не келейность, а гласность». Благородный человек должен голосовать исходя из общественных, а не личных интересов, а лучшим способом обеспечить это является ответственный выбор, сделанный в обстановке открытости, иными словами – прозрачный.

В те времена, когда право голоса имели только белые владельцы недвижимости, лучшей из имеющихся технологий было использование избирательных бюллетеней, и она считалась элитарной. Бумажная форма требовала от избирателей грамотности, которой могли похвастаться не все обладатели собственности. Однако со временем бумага, как более надежный способ регистрации волеизъявления, одержала верх над взмахами рук и перемещениями тел. Сначала избиратели должны были являться на выборы с готовыми бюллетенями, заполнив их заранее самостоятельно или попросив кого-то сделать это за себя. Это упрощало процесс голосования. Однако тем, кто мог позволить себе напечатать бюллетени для других, ничто не мешало манипулировать выбором голосующих. Известны случаи использования очевидно корыстных методов ведения избирательных кампаний, когда политическая партия впечатывала в бюллетени для голосования только своих кандидатов и раздавала такие бланки и своим сторонникам, и прохожим на улицах. Бумажный бюллетень вошел в обиход не из-за возможности обеспечить конфиденциальность, а потому, что его можно было хранить. А то, что хранится, можно пересчитывать.

Первый бюллетень для тайного голосования, напечатанный властями, был использован на выборах в австралийском городке Виктория в 1856 году. Спустя еще поколение система прижилась в Британии, а американские города и штаты начали переходить на нее в конце 1880-х годов. Реформы прошли с ограниченным успехом. Явка американцев на выборы больше никогда не достигала типичных для середины XIX века значений 80 %, возможно, потому, что неучастие в выборах сейчас не влечет за собой серьезных социальных последствий.

Примерно в то же время, когда приобретало популярность тайное голосование, пара бостонских адвокатов принялась обосновывать необходимость некоего нового «права на неприкосновенность личной жизни». Считается, что впервые это словосочетание употребили бывшие партнеры по юридической фирме Сэмюэл Уоррен и Луис Брэндис в 1890 году в опубликованной в журнале Harvard Law Review статье, гневно осуждавшей эскалацию вторжения в личную жизнь граждан. Виновники? «Новейшие изобретения и методы ведения бизнеса», включая фотографии и газеты, распространяющие сплетни в погоне за тиражами. Как и многие другие изобретения, это новое «право на неприкосновенность личной жизни» появилось в целях решения собственной проблемы: семья Уоррена незадолго до этого стала мишенью нелестных и бестактных комментариев в колонках светской хроники. Дело явно происходило не в те времена, когда в Facebook размещается по миллиарду фотографий ежедневно.

Увы, в горячем стремлении оградить своих жен и дочерей от чувства неловкости перед окружающими доблестные адвокаты не увидели различия между желанием определять собственный образ во внешнем мире и правом контроля над тем, что говорят о тебе другие люди. В развитом демократическом обществе никто не ограничен в праве высказывать свои мысли и чувства окружающим, даже подозреваемые в нарушении закона. Если вы поделитесь с кем-то своей тайной, вполне возможно, что о ней узнают и другие. Пресечь подобную болтливость на законодательном уровне невозможно, но справиться с ней могли бы социокультурные нормы, особенно если сохранение тайны происходит в интересах «широкой публики». В технических кругах принято считать, что целью коммуникации является передача информации. Но внутреннее чутьё подсказало создателю Facebook Марку Цукербергу, что информации предназначено быть поводом для коммуникации между людьми.

Около ста лет назад Брэндис вошел в состав Верховного суда США, и тема права на неприкосновенность частной жизни стала одной из главных в его деятельности на этом посту. Брэндис стал увязывать право на приватность с личными свободами, ярыми поборниками которых являются американцы. Взять, к примеру, судебный спор «Майер против штата Небраска» о том, насколько законным является запрет преподавания немецкого языка в этом штате. Дело рассматривалось вскоре после окончания Первой мировой войны, когда антигерманские настроения были все еще сильны. Тем не менее в своем вердикте Верховный суд указал, что любое лицо имеет право «заниматься любыми обычными видами деятельности, приобретать полезные знания, вступать в брак, устраивать жилище и обзаводиться детьми, поклоняться Богу в соответствии со своими убеждениями и в целом пользоваться всеми правами, издавна и общепризнанно считающимися неотъемлемой частью законного стремления свободного человека к счастью» вне зависимости от места проживания. С точки зрения закона вторжение в частную жизнь было приравнено к посягательству на права и свободы граждан.

То, что мы считаем исключительно своим собственным делом, представлялось надежно защищенным от излишне любопытных глаз и злых языков. Или же нам просто хотелось так думать. Отклонения, подобные маккартизму, считались «отдельными аномалиями», когда вмешательство в политические убеждения было оправдано коммунистической угрозой. Но с развитием средств обнаружения информации и коммуникаций в интернете сложившееся понимание приватности стало претерпевать драматические изменения.

От стен к окнам

В 1996 году, когда Ларри Пейдж и Сергей Брин изучали проблему поиска в сети данных с использованием структуры перекрестных ссылок, они опирались на открытую информацию. Все страницы, просматриваемые Google, были открыты для всеобщего доступа. Кто-то создавал страницу и выкладывал ее в интернет, чтобы остальные могли прочитать написанное, а кое-кто, чтобы добавить ссылку на нее.

На разработку алгоритмов и создание собственной сети серверов требовалось немало денег, и Ларри с Сергеем сообразили, что идеальным способом заработать их будет продажа рекламы, соответствующей поисковым запросам пользователей. Рекламодатели «покупали» ключевые слова, фразы и категории, которые, как они считали, соответствуют интересам их потенциальных потребителей. Отдача была моментальной. Посещаемость сайтов рекламодателей, разместивших рекламу в Google, в том числе и на страницах с контентом, имеющим отношение к их продукции, показала четырехкратный рост по сравнению со средними показателями. Данные о поисковых запросах пользователей стали ценным товаром, поскольку давали возможность отслеживать предметы их интересов.

В апреле 2004 года Google запустила Gmail и получила еще один источник информации об объектах внимания своей аудитории. Сервис анализирует содержание писем пользователя, чтобы определить, какую рекламу вывести на его веб-интерфейс. До этого момента подавляющее большинство считало, что электронная почта – нечто вроде обычного письма, запечатанного в конверт, чье содержание предназначено только получателю. Борцы за приватность утверждали, что пользователи Gmail разглашают содержание всей своей глубоко личной переписки и делают его достоянием компании Google. Сегодня это самый распространенный в мире сервис электронной почты, которым ежемесячно пользуются более миллиарда человек. Большинству из них известно, что компьютеры Google «читают» их переписку, но взамен они имеют бесплатную электронную почту. Эта сделка, включающая и показ индивидуализированной рекламы, заключается добровольно и сознательно.

Амбиции компании Google идут намного дальше рекламы в интернете. В 2013 году был выпущен прототип устройства Google Glass – очков со встроенными сенсорами, позволяющими записывать и передавать происходящее вокруг с ракурса их пользователя. Критики выражали озабоченность тем, что Glass будут использовать для обнародования частных разговоров без согласия их участников. Но Glass – отнюдь не единственное технологическое средство, которое может быть использовано в подобных целях. Для этого прекрасно подойдут и карманный диктофон, и миниатюрная видеокамера. А можно просто вынуть из кармана мобильный телефон, который в числе прочего оборудован такими же сенсорами. Носимые устройства, к которым относится Google Glass, не надо ниоткуда доставать, чтобы запечатлеть момент, – они находятся в той же степени готовности, что и мы сами.

ЗАИНТЕРЕСОВАННЫМИ

ЛИЦАМИ РЕВОЛЮЦИИ

В ИСПОЛЬЗОВАНИИ

СОЦИАЛЬНЫХ ДАННЫХ

ЯВЛЯЕМСЯ МЫ ВСЕ

За несколько месяцев до начала работы Gmail в Гарварде запустился скромный сайт под названием Facemash. Сейчас эта история стала уже легендарной: старшекурсник Гарвардского университета Марк Цукерберг написал программу для скрейпинга фотографий из онлайн-справочников девяти общежитий, чтобы студенты могли выбирать, какая из двух случайно выбранных «сексапильнее». Сайт пользовался бешеной популярностью среди однокашников Марка и одновременно вызвал нешуточный скандал. Университет счел, что публикация фото без разрешения является нарушением авторских прав и неприкосновенности частной жизни, и выдал Марку по полной. Еще раз подчеркну: фото были использованы в новом формате коммуникаций ради удовлетворения свойственного людям стремления посудачить. Это привело бы судью Брэндиса в ужас, но тем не менее десятилетие спустя Facebook стал системой коммуникации по умолчанию для немалой части населения планеты. По состоянию на 2016 год на Facebook присутствовал каждый четвертый житель планеты, причем более миллиарда человек ежемесячно заходили туда со своих мобильных телефонов. Марк расширил границы социальных норм, и вместе с ним на неизведанные территории цифровой идентичности устремился огромный людской поток.

Разумеется, по мере своего роста компания Facebook поняла, что она, как и Google, может зарабатывать на рекламе в интернете. Содержание постов создавало даже больше возможностей для адресной рекламы, чем электронные письма. Люди указывали свое семейное положение, уровень образования, политические взгляды и религиозные убеждения; создавали списки любимых фильмов, телесериалов, книг и музыкальных произведений; отчитывались о своих путешествиях; делились мнениями об огромном количестве брендов и рекламных кампаний. Они выкладывали фото – свои, своих детей, любимых собак и кошек. Все это предназначалось аудитории друзей и родственников. Летом 2008 года я оказался в главном офисе Facebook как раз в тот день, когда компания начала размещать на сайте персонализированную рекламу. На рекламных объявлениях нового типа присутствовала кнопка обратной связи. Если пользователю не нравилось то, что ему показывают, его просили объяснить почему. Чтение поступающих отзывов стало откровением. Люди жаловались не на то, что рекламщики используют слишком много личных данных, которые они разместили в Facebook, а на то, что они используют их недостаточно. Типичный пример: «В моем профайле черным по белому написано, что я мужчина, который интересуется мужчинами. С какой стати я получаю рекламу, предлагающую «знакомства с женщинами за пятьдесят»?» Пользователи просили рекламировать то, что может им действительно понадобиться.

В 2016 году Facebook стукнуло тринадцать. Скоро мы увидим поколение, о детстве которого во всех подробностях рассказали в Facebook родители, бабушки и дедушки еще задолго до того, как детишки смогли официально открыть собственный аккаунт. В прошлом у выпускника средней школы была на руках куча документов: свидетельство о рождении, карта вакцинации, диплом и табель успеваемости. У подавляющего большинства были и водительские права. У некоторых были рекомендательные письма от работодателей или религиозных наставников, а возможно, и паспорт. Сравните тех подростков с нынешними детьми, которые подходят к пубертатному возрасту с полным набором открытой информации о себе, созданной родителями, дедушками и бабушками, тетями, дядями, старшими братьями и сестрами и друзьями семьи. Можно найти снимки УЗИ, сделанные до рождения, комментарии о трудностях воспитания малыша, молитвы о поправке здоровья и любые подробности относительно внешности, навыков и увлечений. Почему Facebook все еще запрещает заводить аккаунты тем, кому не исполнилось тринадцати? Гораздо разумнее было бы открывать страницу каждому появившемуся на свет младенцу. Это сможет обеспечить каждому уникальный общепринятый идентификатор, который можно использовать или не использовать по собственному усмотрению. Кроме того, социальные данные будут привязаны к учетной записи, что позволит людям самостоятельно определять их содержание по достижении возраста, в котором законодательство будет это разрешать.

Мы проделали путь от открытого очага, подразумевающего публичность человеческого существования с минимальными возможностями для частной жизни, до законодательного признания права на тайну личной жизни в стенах своих спален, а также конфиденциальности в кабинках для голосования. По мере вплетения интернета в ткань общественной жизни мы не огорчились тому, что наша частная жизнь будет «предана гласности» в обмен на возможность бесплатного и прямого контакта с родными, близкими и совершенно незнакомыми людьми. Период с момента зарождения понятия приватности до отказа от нее занял всего пару веков – не более чем мимолетное мгновение истории человечества.

деревенские сплетни

отсутствие частной жизни

камины и миграция в города (1600-е годы)

социальная обособленность и появление понятия частной жизни

четвертая поправка к Конституции США (1792 год) и переход к тайному голосованию (1856–1896 годы)

приватность приходит в политику

«Право на неприкосновенность частной жизни» (1890 год)

тайна частной жизни узаконена

Google, Facebook и иже с ними (наши дни)

тайна частной жизни – иллюзия, и нам нравится делиться информацией о себе

Мы заботливо оберегали свою частную жизнь на протяжении последних ста лет, но настало время признать, что ее тайна – всего лишь иллюзия. Мы хотим иметь возможность привлекать к себе внимание, ощущать себя частью чего-то большего и контактировать с людьми. Идея, осенившая судью Брэндиса, была прекрасна, но это была идея его эпохи, когда информация была скудной, общественная жизнь ограничивалась рамками местного сообщества, а коммуникации стоили дорого. Тогда было просто предотвратить публикацию своей фотографии в случае, если она вам не нравилась. Сегодня это не так. Кроме того, для демократии анонимность не является настройкой по умолчанию. Лучше создать новые нормы, учитывающие реалии настоящего и возможности будущего, чем идеализировать приватность и надеяться на то, что законы прошлого будут защищать нас и впредь. Чтобы поставить информацию на службу людям, нужны прозрачность и свобода выбора.

Вместо того чтобы тратить силы на разграничение личного и публичного и выстраивать стены, ограждающие информацию (или ограждающие от нее), давайте сосредоточимся на возможности быть самими собой. Это позволит нам в полной мере использовать инфопереработку и достичь баланса между потенциально негативными и потенциально позитивными последствиями распространения социальных данных.

Все в интернете знают, что ты собака

В том, что касается социальных данных, тайны частной жизни не существует. Ее больше нет. Подпись под знаменитой карикатурой из журнала «Нью-Йоркер» гласила: «В интернете никто не знает, что ты собака». С 1993 года, когда была опубликована эта карикатура, изменилось очень многое. Сегодня правильнее было бы сказать: «Весь интернет знает, что ты собака. Ошейник у тебя синий. Ты гоняешь кошек. А твои хозяева уехали отдыхать». Это потому, что ты сам сообщил эту информацию инфопереработчикам, чтобы иметь возможность общаться с друзьями и получать персональные рекомендации. Это твоя плата за возможность ознакомиться с рекламой кормов Purina Puppy Chow. А все думали, что в интернете можно оставаться анонимным.

Но информация была привязана к «удостоверению личности» задолго до появления Facebook. В середине 1990-х годов теоретик информатики Латания Суини решила выяснить, насколько в действительности анонимна «анонимная» база данных о состоянии здоровья. Штат Массачусетс решил, что предоставление научному сообществу информации о посещениях госслужащими врачей в клиниках соответствует государственным интересам. Не будучи совсем дураками, чиновники понимали, что передавать эти данные с указанием имен людей нельзя, и удалили ряд идентификаторов – фамилии, адреса и номера карточек социального страхования. Но поскольку статистика предназначалась для целей совершенствования системы здравоохранения, кое-какие данные о пациентах в ней оставили – пол, дату рождения и почтовый индекс. Сопоставив эти три элемента информации с другой базой данных – списками избирателей, зарегистрированных по городскому округу Кембриджа, официально доступных любому человеку за плату в двадцать долларов, Суини смогла вычислить медицинскую карту губернатора штата. После чего доктор Суини «сделала театральный жест, направив копию медицинской карты губернатора со всеми диагнозами и выписанными рецептами прямо ему в офис».

По оценке Суини, зная пол, возраст и почтовый индекс человека, можно идентифицировать 87 процентов населения США. Более поздние исследования понизили этот показатель до примерно 63 процентов – тоже поразительно много, учитывая, что это можно сделать без использования намного более точных сведений, которыми люди постоянно делятся в Facebook и на других сайтах, где собирают социальные данные. Почему для идентификации личности человека нужно столь мало информации, поясняет порядковый расчет. В США примерно 40 000 активных почтовых индексов и около 300 миллионов человек населения, из чего следует, что на один почтовый индекс приходится примерно по 7000 жителей, которые приблизительно поровну делятся на мужчин и женщин. Если предположить, что количество новорожденных равномерно распределяется по количеству дней в году, то получается, что «привязанными» к одному почтовому индексу будут по десять мужчин или женщин с одинаковым днем рождения.

Теперь посмотрим на социальные данные, которыми обычно располагает инфопереработчик. Представление о том, что человека нельзя идентифицировать по его цифровому следу, рассыпалось в пух и прах после того, как два крупнейших инфопереработчика поделились «обезличенными» социальными данными с учеными. Сначала интернет-провайдер AOL предоставил для исследовательских целей историю поиска 658 000 пользователей за трехмесячный период. Однако по чьей-то оплошности эти данные оказались в сети, и двум журналистам из газеты «Нью-Йорк таймс» удалось установить личности нескольких человек по их поисковым запросам. Это оказалось довольно просто, поскольку люди любят искать информацию о самих себе или своих родственниках или прокладывать маршруты от своего домашнего адреса. Затем интернет-видеосервис Netflix устроил конкурс на самый точный прогноз оценки, которую зритель поставит фильму, на основе анализа предыдущих оценок других пользователей. Для построения алгоритмов участникам нужны были данные, и компания предоставила «100 миллионов оценок, поставленных 480 000 клиентами, с датой каждой оценки». Имена клиентов не раскрывались, но двум ученым из Университета штата Техас в Остине, Арвинду Нараяну и Виталию Шматикову, удалось деанонимизировать людей из базы данных путем сопоставления обезличенной информации с рецензиями, опубликованными на сайте IMDB.com. В чем, собственно, проблема, если эти рецензии уже были достоянием гласности? А в том, что клиенты Netflix не выкладывают отзывы о всех фильмах, которые смотрят, и некоторые из репертуара «тайно любимых» ими фильмов были весьма показательными. По крайней мере, так утверждала истица, чье имя не разглашается, подавшая на Netflix в суд. У нее возникли опасения, что теперь каждый из 50 000 ученых, получивших доступ к базе данных конкурса, знает, что она лесбиянка.

Даже если вы спокойно отнесетесь к тому, что список просмотренных вами фильмов выложат на всеобщее обозрение, вам вряд ли понравится, если будет обнародована вся история ваших поисковых запросов в интернете. Если вы не отличаетесь от подавляющего большинства людей, то чаще всего вводите в Google Maps свой домашний адрес. Ваше место жительства, посещаемые места, покупки, люди, которыми вы интересуетесь, и проблемы, которые вас беспокоят, относятся к наиболее интимным подробностям жизни. Поисковые запросы отражают и то, что в данный момент волнует общество, и Google предлагает получить представление об этом с помощью обработанной информации на Google Trends. Многие считают, что в Trends преобладают новости, но там можно узнать и о том, что в последние пару лет возрос интерес людей к таким проблемам, как интернет-травля и трансгендер. В то же время поисков по словам «приватность» и «транссексуал» стало меньше.

Теперь представьте, что у вас есть возможность видеть чей-то поиск в режиме реального времени. В 1990-х я навещал своего приятеля из Стэнфордского университета, который работал в стартапе в области поисковых систем. Я мог следить за поступающим потоком запросов. Один из них привлек мое внимание: кто-то только что искал «как совершить самоубийство». Что делать в таком случае? Отследить пользователя по его IP-адресу через сервис-провайдера и позвонить на «горячую линию» предотвращения самоубийств? А не будет ли это вторжением в личную жизнь? Может быть, сначала попробовать внимательно изучить историю поиска этого пользователя, чтобы попробовать понять его мотивацию и более точно оценить вероятность события, которое сразу же приходит в голову при виде такого запроса? А может быть, это писатель, собирающий материал, у которого и в мыслях нет причинить себе вред? Но затем появляется следующий запрос этого человека – «мост Золотые Ворота», где покончили с жизнью более 1600 человек. И после этого вы спокойно отвернетесь от монитора и вернетесь к своей работе по улучшению качества поиска, забыв о том, что человек в опасности? Простого ответа на подобные вопросы не существует.

Схожим образом подробности о вас, а иногда и о ваших близких сообщают ваши покупки в интернете. Чтобы доставить вам заказ, Amazon нужны данные вашей кредитной карточки, в том числе ваши имя и адрес. Сообщить правильный адрес в ваших интересах, иначе посылка до вас не дойдет. В то же время история заказов может вводить в заблуждение, если в ней указаны вещи, которые покупались для кого-то еще. В Amazon можно помечать приобретаемый товар значком «в подарок», и тогда он не будет учитываться в рекомендациях для вас. Алгоритмы обработки данных могут отделять то, что вы указали как покупку не для себя, от всех других ваших заказов. Когда вы покупаете блузку в подарок женщине, то, выбирая размер, сообщаете информацию о ее комплекции. Если это происходит за одну-две недели до Дня матери, а фамилия получательницы совпадает с вашей, алгоритмы Amazon могут сделать вывод о ваших родственных связях. Возможно, что ближе к следующему Дню матери Amazon порадует вас рекомендациями подарков по этому поводу.

Страничка Your Amazon предоставляет пользователям определенную прозрачность и свободу выбора. Возможность просматривать свою первичную информацию, в том числе историю покупок, позволяет контролировать данные, которые становятся основой для выработки персональных рекомендаций. В историю покупок можно включать и вещи, купленные в других местах, причем даже приобретения, сделанные много лет назад. В 2014 году похожий подход был применен в Facebook: «Журнал действий» представляет собой список запросов друзей, лайков, историй и фото с вашими тэгами, приглашений на мероприятия и многого другого. При желании можно удалять из истории отдельные элементы данных. А поскольку ваша цифровая личность в Facebook используется для персонификации рекламы, удаление части данных позволяет влиять на то, какие предложения вам будут присылать.

Удаление одного, двух или двадцати лайков из истории действий вряд ли изменит общий характер представления о вас. Исследования Дэвида Стиллуэлла из Психометрического центра Кембриджского университета показали, что действия в Facebook действительно достаточно точно отражают черты личности пользователя. Несколько тысяч пользователей Facebook прошли тест на «Большую пятерку» индивидуальных различий (открытость опыту, сознательность, экстравертность, доброжелательность и нейротизм), а затем Стиллуэлл предложил другой группе участников опыта оценить черты характера этих пользователей исходя из их профайлов. Обе оценки оказались удивительно схожими. Обычно образ человека в Facebook довольно точно отражает действительность – люди остаются самими собой, даже когда тщательно редактируют свои профайлы в социальных медиа. Если совершенно незнакомые люди могут оценить основные черты вашего характера по ленте событий на вашей странице в Facebook, то алгоритмы тем более в состоянии это сделать. Чтобы иметь возможность держать друзей и знакомых в курсе своей жизни, придется мириться с выводами, к которым придут эти алго-ритмы.

В 2013 году Стиллуэлл, его коллега Майкл Косински и группа исследователей из Microsoft Research решили выяснить, насколько точно можно судить об интеллектуальном уровне, этнической принадлежности, политических взглядах, сексуальной ориентации и наличии наркозависимости по поведению человека в Facebook. Для этого они создали приложение YouAreWhatYouLike. По утверждению авторов, в 88 процентах случаев их модель «проводила точные различия между мужчинами гетеросексуальной и гомосексуальной ориентации» исключительно на основе лайков, причем не обязательно в темах, связанных с политикой или правами человека. По данным исследования, достоверными признаками мужской гомосексуальности были, в частности, лайки на «Косметику MAC» и мюзикл «Злая», а среди явных признаков мужской гетеросексуальности была реакция на Wu Tang Clan. Проверяя кандидатов на позицию, работодатели используют тесты на ай-кью и личностные качества. Вполне возможно, что в один прекрасный день вас попросят установить специальное приложение, чтобы оценить справедливость ваших утверждений о своей высокой организованности или стрессоустойчивости.

Данные о личных качествах могут формироваться и без активного участия человека. Один из таких примеров – несметное число фотографий, выложенных в сеть. Появление ваших изображений в интернете – вне вашего контроля, а права на них – и подавно. Если вас случайно сфотографировали во время какого-то мероприятия, идентификация вашей личности всего лишь вопрос времени. В лаборатории искусственного интеллекта Facebook, которую возглавляет Ян Лекун, разработана система DeepFace, которая может определять идентичность лиц на фотографиях с очень высокой точностью. Система пока не может самостоятельно определять имя человека на изображении, но если фото подписано, алгоритм присвоит эту подпись всем остальным фото с похожими лицами. Создается и другая программа, которая будет анализировать место действия, то есть сможет различать, сфотографированы ли вы в людном баре или на пустынном холме. В зависимости от того, где вас фотографируют чаще, система отнесет вас либо к любителям потусоваться, либо к одиноким странникам.

Научный сотрудник Microsoft Research Синтия Дворк с коллегами доказали, что сам факт существования баз данных подразумевает информационную открытость любого человека. Базы данных существуют для того, чтобы предоставлять ответы, и можно сформировать такую последовательность вопросов, утвердительным ответам на которые будет соответствовать единственный человек в базе. Обычно Синтия демонстрирует это на таком примере: сначала она спрашивает, сколько человек с признаками серповидноклеточной анемии значится в медицинской базе данных сотрудников Microsoft. Затем уточняет, сколько из них мужчин с вьющимися волосами в должности старшего научного сотрудника. Поскольку Синтия – единственный в Microsoft старший научный сотрудник – женщина с вьющимися волосами и признаками серповидноклеточной анемии, разница между ответами на два ее вопроса точно указывает на нее.

Люди предоставляют данные для переработки, чтобы получать результаты, помогающие в принятии решений. В базах данных, похожих на базу из примера Синтии Дворк, собирается относительно специфическая информация ограниченного объема. Это так называемые малые данные. Они не сопоставимы с уму непостижимым количеством «следов», которые накапливают современные центры обработки «больших данных». Чтобы получить от инфопереработчика нечто действительно полезное, надо предоставить ему точные исходные данные, например о ваших интересах и предпочтениях. Если вы не готовы поделиться этой информацией, придется удовлетвориться рекомендациями для среднестатистического гражданина, то есть тем, что пользуется популярностью или подходит большинству обывателей. Если вы предоставите неверные исходные данные, то, скорее всего, получите совершенно бесполезные результаты на выходе. Альтернатива выглядит так – незначительный выигрыш в приватности оборачивается проигрышем в полезности.

Что за псевдонимом?

Решение предоставлять или не предоставлять личную информацию влечет за собой последствия. В одной ситуации раскрытие своих идентификационных данных может оказаться рискованным или вредным; в другой ситуации то же самое может произойти, если они не предоставлены. Цифровые следы, оставленные нами, делают анонимность практически невозможной.

Тем не менее использование реальных имен на социальных платформах начало становиться нормой только с появлением Facebook. До этого обычно использовались псевдонимы. Отчасти это было обусловлено чисто техническими причинами. Некоторые имена распространены настолько широко, что в случае использования настоящих имен различать пользователей было бы невозможно; кроме того, некоторые сайты не принимали имена с большим количеством букв. В то же время были люди, осознанно не желавшие раскрывать имя, опасаясь хищений личных данных или неприятностей в связи со своими высказываниями, не совпадающими с общепринятым мнением. Так или иначе, но при желании можно было создавать разные имена пользователей или даже несколько для каждого сервиса или интернет-форума. В результате в первые десятилетия существования интернет предоставлял неслыханные ранее возможности для фрагментирования собственной персоны. А различные псевдонимы позволяли человеку исследовать новые способы взаимодействия с окружающими.

Исторически человека идентифицировали по ряду простых признаков, вроде имени, даты рождения, роста, цвета глаз, национальности и места жительства. Эта базовая информация использовалась для подтверждения того, что человек действительно тот, кем он представляется. Возможность подтвердить личность – необходимое условие выполнения многих законов и правил. Веками для доказательства права на посещение территорий использовались паспорта, а чеки и гарантийные письма служили подтверждением того, что в каком-то далеком банке у нас есть средства, достаточные для оплаты покупки. Возраст или гражданство предоставляют определенные права и обязанности по отношению к обществу, например избирательное право или право употреблять алкоголь в общественных местах, или обязанность платить налоги, или нести воинскую повинность. Мы приучены к тому, что в огромном количестве жизненных ситуаций необходимо предъявить официальное удостоверение личности или сообщить его номер, ввести пароль или ответить на ряд вопросов, диапазон которых – от количества часов, проводимых в авиаперелетах, до домашних животных, которые были у нас в детстве.

Многие из оставляемых вами цифровых следов создаются через взаимодействие с физическими устройствами, и в этом взаимодействии есть немало характерных особенностей, позволяющих вас идентифицировать. Поскольку для выхода в интернет все чаще используются мобильные телефоны и планшеты, многие инфопереработчики вкладывают значительные ресурсы в исследования возможностей идентификации личности на основе устойчивых особенностей поведения при использовании разных устройств. Самым простым способом является требование регистрации пользователя, однако существуют более тонкие признаки, например установленные шрифты. Кроме того, многим людям свойственно постоянно делать одни и те же опечатки. Эта особенность также может быть установлена.

Оставляет след и само физическое взаимодействие с устройством. Сооснователь израильской компании BioCatch Ури Ривнер считает, что цифровые «отпечатки пальцев», то есть манера пользователя работать с компьютером, планшетом или мобильным телефоном, являются «одним из способов опознания личности». BioCatch создает свою коллекцию данных, заставляя не догадывающихся об этом пользователей выполнять действия, подтверждающие их личности. Компанию не интересует, что именно вы ищете, зато ее интересует, как вы это делаете. Вы бодро ударяете по тачскрину или мягко пошлепываете по нему? Насколько сильно дрожит ваша рука с мобильным телефоном? Где именно на экране вы указываете прокрутку вверх или вниз? Как быстро вы двигаете мышкой? Предпочитаете открывать новые вкладки через ссылки или перемещаетесь между несколькими вкладками? В числе заказчиков BioCatch – банки, которым требуются дополнительные способы аутентификации клиентов. Анализ данных в режиме реального времени может быть полезен для идентификации личности и в других случаях, например, когда документов недостаточно или нет при себе в данный момент.

Детские игровые сайты и приложения вызывают целый ряд вопросов – от безопасности пользователя до адекватности контента. Самый простой пример – сайт, предлагающий игры для пользователей в возрасте от шести до шестнадцати лет, должен обеспечить правильное предложение для игроков соответствующего возраста. При этом разработчиков игр не слишком заботит, что восьмилетний ребенок может начать игру, предназначенную для подростков, – считается, что слишком трудная игра ребенка быстро разочарует, а слишком простая так же быстро ему наскучит. Ориентироваться на введенные регистрационные данные сайт не может, поскольку ребенок имеет возможность зайти на сайт с компьютера, которым пользуется кто-то из других членов семьи. Поэтому для оценки возраста пользователя сайты анализируют его взаимодействие с игрой. Часто для обеспечения безопасности в чатах игроков им оставляют только возможность использовать набор готовых фраз – это позволяет избежать риска неумышленного предоставления ребенком домашнего адреса или другой важной информации взрослому, изображающему ребенка. Оказалось, что дети старшего возраста используют другие, чем малыши, готовые фразы. Кроме того, системы игровых сайтов могут определять возраст ребенка с точностью до трех-шести месяцев по характеру движений мышью, которые тесно коррелируют с уровнем развития мелкой моторики, различной в разных возрастах.

Обмануть алгоритмы машинного осмысления, рассматривающие подобные неявные следы, намного сложнее, чем подделать явные отличительные признаки. Если вы находитесь в больнице и человек в белом халате и со стетоскопом на шее просит вас раздеться, вы, скорее всего, решите, что это врач. Но в то же время хорошо известно, что люди по тем или иным причинам порой выдают себя за других. В январе 2015 года в одном из медицинских центров штата Флорида полиция задержала семнадцатилетнего молодого человека, в течение месяца выдававшего себя за доктора. Чтобы проходить через охрану на входе, ему было достаточно белого халата и стетоскопа.

Исторически псевдонимы служили одним из средств обеспечения свободы слова. Статьи из цикла «Федералист», первая из которых увидела свет в 1787 году, содержали решительную отповедь резкой критике только что увидевшего свет проекта Конституции США. Они были подписаны псевдонимом Публий, скрывавшим авторство Александра Гамильтона, Джеймса Мэдисона и Джона Джея. Лишь немногие из участников той дискуссии выступали под своими настоящими именами. Позже англичанка Мэри Энн Эванс использовала псевдоним Джордж Элиот, чтобы не стать жертвой шаблонного снисходительного отношения к женщинам-писательницам, характерного для XIX века. В своем (тоже анонимном) эссе она отзывалась о написанных дамами романах как о «глупых, поверхностных, банальных, ханжеских или поучающих». Ей хотелось, чтобы ее творчество воспринималось всерьез, и она опасалась, что это будет невозможно, если читатели увидят на обложке женское имя.

Иногда причиной для использования псевдонима является не столько стремление к свободе самовыражения, сколько желание порвать с прошлым. В 1947 году человек по имени Ганс Фаллада (настоящее имя – Рудольф Дитцен) написал роман «Каждый умирает в одиночку» – историю немецкой супружеской четы, молчаливо сопротивляющейся нацистскому режиму. Сюжет книги был частично основан на реальных событиях: советский атташе по культуре поручил Фалладе ознакомиться с архивами гестапо и создать великое антифашистское произведение. Фалладу не сильно заботило, что его хорошо известное писательское имя будет связано с политическим заказом. Псевдоним он взял за много лет до этого: похоже, он хотел вырвать свою литературную репутацию из кольца личных проблем.

У этих знаменитых псевдонимов есть одна общая черта: обладатели хотели сделать их реальными именами с собственной репутацией. Все статьи Публия были написаны в поддержку ратификации Конституции. Все произведения Элиота и Фаллады были опубликованы под этими именами. Авторы хотели, чтобы их творчество идентифицировалось именно так.

На заре интернета возможность использования нескольких псевдонимов казалась превосходным вариантом. К сожалению, с этим была некая проблема: создать новый псевдоним легко, но можно ли быть уверенным в том, что он не связан с человеком, которого вытурили с сайта за неделю до этого? Сайт может потребовать, чтобы с каждым псевдонимом регистрировался и адрес электронной почты, но создать новый адрес тоже не проблема. Некоторые сайты отреагировали усложнением регистрационных форм, заполнение которых требовало несколько более серьезных усилий при создании аккаунта, но это не остановило мошенников, которые стали нанимать для заполнения анкет людей или использовать специальные программы – боты. Искоренить такими способами то, что экономист Эрик Фридман и информатик Пол Резник назвали «социальными издержками дешевых псевдонимов», невозможно.

В каких случаях целесообразно использовать псевдоним, а в каких – реальное имя? Это зависит от ситуации. Когда взаимное доверие требуется с самых первых шагов взаимодействия, например, когда речь идет о банковских счетах или о выпуске кредитной карточки, политика «реального имени» полностью оправдана, поскольку включает в информационное поле и историю поведения клиента в прошлом. Напротив, использование псевдонима подразумевает необходимость выстраивания репутации с нуля.

Когда я работал в Amazon, мы занимались исследованием на тему, какие отзывы пользователи считают более полезными – опубликованные под настоящими именами или под псевдонимами. Выяснилось, что отзывы зарегистрированных пользователей Amazon, опубликованные под псевдонимом, несколько реже считают «бесполезными». Мы также убедились в том, что пользователи придают большее значение отзывам, опубликованным с указанием имени автора. Даже если пользователь Amazon изменяет свое имя на сайте, то соответственно изменяются и все его подписи под отзывами как текущими, так и сделанными в прошлом, поэтому история отзывов данного человека полностью сохраняется. Идентификация реального человека с историей его отзывов всегда совпадает, в отношении комментариев под псевдонимом этого утверждать нельзя. Можно было бы настаивать на том, чтобы отзывы публиковались под реальными именами, тем более что реальность имен клиентов Amazon подтверждается данными их кредитных карточек. Но оказалось, что наиболее важным фактором является указание на то, что данный пользователь действительно купил этот товар. Люди действительно больше верят мнению реального человека, но более убедительным аргументом для них служит факт того, что товар был куплен, а не имя автора. С учетом этого в Amazon пересмотрели методику расчета средней оценки товаров, придав больший вес отзывам о действительно купленных товарах. (Кроме того, Amazon судилась с некоторыми компаниями, которые предположительно платили потребителям за «пятерочные» отзывы о своей продукции.)

У анонимности есть и недостатки. Задумайтесь о разнице между заполнением «отзыва о качестве обслуживания» в заведении, которое вы регулярно посещаете, и онлайн-опросом. Хотя отзыв на бумаге и выглядит анонимным, многие не заполняют его, и не по причине собственной лени. Люди знают, что их смогут идентифицировать по ряду признаков – почерку, языку изложения, поставленным вопросам и времени, когда была сдана карточка с отзывом. Они могут опасаться последствий, которые способны повлечь нелестные комментарии. Кроме того, анонимный комментарий по определению является «игрой в одни ворота». Диалог между сторонами, а следовательно, и возможности прояснить смысл замечания или намерения человека, или некое сотрудничество, не предусмотрены. Это позволяет получателям обратной связи игнорировать мнение под предлогом незначительности, отклонения от общего вектора, специфичности случая или отсутствия поводов для изменений. От анонимного отзыва можно отмахнуться, сочтя его корыстным или злонамеренным.

СОЦИАЛЬНЫЕ ДАННЫЕ —

САМОЕ ЦЕННОЕ СЫРЬЕ

XXI ВЕКА,

НОВАЯ НЕФТЬ

Сетевым дискуссионным форумам вроде Reddit пришлось разбираться с этими недостатками анонимности с помощью машинного обучения. На Reddit имена пользователей могут быть и постоянными, применяемыми во взаимодействии с сообществом, и одноразовыми – для единственного комментария или голосования. Каждый псевдоним получает полную свободу самовыражения, что стимулирует людей примерять разнообразные личности, выступая на платформе. Пользователей никогда не просят привязывать аккаунты к адресам электронной почты или реальным именам: создатели сайта не хотят взывать к ответственности пользователей за свои действия такими способами. Ответственность регулируется иначе. Интересный пост привлекает внимание, с ним соглашаются или спорят, добавляют комментарии или голосуют «за» и «против» уже опубликованных. Если пост или комментарий получает достаточно много голосов «против», он постепенно исчезает со страницы, уходит в самый низ рэнкинга и попадает в категорию «оценка ниже уровня», хотя при желании его можно найти и просмотреть. Сайт не выводит из обсуждения комментарии под псевдонимом, а позволяет пользователям поддерживать диалог по существу и решать, какие комментарии заслуживают их внимания, а какие нет.

Для Reddit в первую очередь важно то, что огромному числу разных людей действительно интересно содержание дискуссий на «горячих», «набирающих обороты» и «скандальных» страницах сайта, а не «официальное» авторство. Дискуссии, попадающие в список двадцати пяти топовых тем на этих страницах, обычно вызывают пристальное внимание всего интернета. Чтобы снизить уровень «фальсификаций при голосовании», когда одни и те же люди выступают под разными именами не для того, чтобы высказаться, а для того, чтобы «заплюсовать» свои посты и «заминусовать» чужие, в Reddit не стали тратить кучу денег и времени на модераторов, следящих за соблюдением порядка, а положились на машинное обучение. Когда одновременно появляется множество активных псевдонимов, идущих с одного IP-адреса или пишущих в одинаковом стиле, их «объединяют в одно производство» как «соучастников». Голоса, поданные «соучастниками», имеют меньший вес, а иногда просто игнорируются.

Честные сигналы

В 2016 году более 100 миллионов человек обратились к приложениям или интернет-сайтам в поисках знакомств для легких связей, любовных встреч или долговременных отношений. Требуется найти человека, которому нужно то, что предлагается, и обладающего тем, что нужно, и – само трудное – проявляющего ответный интерес.

В том, что касается знакомств, некоторые люди время от времени бывают кое в чем правдивы. Уровень правдивости варьируется в зависимости от характера человека и от ситуации. Иногда люди просто экспериментируют, чтобы понять, чего они хотят на самом деле. Разговоры – это одно. То, что человек делает, – другое. Сигналы, которые следуют из фактических поступков людей, социологи назвали «честными сигналами».

Дизайн пользовательского интерфейса приложения знакомств и разработка алгоритмов рекомендаций – особенно трудная задача, поскольку пользователь может «официально» считать привлекательными одни черты, а характер его работы с сайтом свидетельствовать о совершенно других предпочтениях. Один из создателей сайта OkCupid Кристиан Руддер доказал, что пользователи могут не полностью осознавать свои расовые и этнические предпочтения или не желать в них признаваться. Но простой подсчет кликов и запросов о контакте быстро выявляет такие предпочтения.

Это несколько напоминает старую проблему с оценками кинофильмов. Когда Netflix просит пользователей высказать мнение о фильмах, получивших высокую оценку критиков, вроде игрового «Гражданина Кейна» или документального «Черного плавника», огромная часть людей выставляет им «пятерки», будучи уверены, что они обязаны оценить их именно так: ведь «все» сказали, что это отличное кино. Netflix может рекомендовать клиенту фильмы на основе его оценок, но это имеет смысл только в случае, если это честные оценки. Но люди должны убедиться в том, что правдивые ответы – в их собственных интересах. В Netflix пришли к выводу, что самым честным сигналом об интересе к определенному жанру кино является продолжительность стримминга видео до момента выхода из него. Другими словами, для составления рекомендаций данные о просмотрах полезнее, чем данные об оценках фильмов. Профессор социальной психологии Мичиганского университета Ричард Нисбетт утверждает, что люди часто не понимают когнитивные процессы, определяющие их поступки и решения. Наши способности к самопознанию и самонаблюдению достаточно ограничены.

В реальности некоторые критерии предпочтений выглядят весьма неопределенно. В подавляющем большинстве случаев люди не отказывают в знакомстве тем, кто на несколько месяцев старше, чем их воображаемый идеал. Тем не менее, консультируя несколько сайтов знакомств, я обнаружил, что очень многие склонны указывать свой возраст «некруглой» цифрой в конце какого-то десятка, например двадцать девять, а не тридцать лет. Солгали ли эти люди по поводу своего возраста в момент создания профайла? Или же они скорректировали свои годы по результатам взаимодействия с приложением, выяснив, что «староваты» для пользователей, которые их заинтересовали по результатам поиска? И я задумался о том, как может повлиять на поведение пользователей возможность увидеть историю редактирования.

В ряде случаев мотив уточняющего редактирования понятен и безобиден. Например, после нескольких знакомств человек может решить уточнить раздел своих интересов, поняв, что излишне напирает на свое мастерство скалолаза и не договаривает о том, как ему нравится ходить на концерты. Аналогичным образом он может скорректировать описание объекта поиска. Исправления же более кардинальные, например частые смены статуса с «одинокого» на «состоящего в отношениях», могут вызвать неодобрение.

Вообразим себе сценарий, при котором пользователи получают возможность видеть не только историю редактирования профайла, но и историю общения на сайте. Обычная проблема приложений знакомств для людей традиционной ориентации в том, что женщин часто засыпают сотнями сообщений, в то время как некоторые мужчины вообще не получают их. Чтобы стимулировать более симметричную коммуникацию, в приложениях знакомств попробовали ограничить число сообщений, которые один человек может направить за определенный период времени. Но поскольку аудитория этих приложений ежедневно меняется (пользователи выбывают и прибывают), это верный способ вызвать ее недовольство. А вдруг девушка вашей мечты активирует свой профайл на следующий день после того, как вы исчерпали свой месячный лимит, а к моменту его возобновления снова исчезнет? Вы же не знаете причины, по которым алгоритм не показывает ее вам, – то ли потому, что вы не отреагировали на ее появление сразу, то ли она уже встречается с кем-то еще. Использование механизмов прозрачности, позволяющих выявить честные сигналы в поведении пользователя, – лучший подход по сравнению с навязыванием жестких рамок. Например, в каждом профайле может быть видно, сколько сообщений отправил и получил этот человек за последние сутки, неделю и месяц, а также средние частоту и скорость откликов. Это позволит более обоснованно решать, с кем контактировать.

Подобная информация уже используется в некоторых приложениях знакомств. Приложение знакомств для геев Jack’s предоставляет информацию о частоте откликов на входящие сообщения и описательную статистику (возрастной диапазон, этническая принадлежность, телосложение и т. п.) по людям, которыми действительно интересовался данный пользователь (а не только то, что он описывает в своем профайле в качестве интересующих его черт). Такая прозрачность позволяет пользователям лучше понимать не только имеющиеся варианты, но и свои шансы. Если интересующий вас персонаж отвечает только на 12 процентов сообщений, то, наверное, лучше потратить время на знакомство с кем-то еще, тем более что 64 процента интересующих его пользователей сообщают о своей «накачанности», а это совсем не про вас. Для получения большей достоверности о вкусах пользователей Jack’s опирается не на статистику просмотров или входящих и исходящих сообщений, а исключительно на анализ списка «Избранных», а также специальной функции, позволяющей пользователям выражать свою заинтересованность в знакомстве. Эта опция направляет информацию в базу данных только в случае взаимного интереса.

Самая богатая и более персонализированная по сравнению с этими прямыми сигналами информация, которой обладает любой сайт знакомств, содержится в истории просмотров профайлов каждым пользователем. Однако интерпретировать мотивы этих просмотров достаточно сложно. Работая с сайтом Match.com, я обнаружил пользователя, который заблокировал доступ к себе огромному количеству черных женщин. Скорее всего, это был расист, правильно? Неправильно! Посмотрев на установки его фильтра и его просмотры, мы убедились в том, что все обстоит ровно наоборот: он интересовался именно черными женщинами, причем только теми, кто описывал себя «фигуристыми». Для экономии времени и сил он блокировал пользователей-женщин, попытки познакомиться с которыми оказались неудачными. Информационным детективам приходится решать и такие забавные задачки. А способность обнаруживать интересные случаи и рассказывать о них – важная составляющая умения понимать информацию.

Чтобы правильно трактовать данные, надо встать на точку зрения пользователя. Здесь очень важна обстановка. По ходу дня наши желания меняются, или же это происходит по ходу ночи. Когда я консультировал сингапурский сайт знакомств Fridae, мы заметили, что типы профайлов, просматриваемых в два часа дня пятницы, отличаются от просматриваемых в два часа ночи субботы. В этой связи научной команде Fridae предстояло решить, как использовать эту информацию в рэнкингах, представленных на сайте.

Сайты знакомств все чаще предлагают пользователям возможность раскрыть свою «истинную сущность», стимулируя их добавлять в профайл кнопки ссылок на аккаунты в Facebook, Instagram или Twitter. Но это не значит, что случаи предосудительного поведения пользователей прекратились. Себастиан Боэр, один из специалистов по обработке данных мобильной платформы знакомств Skout, написал алгоритм фильтрации неприемлемых сообщений, под неформальным названием «гадоистребитель». Что считалось неприемлемым? Это определялось по кликам и взаимодействию пользователей. Если огромное количество пользователей блокировали кого-то определенного, то с большой долей вероятности можно было судить о том, что он – неприятный тип. А тот, кто постоянно слал безответные сообщения конкретному пользователю, явно был неприятен последнему. Со временем алгоритм научился распознавать содержание сообщений, которые обычно остаются без ответа или приводят к блокировке отправителя. Обычно в них присутствовал негатив. Очевидным признаком могли бы служить неприличные выражения, однако определение неприемлемости – значительно более тонкое дело. То, что кажется отвратительным одному человеку, может выглядеть привлекательным для другого. При выявлении закономерностей в блокировках «гадоистребитель» блокировал доставку сообщений. Кроме этого алгоритм пресекал избыточную отправку безответных сообщений какому-то конкретному пользователю. Задачей «гадоистребителя» было поддержание позитивной среды для большинства пользователей.

В начале этой главы я писал о том, как мое образование и опыт физика помогли мне в создании, проведении и анализе результатов экспериментов с социальными данными. Многие из этих экспериментов подразумевают наблюдение за тем, как изменения в порядке переработки данных влияют на изменения в поведении людей. Если пользователь приложения знакомств увидит, что объект его интереса редко отвечает на сообщения, будет ли он тратить время на написание душевного послания или переключит внимание на кого-то с большей вероятностью отклика? Что скорее заставит негодяя прекратить рассылку своих писем – просьба администратора или нулевая реакция пользователей? Где проходит тонкая грань экспериментов с идентичностью, переступив которую человек начинает выглядеть в глазах окружающих мошенником? Большая прозрачность поведения пользователей позволяет людям самостоятельно решать, насколько представленный в профайле персонаж соответствует их идеалу родственной души.

Призыв к открытости

Когда дело касается приватности и открытости, люди всегда требуют первого для себя, а второго – для всех остальных [128] .

Дэвид Брин

Чем чаще люди заходят в интернет при помощи мобильных устройств, тем более важную роль в формировании идентичности играет еще один псевдоним – ваш телефонный номер. Когда домашние телефоны только появились, соединение осуществлял оператор, который представлял звонящего и спрашивал у абонента, будет ли тот разговаривать. С изобретением дискового импульсного набора и автоматических телефонных станций люди стали звонить друг другу напрямую и, чтобы выяснить, кто звонит, приходилось снимать трубку, подтверждая тем самым возможность разговора. Однако, в связи с тем что стоимость телефонной связи оставалась очень высокой, нежелательные звонки людям домой случались очень редко. Затем, когда цены начали падать, получил распространение ставший финансово целесообразным телефонный маркетинг. Еще позднее, в 1990-х, примерно в одно время с изобретением интернета появилась система тонального набора с возможностью определения номера входящего звонка.

Изначально идея о том, что телефонный номер, а возможно, и имя звонящего станут автоматически сообщаться адресату звонка, встретила определенный отпор. Однако сейчас ситуация прямо обратная: люди не склонны снимать трубку, когда им звонят со скрытого номера. Такие звонки отправляются прямиком на автоответчик. Чтобы принять звонок, люди должны знать, кто им звонит. Притом что вам как будто спокойнее, если ваш номер неизвестен, вам так же спокойнее, когда вы знаете номера тех, кто вам звонит. Но коммуникация эффективнее, когда она симметрична, то есть когда обе стороны могут идентифицировать друг друга.

Создатель интернет-справочника телефонных номеров Whitepages Алекс Альгард считает, что телефонным коммуникациям можно придать большую прозрачность, которая пойдет на благо всем пользователям. Благодаря огромной базе данных телефонных номеров сервис Hiya (ранее известный как Whitepages Caller ID) идентифицирует все входящие звонки вне зависимости от настроек звонящего или телефонной книги вашего мобильника. В эпоху все увеличивающегося объема телефонного «спама» это особенно полезная услуга. Hiya помещает телефонный номер в какую-то категорию, например «телемаркетинг», извлекая информацию из источников в интернете и анализируя закономерности звонков с него своим подписчикам. Нам как обществу предстоит решить, обладают ли обе стороны телефонного разговора правом идентификации собеседника. При положительном ответе на этот вопрос нужно будет решить, что позволительно делать с такой информацией.

Это довольно запутанный вопрос, поскольку удостоверенная личность – необходимое, но недостаточное условие для возникновения взаимного доверия. Рассекречивание звонящей персоны является, скорее, инструментом, позволяющим призвать человека к ответственности в случае ненадлежащего поведения. Я знаю пару человек, запостивших в Facebook скриншоты того, что они считали неприемлемым поведением на сайте знакомств. В одном случае это был ответ «Спасибо, мне не интересно», в другом имело место намеренное оскорбление. Получатели вполне могли ограничиться нажатием кнопки «заблокировать», но решили поделиться примерами неправильного поведения со своими знакомыми.

На что можно рассчитывать с точки зрения приватности в коммуникациях в наши дни? Вышеупомянутые получатели нежелательных сообщений на сайте знакомств посчитали, что обнародовать эти частные сообщения было в интересах сообщества их друзей. Скриншоты служили предупреждением для других людей, которые могут пользоваться этим сайтом знакомств. Поскольку на скриншотах не были затушеваны ни имена, ни фото виновников, они стали известны всем друзьям получателей в Facebook. Схожим образом, в случае если ваш босс несправедливо обругает вас в электронном письме, вы можете переслать это сообщение своим знакомым или выложить в интернете. С точки зрения закона это может быть сочтено нарушением, поскольку письмо было конфиденциальным и предназначалось только для служебного пользования. Но в то же время распространение такого письма послужит интересам общества, поскольку потенциальные сотрудники будут лучше представлять себе условия работы в компании.

Реакция на публикацию частной переписки в некоторой степени обусловлена тем, насколько мы доверяем тому, кто это делает. Любой скриншот очень легко подделать. На форумах вроде Reddit, где основная масса пользователей анонимна, верифицировать личность автора поста маловероятно, не говоря уже о самих сообщениях. Авторы постов в Facebook обычно входят в число наших знакомых (или знакомых знакомых). А поскольку аккаунты взламывают очень редко, желание человека запостить скриншот сдерживается мыслью о том, что друзья будут считать его способным предать огласке частную переписку. При этом мы не обязаны считать скриншот настоящим. Может быть, его подделали с целью дискредитации.

После того как скриншот, настоящий или фальшивый, размещен, он становится обычным элементом информации. Любой, кому он попадается на глаза, может распространять его дальше. Что, если пост так возмутит или развеселит одного из фейсбучных френдов, что он решит расшерить скриншот своим френдам? А френд этого френда решит его твитнуть? Вы не успеете моргнуть глазом, как программа распознавания лиц идентифицирует человека и подпишет фото его именем. К тому моменту все уже будет происходить вне изначального контекста, включая и личность автора поста, но эта информация о человеке станет доступна любому интересующемуся.

Как человек сможет защищать свой образ в интернете в будущем? Один из вариантов был предложен Европейским судом, который в мае 2014 года вынес решение в пользу «права на забвение». Один испанец устал от того, что потенциальные работодатели и домовладельцы обнаруживают старую газетную статью о том, как у него конфисковали дом за налоговую задолженность, тем более что он уже рассчитался по своим долгам. Он не требовал удалить статью о конфискации. Он просто хотел, чтобы эту страницу не показывали людям, которые гуглят его имя. Суд постановил, что люди имеют право на удаление из результатов поиска тех страниц, которые, по их мнению, наносят им ущерб. В первый же день после вступления в силу решения Европейского суда Google получила более 12 000 запросов на удаление, а в течение первого года к ним добавились еще более 275 000.

Google обнародовала некоторые из запросов на удаление ссылок, полученных после судебной победы испанца. Итальянка попросила, чтобы в результатах поиска по ее имени не появлялась статья более чем десятилетней давности об убийстве ее мужа. Латвийский активист, пострадавший во время акции протеста, просил исключить из результатов поиска по его имени статью об этой акции. «Осужденный за преступление небольшой тяжести» более десяти лет назад немецкий учитель тоже просил изъять из результатов поиска сообщение о своем судебном процессе. В Google решили, что право на забвение в отношении отдельного лица важнее, чем «общественная значимость предмета». Все эти запросы восхитительны сами по себе, но должны ли определять общественную значимость предмета алгоритмы Google (или ее юристы)?

В 1890-х годах, ратуя за «право на неприкосновенность частной жизни», звезды юриспруденции Сэмюел Уоррен и Луис Брэндис особенно акцентировали фундаментальное право собственности частного лица на свою личность. Кто захочет, чтобы без его ведома на всеобщее обозрение попало компрометирующее фото? Идея заключалась в том, чтобы силой закона заставить людей относиться друг к другу по-человечески. Законодательно закрепленное «право на неприкосновенность частной жизни» должно было охранять достоинство, а не способствовать развитию свободного общества. В то время считалось, что неограниченные свободы ведут к тирании масс. Свобода была плохой штукой.

Два профессора права – Пол Шварц из Калифорнийского университета в Беркли и Карл Николаус Пайфер из Кёльнского университета – написали интересную статью о том, насколько идеи неприкосновенности частной жизни и личности могут (или не могут) служить для нас судебной защитой. Они приводят в качестве примера две книги. Первая – «откровенные» мемуары популярной американской авторессы, в которых она рассказывает о страданиях в связи с вагинальными болями и их последствиями для своего физического и психического здоровья, а также отношений с бывшим бойфрендом. Имя бойфренда в мемуарах не называлось, его личные характеристики изменены, но мужчина утверждал, что все его друзья и деловые партнеры знали об этой связи, поэтому детальные описания секса причинили ему «глубокие моральные страдания» и нанесли «серьезный ущерб его репутации». Судья согласился с тем, что мужчина был узнаваем и показан в достаточно неприглядном свете, но счел, что общественная польза от воспоминаний важнее, чем нанесенный истцу вред. Самым важным аргументом был тот, что на основе приведенных в книге деталей идентифицировать этого человека мог только очень узкий круг людей. Другая книга была издана в Германии. Это был автобиографический роман, в котором содержались прозрачные намеки на бывшую любовницу автора и ее мать. Хотя роману было предпослано традиционное предупреждение о том, что «все персонажи – плод воображения автора», немецкий судья пришел к выводу, что любой знакомый бывшей любовницы и ее матери мог узнать их в персонажах книги. В этом случае суд решил, что нарушены были лишь права экс-любовницы, поскольку ее сексуальная жизнь явно является частной, тогда как манера общения ее матери является уже общеизвестной. Право на неприкосновенность личной жизни защитило экс-любовницу от выставления ее сексуальных предпочтений на потеху публики. Тираж книги был уничтожен.

В ситуации с моими знакомыми, запостившими скриншоты с сайта знакомств в Facebook, подобные судебные решения выглядели бы едва ли не архаизмом. Давайте допустим, что скриншоты были подлинными. И как судья должен был бы сопоставлять значимость права на неприкосновенность частной жизни и права на индивидуальность? Презюмируется ли частный характер чата на сайте знакомств? Насколько важное значение могло бы иметь затемнение имени и фото человека, пославшего нежелательное сообщение?

Я рассказываю об этих судебных разбирательствах еще и потому, что критически важную роль в таких процессах играет сопоставление общественной значимости и личного ущерба. Геометрически прогрессирующий объем социальных данных предоставляет, очевидно, беспрецедентные возможности. Где грань, за которой вред для отдельного лица становится более значимым, чем общественная польза? Хотите ли вы отказаться от возможности видеть, как потенциальный объект знакомства редактировал свой профайл, только потому, что подобная информация может случайно или злонамеренно попасть к его знакомым или коллегам и повредить его репутации? По мере того как все большие объемы информации перерабатываются в целях поддержки решений в практически любых областях человеческой жизни, наличие более совершенных механизмов оценки подобных альтернатив становится настоятельной необходимостью.

Как заметил ученый и видный писатель-фантаст Дэвид Брин, кажется, будто все хотят приватности для себя и открытости для тех, с кем взаимодействуют. Но это несовместимые вещи. А поскольку приватность является иллюзией, нам следует привыкать к большей открытости. И хорошим началом для этого станет большая открытость по отношению к друзьям.

Название книги

BIG DATA. Вся технология в одной книге

Вайгенд Андреас

Глава 2

Знаки и значения

Противостояние между цифровым частным и цифровым честным