1. Нравится не то, о чем рассказывают, – нравится то, что делают
Однажды вечером я искал на сайте Netflix, чего бы посмотреть, и мне попался фильм «Победитель на деревянной лошадке» (рекомендовано было так: «Потому что вам понравились «Психо», «Энни Холл» и «Фарго»). Я покликал по сайту и обнаружил снятую в 1949 году британскую экранизацию рассказа Д.Г. Лоуренса о мальчике, который мог предсказать победителей настоящих скачек, играя со своей игрушечной лошадкой. Рассказ, как и фильм, стал для меня новинкой.
Я подумал: вот она, гениальная система рекомендаций на основе алгоритмов! У меня в голове не укладывалось, что за тайная магия помогла мне выбрать этот малоизвестный фильм с какой-то пыльной кинополки. Что связывало «Победителя на деревянной лошадке» с комедией-буфф Вуди Аллена, ужастиком Хичкока и мрачной американской готикой братьев Коэнов? И что в моей собственной оценочной активности связало воедино эту великолепную кинематографическую четверку? Что, если Хичкок мне понравился, а «Энни Холл» – нет? Тогда бы мне посоветовали что-нибудь другое?
Грейг Линден, участвовавший в создании первых алгоритмов Amazon, говорит о том, что не нужно слишком доверять им и окутывать рекомендации таинственным и зловещим пророческим ореолом. «Компьютер всего лишь осуществляет анализ действий пользователей», – поясняет он. Но даже создатели алгоритмов признают, что в будущем математические системы обещают стать еще более сложными; в сущности, могут даже появиться «черные дыры» вроде суперкомпьютера HAL, поведение которых будет невозможно достоверно предсказать или определить (по крайней мере, в меру нашего человеческого понимания).
Я иногда злюсь на рекомендации Netflix – фильм Адама Сэндлера? Да вы шутите? Но оборотной стороной доступа к огромному количеству фильмов является увеличение времени выбора, чего бы посмотреть. И понемногу пришлось признать, что в эпоху выбора, иногда сбивающего с толку, когда у меня больше нет возможности внимательно штудировать старые номера «Искусства кино» или рыться по коробкам с дисками в музыкальных магазинах, мне может быть полезно передать часть своих проблем по принятию решений и поиску чего-нибудь нового компьютеру – ведь и хранение фактов мы в основной своей массе уже передали на аутсорсинг в «Гугл».
Какое-то время я потратил на серьезную отработку своего алгоритма в Netflix. Я выставлял оценки всем просмотренным фильмам и дотошно, словно иудей Талмуд, изучал прогнозы всего, что мне может понравиться. Я хотел провести тонкую настройку этой штуки, чтобы она могла работать с моим изменчивым вкусовым профилем. Я хотел, чтобы она знала – если мне понравились «Зловещие мертвецы», это не значит, что мне понравится большинство остальных фильмов ужасов. Я хотел, чтобы система знала не только что понравилось, но и почему понравилось. Я хотел от нее большего, чем она могла мне предложить!
Так что, когда я приехал в город Лос-Гатос, штат Калифорния, в штаб-квартиру Netflix, расположенную в здании с красной черепичной крышей – оно напоминало то ли старый Голливуд, то ли гостиницу «Ла-Квинта», – в голове у меня были только звездочки. Это стало почти навязчивой идеей. Вы не поверите, сколько времени я провел, размышляя, стоит ли смотреть фильм, если его прогнозируемый рейтинг составляет 2,9 (а дистанция от 2,9 до 3,0 – ну совсем ведь маленькая!). Посмотреть фильм, рейтинг которого «единица», казалось чуть не преступлением. А когда мне удавалось обнаружить фильм, которого я не видел, но его прогнозируемый рейтинг был 4,7, я чуть не под облака взмывал от радости!
Я знал, что я не один такой: компания в рамках своего знаменитого проекта «Оптимизация алгоритма» предложила приз в миллион долларов ученым-программистам, которые смогут дать десятипроцентное улучшение для прогнозируемых рейтингов Netflix. Множество умных людей посвятили множество часов, размышляя о так называемой «проблеме «Наполеона Динамита», или что делать с фильмами, которые делят зрителей на два противоположных вкусовых лагеря и реакция на которые крайне слабо прогнозируема. Я подумал, что здесь, в Лос-Гатосе, я увижу доброжелательную «Штази» вкусов, в которой знают все о том, как люди смотрят кино, где хранится громадный массив данных о человеческих предпочтениях. Я хотел знать то, что является очень личным и что, как я думал, они мне не расскажут: насколько чувствителен этот алгоритм к оценкам – если я поставил 2,7 фильму, для которого Netflix предсказал мою оценку как 3,2, как быстро такое отклонение повлияет на мое собственное рейтинговое поле? Какой фильм обладает самым широким спектром крайне негативных и крайне позитивных оценок?
Вот почему я уже практически слышал, как скрипит мое перо по бумаге, когда уселся напротив вице-президента по новым разработкам Тода Елина в переговорной «Лучший стрелок» (все офисные помещения Netflix носят названия фильмов или телешоу) и он начал свой рассказ: «Моя первая должность в компании – директор по персонализации продукта. Я возглавил работы по получению оценок, по улучшению прогнозов на основании этих оценок; мы придумывали, где именно в пользовательском интерфейсе их надо размещать». Что ж, полет нормальный. Затем он сказал: «Со временем, при расширении области персонализации, мы стали придавать прогнозируемым оценкам гораздо меньшее значение».
Потребовалось некоторое время, чтобы до меня дошло. Меньшее значение?! Видимо, в тот момент я выглядел слегка пришибленным. Думаю, Елин почувствовал мое разочарование. Я приехал, чтобы узнать о самом сложном в мире техническом средстве прогнозирования вкусовых предпочтений в кино, а мне говорят, что вопросам вкуса – по крайней мере выраженным с помощью рейтингов – здесь придают «меньшее значение»! «Нигде во Вселенной не жмут так много на «звездочки» фильмов и телешоу, как у нас! – рассказал Елин. – И мы разработали множество алгоритмов для повышения точности этих предсказаний». Но, как он сказал, это было «последним писком» году этак в 2005-м или в 2006-м. И мои смешные вопросы о «звездочках» тут же стали ужасно отдавать стариной. Значит, вложив такую бездну времени и усилий в постройку совершенной системы рекомендаций на базе оценок, Netflix от нее отказалась?
Не совсем. «Люди по-прежнему выставляют оценки, мы считаем эту информацию полезной. Просто она – второстепенная», – говорит Елин. Случилось сразу две вещи, которые затмили пользу «звездочек». Первая, как рассказал Ксавье Аматриайн, руководитель по системе рекомендаций, – компания вплотную приблизилась к некоей конечной скорости прогнозирования вкусов. «Как часто бывает при работе с алгоритмами, – рассказал он, – 20 % времени уходит на достижение 90-процентной точности; а затем уже 80 % времени уйдет на обеспечение оставшихся 10 % точности». Было совершенно непонятно, стоит ли инвестировать в работу над этими оставшимися 10 %, что привело бы к еще большему усложнению рекомендательной системы, в которой и без того уже работала и «Ограниченная машина Больтцмана», имелись и «Случайные леса», и «Латентные размещения Дрихле», – будет ли это оправданно?
Поменялось и еще кое-что. С тех пор как Netflix объявила состязание программистов с крупным призом, компания вместо услуг проката DVD по почте стала заниматься предоставлением онлайн-услуг потокового видео. «Люди, которые давали свои оценки, отражали таким образом свой мыслительный процесс. Вы добавляете что-то в очередь просмотра, а просматриваете пару дней спустя. А затем выражаете мнение, которое возымеет эффект в долгосрочной перспективе. При потоковой передаче данных концепция совершенно меняется. Вам не нравится? Ну и ладно – переключаем и смотрим что-нибудь другое. Затрат на переключение у вас практически нет», – рассказал Аматриайн.
При оказании потоковых онлайн-услуг Netflix получает меньше формально выраженных оценок, зато имеет место косвенная информация – это поведение пользователей. «У нас появилась возможность получения данных по просмотрам в реальном времени, а это гораздо более ценная информация, чем то, что говорят сами пользователи о своих предпочтениях», – объясняет Елин. В Netflix бесконечно больше знают о том, что и как вы смотрите: когда вы смотрите, где вы смотрите, в какой момент прекращаете смотреть, что смотрите потом, пересматриваете ли. Что вы ищете – это еще один сигнал вашего вкуса. Елин заинтересованно, почти страстно мне об этом рассказывает. Он слегка тараторит, у него немного угловатый, напряженный взгляд, он лысоват – и всем своим видом напоминает гиперинформированного консультанта из магазина видеокассет ушедшей эпохи. Но только это консультант всемогущий, он знает, что крутит на своих «видаках» вся страна – и в какие моменты нажимает на «перемотку». Пусть это и выглядит как вмешательство в личную жизнь, но главный момент здесь такой: от своего вкуса не спрячешься!
Появление компаний вроде Netflix, обладающих петабайтами данных о людских симпатиях и антипатиях в виде всех этих «лайков» и «избранных», позволило бросить взгляд в до этого всегда казавшуюся непроницаемой область: как формируются оценки, как выражаются предпочтения, каковы механизмы формирования вкуса? Обширное поле сетевой активности – сетевое «сарафанное радио». Вот где абстрактные, «непостижимые» вкусы попадают в эмпирически формируемую упорядоченность Интернета, с его алгоритмами совместной фильтрации, пространными наборами данных, бесконечными отчетами по произведенным действиям. Любая отдельно взятая рецензия или отдельный «лайк» совершенно бесполезны. Тут же возникает проблема «слово не деньги», как ее обозначил Рей Фишман. И лишь на агрегированном уровне с помощью чистой математики можно отфильтровать шум, отбросить аномальные значения и достичь статистической согласованности данных.
Социологи вроде Пьера Бурдьё, посвятившие размышлениям о вкусе огромное количество времени (мы еще вспомним о нем позже), всегда сталкивались с проблемой «рассказчика»: спросить людей о том, что им нравится, совсем не то, что наблюдать за их действиями. Интернет прекрасен в том плане, что вне зависимости от того, что люди рассказывают, можно наблюдать со все возрастающей достоверностью за их реальным поведением. Практически любой из интересовавших Бурдьё аспектов человеческого вкуса ежедневно каталогизируется онлайн, причем в объемах, превосходящих любые мечты социологов. Какая музыка нравится? Посмотрите на Spotify, Pandora. Как выглядит идеальное человеческое лицо? Посмотрите OKCupid, Match.com. Какие фото нравятся больше всего? Посмотрите Flickr и Instagram.
Так что, если раньше Netflix полагался на слова людей о том, что им нравится – на этом для того времени новом основании базировались все системы рекомендаций, – теперь компания стала фокусировать внимание на том, что люди реально смотрят. «В таком подходе заключена масса преимуществ. Одно из них в том, как именно люди выставляют оценки: это делается в духе мотивации – они оценивают, что и как им бы хотелось смотреть», – говорит Аматриайн. Как рассказал Карлос Гомес-Юриб, директор по новым продуктам Netflix, «относительно высокий процент людей рассказывают, что они часто смотрят иностранные или документальные фильмы. На самом деле это не так».
В Netflix всегда подозревали об этом расхождении между людскими стремлениями и реальным поведением. Можно привести один пример: компания обладала данными по длительности нахождения прокатного DVD дома у пользователя, то есть сколько времени проходило с момента получения диска до реального просмотра. «Неудобная правда» Альберта Гора лежала без движения, кажется, бесконечно! «Этот фильм дольше всех находился по домам в ожидании просмотра», – рассказал Елин, и все остальные за столом согласно закивали. Но теперь критическое рассмотрение данных идет практически в реальном времени, чуть ли не на уровне людского подсознания: вы только что выключили фильм Бергмана и включили «Вышибалу»? Так и запишем в базу данных.
Люди, говорит Елин, «хотят о себе думать исключительно хорошо. Они могут заблуждаться по поводу собственного образа: что им, с их слов, нравится, как много «звездочек» они выставляют конкретному фильму и что они на самом деле смотрят». Вы можете поставить пять «звездочек» «Отелю «Руанда»» и две «звездочки» «Капитану Америке», но скорее всего, вы будете смотреть «Капитана Америку», говорит Елин.
Здесь нет ничего особенно нового. Еще со времен Торстейна Веблена экономисты рассуждали о видимых «сигналах» вкуса вне зависимости от того, истинные они или ложные. Они всегда стремятся выше: люди не ставят «Капитану Америке» пять звездочек, «Отелю «Руанда» – две, чтобы потом втайне пересматривать «Отель». Социолог Ирвинг Гофман дал широко известное описание нашего представления о себе в духе «драматического» действия: «Обычно продвижение вверх требует представления себя соответствующими действиями, исполнением определенных партий, а усилия продвинуться, так же как и усилия, помогающие не скатиться вниз, выражаются в жертвах, на которые вы пошли ради поддержания своего представительского переднего плана».
Всем нам когда-нибудь хотелось представляться другими, идеальными личностями. «На самом деле я – совсем другой человек, просто никак не могу собраться им стать», – писал в одной из своих пьес Эден фон Хорват. Вспомните, как в фильме «Сыграй еще раз, Сэм!» герой Вуди Аллена выкладывает дома перед свиданием на кофейный столик «умные» книги («Зачем разбрасывать книги, если ты их все равно не читаешь?» – спрашивает друг, а он отвечает: «Так создается образ!»). Данные Netflix хороши тем, что они очень личные и тайные – никто не видит, какой у вас плохой вкус или что интересненького стоит у вас в очереди на просмотр. Как сказал Елин, весь театр тут – для самого актера.
Что наталкивает на интересный вопрос, поставленный антропологом Робертом Трайверсом и его коллегой-психологом Уильямом фон Гиппелем: «Кто является аудиторией при самообмане?» Гофман писал, что люди часто пытаются соответствовать стандартам «из-за расхожей веры в то, что существует некая невидимая аудитория, которая накажет за отклонение от стандартов». Вот откуда берется чувство вины за «греховные удовольствия» – мы еще вернемся к этому вопросу позже. Если сам по себе обман является полезной в эволюционном плане стратегией, «фундаментальной во взаимодействии животных», то самообман тоже становится «наступательной стратегией, направленной на обман других особей». При демонстрации «умных» книг герой Вуди Аллена чувствует себя лучше и убеждает самого себя, будто он – та самая личность, которая читает эти книги, что, в свою очередь, поможет ему убедить в этом свою потенциальную партнершу.
Это не означает, что при взгляде на самого себя в зеркало в ситуации самообмана человек не испытывает диссонанса. Достаточно часто в Netflix раздается жалоба: «Ну почему вы мне рекомендуете все эти двух- и трехзвездочные фильмы?» Другими словами, почему вы предлагаете мне то, что мне не понравится? Но бизнес Netflix не ставит перед собой задачу превратить вас в кинематографиста. Им нужно, чтобы вы и дальше пользовались их услугами. Они работают, как казино, используя хитрую математику, чтобы вы продолжали у них играть. Они рекомендуют то, что вы будете смотреть. У них это называется «обещание». «Когда кто-нибудь ставит оценку фильму вроде «Списка Шиндлера», оценка обычно бывает довольно высокой, в отличие от оценок, выставляемых каким-нибудь глупым комедиям вроде «Машины времени в джакузи», – рассказывает Юриб. – Но если предлагать людям лишь фильмы с пятью «звездочками», «вовсе не факт, что пользователю захочется смотреть это кино в четверг вечером после тяжелого рабочего дня».
Система «звездочек» предвзята по самой своей сути. Люди избегают крайних рейтинговых значений – это называется «тенденция к сжатию». Поэтому существует большое количество оценок в две и четыре «звездочки», а единиц и пятерок – мало. Еще одно статистическое отклонение, как говорит Аматриайн, – «мы знаем, что шкала рейтинга нелинейна, расстояние от одной до двух «звездочек» не то же самое, что расстояние от двух до трех». Средняя зона, обычное «ну да», при рассмотрении в аспекте «смотрибельности» имеет довольно расплывчатые границы. Наблюдается и «целочисленная тенденция», когда люди склонны выставлять оценки исключительно целыми, а не дробными значениями.
Присвоение «звездочек» продуктам культуры само по себе странное – и даже спорное – занятие. Началось все с книг: точнее, с первого тома антологии «Лучшие рассказы 1915 года», составленной редактором Эдвардом О’Брайеном. Как он написал в предисловии, отобранные им рассказы «естественным образом разделились на четыре группы» (курсив мой. – Т. В.). Для деления была введена система «звездочек» – чем больше, тем лучше, от одной до трех (для рассказов, заслуживающих «постоянного места в нашей литературе»). Он объявил с позиции незаинтересованного критика: «На мою оценку сознательным образом не влияли никакие мои личные предпочтения или предрассудки, ни за, ни против». Система «звездочек» О’Брайена – и, разумеется, сам факт отбора «лучших» рассказов за год – подвергалась постепенно шедшей на убыль критике. Рецензируя «Лучшие рассказы 1925 года», критик из «Нью-Йорк таймс», упрекая О’Брайена в «догматичности» системы оценок, заявлял: «Огромное количество людей готово поверить во что угодно, если им об этом расскажут с изрядной долей позитива». Затем история со «звездочками» на время ушла в тень, но в итоге вновь появилась в кино, в опубликованном 31 июля 1928 года в «Нью-Йорк дейли ньюс» обзоре Ирен Сайрер, где было сказано: «С этих пор мы на постоянной основе будем выставлять фильмам оценки в виде звездочек», – что говорило о наличии этой системы, – после чего фильм «Порт пропавших девушек» был удостоен одной звезды.
С того времени люди и начали игру в «звездочки». Очевидной проблемой, возникшей в силу разницы вкусов, является то, что «трехзвездочный», по чьему-либо мнению, фильм для вас лично может стать «пятизвездочным» хитом. Вот почему Netflix четко разделяет общее количество «звездочек» и параметр «Лучшее для вас по нашему мнению». При этом во главу угла ставится вкус: этот фильм понравился вам на 0,7 больше других. И хотя можно предположить, что это точно отражает ваш вкус, дело осложняется тем, что, как и во всех рекомендательных системах, числовое значение здесь вычисляется с учетом действий других людей. Еще одной проблемой является то, что вы можете по-другому выставлять оценки – у вас может быть склонность к занижению или к завышению – вне зависимости от того, что вы в действительности думаете о фильме. «Некоторые мои знакомые очень щепетильно относятся к выставлению высоких оценок. Так что две или три «звездочки» в их случае – это совсем не плохо», – рассказал Аматриайн.
И это заставляет обратить внимание на нечто интересное в Netflix и его рейтингах. Подчиняясь традиции, появившейся в те времена, когда наше мнение формировали в основном рецензенты, имеющие собственную систему оценок, мы можем принять рейтинг и «звездочки» за твердое мерило качества – по крайней мере для нашего вкуса. Но и на индивидуальном, и на агрегированном уровне система «звездочек» Netflix вовсе не является постоянной величиной. Оценки тут напоминают скорее свободный рынок: в их мире тоже случаются поправки, «пузыри», эффект хеджирования, инфляция и иные формы статистических «шумов».
В начале 2004 года, например, в Netflix произошло «внезапное повышение среднего кинорейтинга». Неужели голливудские фильмы внезапно улучшились? Нет, улучшилась система рекомендаций. «Пользователи стали ставить больше оценок фильмам, которые отвечали их вкусам», – писал Иегуда Корень, исследователь, участвовавший в конкурсе Netflix по улучшению алгоритмов. Другими словами, фильмы стали оцениваться выше, потому что их стало выбирать больше людей, которые считали, что это хорошие фильмы. В зависимости от точки зрения можно расценивать это как нечто вроде ошибки выборки – люди, которым с большей вероятностью понравится данный фильм, ставили более высокие оценки. Либо это было достижение рыночного равновесия в области вкусов: люди получили возможность более точно выбирать фильмы (т. е. появилось предложение), которые им с большей вероятностью придутся по вкусу (т. е. на них появился спрос).
На индивидуальном уровне все еще более запутано. Попросите кого-нибудь заново оценить просмотренный фильм, и скорее всего оценка будет другой. Как показали эксперименты, путем простого изменения исходного пользовательского рейтинга можно повлиять на то, как тот же самый человек позже повторно оценит фильм. По всей видимости, люди дают другие оценки, если оценивают массив фильмов (для «натаскивания» алгоритма), а не один фильм. Телешоу люди оценивают иначе, чем фильмы. «Средний рейтинг телешоу гораздо выше, чем у фильмов», – рассказал Елин. Телевидение лучше, чем кино? «Интуиция мне подсказывает, что дело тут в выборке», – говорит он. «Кто, скажем, оценивает «Клан Сопрано»? Явно не тот, кто посмотрел пять минут и выключил, потому что решил, что ему неинтересно тратить на это время. Оценивает тот, кто увлекся и потратил на просмотр сто часов своей жизни». С другой стороны, «кто оценивает фильм «Шопокоп»? Возможно, фильм так себе, но он идет всего девяносто минут. Ваши пороговые критерии оценки могут быть совершенно иными».
Аналогично, один и тот же фильм при просмотре онлайн и на DVD может иметь разные рейтинги. «Особенно если фильм до боли правдивый», – рассказывает Елин – например, «крайне эмоциональный» фильм Спилберга. «Он на вас повлияет, но влияние может быть мимолетным. Так что, если вы оцениваете его сразу после титров, оценка может быть выше. А спустя неделю впечатление от него уже пройдет». Просмотр кино в одиночестве может окончиться более низкой оценкой, чем просмотр в компании воодушевленных друзей.
И так далее. «Я много лет играл с рейтингами», – серьезным тоном произносит Елин, напоминая в этот момент бывалого гангстера, вспоминающего свои сомнительные уличные подвиги. Я почувствовал, что в этих рейтингах ему хотелось достичь некой идеальной чистоты, найти платонов идеал того, что нравится людям. «Знаете, почему у меня осталось так мало волос? Я вырвал их, пытаясь постичь все эти вещи!» В итоге рейтинги оказались не столь уж мощным средством понять, что будут смотреть люди. Пол и география – тоже. «Хотя и это может помочь, если больше ничего не известно. Но, как только люди просмотрят на Netflix хотя бы пять фильмов, мы уже будем знать о них на порядок больше, чем пока знали лишь их возраст, пол и местожительство», – говорит Елин. Вы – это то, что вы смотрите.
Любовь к сладкому – это любовь к самой жизни.
Все эти разговоры о том, что рейтинги имеют меньшее значение, не означают, что меньшее значение теперь придается и рекомендациям. Они находятся в самом центре всей работы Netflix по совершенствованию алгоритмов и обеспечивают порядка 75 % просмотров.
Но теперь они стали гораздо менее явными. Вместо того чтобы сказать, что вам понравится, Netflix теперь в основном демонстрирует то, что вас интересует, в виде «персонализированных» блоков, которые строятся в соответствии с вашим пользовательским поведением. «Все на свете – рекомендация!» – как любит говорить Аматриайн о новом подходе «не только пять звезд». Даже поисковые запросы говорят о том, что «у нас нет того, что пользователи хотят смотреть», и это тоже учитывается системой рекомендаций. Зная, что вы ищете, можно вычислить, что вам может понравиться. Любое действие на сайте Netflix можно рассматривать в качестве метарекомендации: сайт, как и большая часть Интернета, представляет собой один обширный и постоянно длящийся эксперимент в области предпочтений, серию «А/В-тестов», в которых вы участвуете, сами не зная об этом. Если окно поиска на сайте обувного магазина будет слева, повысятся ли продажи по сравнению с вариантом дизайна, когда окно справа? А если пустить на сайте блок с названием «Зарубежные драмы 1980-х», будете ли вы смотреть больше зарубежных драм из 1980-х?
Рекомендательные блоки отражают нечто вроде «золотой середины» между двумя экстремумами сигналов, которые сами по себе не несут особой пользы: первое – то, что, как вы говорите, вам нравится. Этот сигнал может завести во вкусовой тупик, полностью забитый малоизвестными, но интересными фильмами, которые вы будете смотреть только изредка. У создателей алгоритмов это называется «чрезмерно близкая подгонка»: система дает рекомендации, которые в некотором роде чересчур совершенны – и абсолютно стерильны.
Второе – это популярность. Данное понятие противоположно «персонализации», как говорит Аматриайн; но, опять же, если вы пытаетесь оптимизировать потребление, то «скорее всего зритель будет смотреть то, что смотрят другие». А это может привести к «проблеме «Побега из Шоушенка» или к проблеме избыточно частых рекомендаций того, что все и так видели. Фильм «Побег из Шоушенка» является самым высокорейтинговым фильмом на Netflix – он настолько расхвален на сайте, что у него не осталось никакого потенциала в аспекте прогнозирования, не считая того, что он сам всем нравится. «Да, все на сайте просто обожают этот фильм», – удивляется Елин, качая головой.
Возможно, в качестве уступки неизбежной «зашумленности» человеческих вкусов Netflix при формировании рекомендаций не полагается лишь на поведение пользователей. Имеется также оплачиваемая армия людей, отвечающих за простановку информационных «тегов» и создающих лабиринты кинематографических метаданных. Чем пытаться выяснить, почему у двух человек одинаковые вкусы, зачастую проще установить, что общего у самих фильмов. А это иногда приводит к любопытным открытиям. Информация, что режиссер Педро Альмодовар может связать два совершенно разных фильма, даже когда больше ничего общего нет. Но и сами по себе метаданные могут завести не туда. Если рекомендовать «Догвилль» (фильм столь же противоречивый, как и «Наполеон Динамит») тем, кто посмотрел «Часы» или «Мулен-Руж» лишь потому, что и там и там сыграла Николь Кидман, это может привести к катастрофе.
Но метаданные также могут извлекать на свет божий то, что сами мы никогда бы не заметили. Зачастую странноватые и специфичные, надуманные жанровые подборки напоминают, как я уже отмечал, о том, что включение в некую категорию может влиять на наши предпочтения. Нам нравятся вещи, относящиеся к чему-то конкретному, даже если приходится долго думать, что это за «нечто» – как, например, фильм «Большой Лебовски». Эксцентричное деление на жанры в Netflix отражает попытку придать конкретику тому, что в ином случае выглядело бы как странный совет. «Рекомендации в таком случае могут быть не к месту. Вы скажете: «А почему это они говорят, что раз я поставил пять «звездочек» за «Зажги красный фонарь», то мне понравится этот японский детский фильм?» – задал вопрос Елин, показывая на свой лэптоп. На экране была его страничка на Netflix и массив рекомендаций: «Гоморра», «Валгалла: сага о викинге», «Вход в пустоту» и «Андалузский пес». Все эти фильмы были отнесены к жанру под названием «Галлюциногенные зарубежные драмы». «Я психологически подготовился, прочитав это, но, если бы мне показали названия без контекста, это было бы не так захватывающе», – сказал он. Как писал журналист Алексис Мадригал, «вопрос не в том, что Netflix может предложить вам то, что вам может понравиться, а в том, что он рассказывает, что это за продукция».
А то, что оба этих аспекта могут влиять друг на друга, не только одна из самых странных форм квантового сплетения, которую можно обнаружить в супермассивах данных рекомендательных систем, но и просто факт человеческого вкуса.
2. Каждый нынче критик: пусть жалуются все нытики
«Мы с мужем обнаружили это место «в стороне от проторенных дорог» вечером, когда ехали по пустынному шоссе, погруженному во тьму. Номер был слегка старомодный (на потолке зеркала, прикол!), но мы приятно удивились, что отношение оказалось отличное – в номер даже подали шампанское на льду! Но была проблема с шумом: посреди ночи нас разбудили голоса снизу из холла. Я согласилась бы с предыдущим отзывом, что «место приятное», но сомневаюсь. Ну а хуже всего оказалась процедура выселения – это совершенно неприемлемо!»
Текст выше – моя собственная смесь из двух общеизвестных произведений: песни Eagles «Отель «Калифорния» и отзыва о гостинице на веб-сайте Tripadvisor.com. «Отель «Калифорния» вы знаете, потому что вдоволь наслушались ее по радио. А если бывали на Tripadvisor.com, то после прочтения 28-го отзыва о гостинице вы уже впитали в себя все эти легкие модуляции: небрежный, доверительный тон; шуточки по отношению к другим рецензентам; образ постояльца, одновременно напоминающего и вполне обычного человека, с которым обошлись несправедливо, и оскорбленную оперную диву с завышенным чувством собственного достоинства. А затем и «но» – показательное «речевое высказывание», более известное как «жалоба». Как отметил лингвист Харви Сакс, все жалобы обычно строятся по стандартной схеме: «похвала плюс «но» и плюс что-то еще». Похвала обычно ставится в начале, словно убеждая: «Нет, это не я был неправ».
Читая такого рода отзывы, я поневоле задаюсь вопросом: куда раньше, когда еще не было Интернета, направлялся этот поток мнений? Если в гостиничном душе напор воды не соответствовал ожиданиям, то с кем, не считая не имеющей выбора аудитории на ресепшен, делились этой бедой? Впрочем, как и сегодня, обладатель негативного опыта мог просто заречься, что ноги его больше в этом месте не будет. О своем опыте можно было рассказать друзьям и родственникам, и досадная мелочь достигала еще нескольких пар ушей. Но как предупредить незнакомца, едущего по дороге навстречу, как раз в тот самый отель «Калифорния», о том, что это место не стоит своих денег?
Почти никто уже и не помнит, но во времена, когда не было ни Интернета, ни смартфонов, поесть в неизвестном ресторане означало попасть в эвристические тиски забегаловок. Присутствие в одиноком кафе большого количества дальнобойщиков или полицейских предположительно свидетельствовало о качестве здешней еды (хотя, может быть, других кафе в округе просто не было). По поводу «этнической» пищи бытовало классическое: «Мы там были единственные не-(укажите национальность)». Или приходилось проводить тревожные минуты на тротуаре, читая под бдительным взором официанта вырезанные из местных газет рецензии на пожелтевших клочках мятой бумаги, в раздумьях о том, можно ли полагаться на мнение ресторанного критика, случайно зашедшего сюда в далеком 1987 году?
Мы жили в информационно бедной среде. Для выбора гостиницы в незнакомом городе можно было полистать путеводитель. Но если в путеводителе имелось всего несколько гостиниц и он был старый? Можно было просто полагаться на бренды: я останавливался у них в гостинице в Акроне, так что можно выбрать их же гостиницу в Давенпорте. А что, если в Акроне просто наняли хорошего директора?
«Трудность отделения хорошего качества от плохого – вечная проблема мира бизнеса», – написал экономист Джордж Акерлоф. В его знаменитой «проблеме «лимонов» в качестве типичного случая информационной асимметрии был взят рынок подержанных машин: продавец знает о качестве машины гораздо больше, чем покупатель. И это может привести к тому, что покупатель будет обманут. Из-за этой опасности цена, которую имеет возможность запросить продавец, может снижаться. Бренды, с точки зрения Акерлофа, были для потребителя одним из способов «сведения счетов» с некачественными продуктами путем недопущения их дальнейшего распространения в будущем повсеместно. И сети – бренды, располагавшиеся в разных местах, – могли дать потребителю гарантии. Потребитель знал, чего ждать. Пусть эти ожидания и были довольно скромными, но это было лучше, чем обманутые надежды.
Обед в сетевом ресторане на шоссе представлял другую информационную проблему. «Потребители здесь редко из местных. Причина в том, что широко известные сети предлагают гамбургеры лучше, чем средний местный ресторан, но в то же время местный потребитель, который знает все в округе, обычно может выбрать место по своему вкусу», – писал Акерлоф.
Назовем это «проблемой курицы с лимоном». Местный потребитель, обладавший большей, чем вы, информацией, всегда питался лучше. В информационно-бедной среде можно было провести целую серию экспериментальных заходов в разные более-менее средние заведения, но так и не найти того единственного божественного места, где, как пишут в журналах о путешествиях, «кучкуются местные». Конечно, к тому времени, как там начинают «кучковаться» туристы, хозяев уже несильно заботит мнение местной клиентуры, и качество может падать – потому что мало кто из туристов заходит туда более одного раза. В крайнем случае можно было просто уйти с пустым животом; хотя иногда по уходе его прихватывало.
Появление веб-сайтов вроде Yelp! TripAdvisor или Amazon в корне изменило ситуацию. Плесень на занавеске в душе номера 224? Расскажите об этом миру! Неприметное местечко на шоссе 51, где пекут изумительные пончики? Включаем GPS, подключаемся к «контенту пользователей», и вот она, информация об уникальном опыте, о котором вы никогда не узнали бы раньше.
То, что электронное «сарафанное радио» правит целыми рынками, вне всякого сомнения. Исследование «Национального бюро экономических исследований» показало, что увеличение «средней оценки» книги на Amazon.com «повышает удельный вес» книги среди книг, представленных на сайте. Группа исследователей из Ирландии обнаружила «эффект TripAdvisor»: за два года после того, как сервис был запущен в Ирландии, агрегированные рейтинги гостиниц на TripAdvisor поднялись. Гостиницы либо начали реагировать на оценки из Интернета, либо стали стараться заработать более высокие рейтинги. Как бы там ни было, качество обслуживания гостей улучшилось. Кстати, гостиницы в Лас-Вегасе, где TripAdvisor уже давно работает, никак не изменились. В духе гипотезы «эффективного рынка» можно сказать, что вся необходимая информация о гостиницах Лас-Вегаса уже была «включена в цену» отзыва о них.
На Yelp! экономист из Гарвардского университета Майкл Люка обнаружил, что для рынка Сиэтла повышение рейтинга ресторана на одну «звездочку» увеличивает доходность заведения на 9 %. Этот эффект наблюдался «исключительно для несетевых ресторанов». Это вполне логично: поскольку сети фактически заполняют «белые пятна», где не действует «сарафанное радио», то они от него и не зависят. Что нового вы можете рассказать о сетевом ресторане, чего не знает каждый? Не будет ли всем наплевать, если вам вдруг не понравится «секретный» соус «Биг-Мака»? Именно что будет – потому что всем остальным он, по всей видимости, нравится.
Люка также обнаружил, что после того, как сервис Yelp! появился на исследуемом им рынке, сети стали уступать свои рыночные доли несетевым ресторанам. Представьте себе типичного потребителя Акерлофа в 1963 году, кушающего свой «чуть лучше среднего» гамбургер в придорожном сетевом кафе – и вдруг ему попадает в руки смартфон: он внезапно получает возможность узнать, где ему дадут отличный гамбургер! Как отмечает Люка, «польза» от похода в несетевой ресторан увеличилась. Едокам терять, кроме сетей, было нечего. Вновь сработал «эффективный рынок»: когда вся «доступная информация» уже учтена в ценах акций (или в ресторанных рейтингах), инвесторы-любители (или простые любители еды) добиваются такого же успеха, как и профессионалы. Можно даже сказать, что Yelp! и широкое обсуждение в Сети вкусов улучшило предложение сетевых ресторанов.
Но у электронного «сарафанного радио» есть и свои минусы. Вместо недостатка информации теперь можно столкнуться с противоположной проблемой: информации стало слишком много. Вы заходите на Yelp! чтобы просто узнать, стоит ли заведение своих денег. И сталкиваетесь с зигзагообразной чередой полярных мнений: то обед был «мечта», то он же – «отстой». Или вас уносит в узкий канал людских склонностей: музыка не та, какие-то экскурсы в дизайн приборов и посуды… Перелопатив кучу отзывов, вы чувствуете нечто сродни похмельной тоске. Либо вы тут же отказываетесь от похода в заведение, либо прибываете туда слегка отягощенным вымученной надеждой, словно уже там побывали и теперь должны просто отработать программу.
Читая отзывы о ресторанах, вы можете составить представление об авторах этих отзывов. Ведь так же, как и вопрос, понравилось ли им, важен и другой: а сами-то они на нас похожи? Все ищут признаки авторитета и похожего мировосприятия. Для меня, например, красным флажком является словно «клево». Не потому, что я считаю, что это слово утратило большую часть оттенков значения. Я просто меньше доверяю мнению тех, кто это слово использует (например, «клевая «Маргарита»), – и поэтому мне тоже можно меньше доверять. Слова «годовщина» или «медовый месяц» в отзыве настраивают людей на преувеличенные ожидания в «особый» вечер. Жалобы на любые недостатки ресторана или гостиницы, что подвели их в торжественный час, вряд ли будут иметь к нам отношение. Я инстинктивно меньше доверяю отзывам, написанным в слащаво-шлачном стиле гостиничных рекламных буклетов («вид за окном – словно в сказке»), а также содержащим такие пошловатые кощунства, как «дьявольски восхитительно».
Мысль, что нам ничуть не меньше, чем мнение о ресторане или гостинице, интересно, что именно говорит отзыв о самом его авторе, в принципе не нова. Раньше наш выбор формировался на базе информации, полученной от доверенных друзей либо от критиков, чьи голоса считались авторитетными. Но внезапно дверь распахнулась, и послышалось множество голосов, и ни один из них не обладает ни авторитетом, ни нашим социальным доверием. Критиков всегда подозревали в наличии собственных предпочтений и склонностей, но в Интернете в один миг расцвели тысячи критиков. Перед нами внезапно возникло целое поле движущих сил вкуса, предпочтений и сопутствующих им битв – беспорядочных, путаных и часто скрытых от глаз.
Появление целой толпы оценщиков-любителей обычно рассматривается как расцвет демократии, освобождающей потребителей от тирании индивидуалистской элиты, преследующей свои интересы и навязывающей собственные вкусы. «Вымирание института экспертных оценок происходит прямо сейчас. Кому нужен эксперт, когда любой Том, Дик или Генриетта готовы безвозмездно оценить что угодно? Не это ли и есть подлинная демократия? Меняется сама природа критики, рушится иерархия экспертных оценок», – объявила журналистка Сьюзен Мур в газете «Гардиан».
Предвестья чего-то вроде Yelp! можно усмотреть в контексте «Восстания масс» испанского философа Хосе Ортеги-и-Гассета. Толпа, как писал он, когда-то «была рассеяна по всей земле небольшими группами» и вдруг превратилась в «агломерацию», она «внезапно стала заметной», и если раньше представляла собой лишь «фон на подмостках общества», то «теперь вышла под огни рампы и стала играть главную роль». Сердитый и бесправный посетитель ресторана получил возможность вознести до небес или втоптать в грязь ресторан посредством одной лишь коллективной воли. Против такого выравнивания силы критики выступила старая гвардия. Руфь Рейхл, бывший редактор «Гурмана», озвучила девиз старой гвардии: «Все, кто верят Yelp! – идиоты. Большинство пользователей Yelp! понятия не имеют о том, что обсуждают».
Но нельзя считать, что Интернет покончил с экспертами и авторитетной критикой – все гораздо сложнее. Например, много сил при оценках на Yelp! тратится на попытки убедить всех в своих честных намерениях. Человек, оставивший отзыв на индийский ресторан в центре Манхэттена, представил аж тройное свидетельство, что он имеет авторитет: «Я вообще люблю поесть и моя любовь к индийской кухне (поскольку я родом из Индии) просто огромна. В этом ресторане я обедаю не реже раза за неделю. Воистину, новый микс ингредиентов, и при этом крайне аутентично». Он не просто гурман, но индийский гурман, который, как и все настоящие ресторанные критики, ел здесь не раз. И это не говоря уже о противоречивом слове «аутентично». Как оно ни обтекаемо, слово «аутентичный», оно (как и его синонимы) дает более высокие рейтинги ресторанам на Yelp!.
Сайт Yelp! кишмя кишит такого рода сигналами – в экономике они называются «отсылками», это тонкие отсылки на право возвыситься над массой авторов аналогичных отзывов («Я знаком с шеф-поваром по его предыдущему проекту» или «Из всех ресторанов хенаньской кухни, где я бывал, этот самый лучший»). Это «схематичная сигнализация»: в самом сигнале помимо того, о чем вы говорите, нет ничего, что позволило бы проверить сигнал. Если вы носите майку с надписью «Я (здесь нарисовано сердечко) Нью-Йорк», кто усомнится в вашей любви? На такой сигнал потрачено не слишком много денег или энергии, поэтому он имеет низкую достоверность. И что вообще мешает этим сигналам полностью утратить достоверность? Как утверждает Юдифь Донат, честность таких сигналов фактически гарантируется лишь тем, что «крайне низка мотивация подавать их нечестно». Столь же низкая мотивация сомневаться в их правдивости. Но как можно быстро оценить качество оценки в Сети, где царствует анонимность и где, как утверждает Донат, «все – сигнал»?
Собрав свои демократические толпы, сам же сервис Yelp! стремится вновь ввести иерархию путем ввода класса «элитных» оценщиков. У них имеются значки – это один из видов сигналов, – и их выбирает команда, известная под названием «Совет». «Мы не рассказываем, как это происходит», – объявил представитель Yelp! словно описывал тайный наем инспекторов «Мишлен». И это несколько парадоксально. В сегодняшнем мире, как говорят, традиционный авторитет экспертов – начиная с прессы и заканчивая правительством и Минздравом – ставится под сомнение. Но получается, что оценочные интернет-сервисы (причем на Amazon уже появилась категория «Главный оценщик», а на TripAdvisor – «Главный участник») просто создают новую форму экспертизы и формируется странный феномен «непрофессиональной экспертизы»?
Доверяем ли мы этому новому классу экспертов? Когда вы смотрите в Интернете отзыв о ресторане, гостинице или книге, вы обращаете внимание просто на общее количество «звездочек» или забредаете дальше, в чащу мнений отдельных пользователей? Если сила сетевого «сарафанного радио» происходит от возможности представления в количественной форме всей массы коллективного мнения, что избавляет от узости точки зрения отдельного индивидуума, то в чем же ценность отдельно взятого отзыва, стоит ли с ним знакомиться?
В своем исследовании Yelp! Люка приводит примеры «байесова обучения». Другими словами, люди интенсивнее реагируют на отзывы, в которых содержится больше информации. Элитные оценщики с Yelp! обнаружил он, имеют статистически вдвое большее влияние, чем неэлитные. Еще одной группой, обладающей гипертрофированным влиянием на Yelp! оказались пользователи сетевого сервиса скидок-купонов Groupon. Как показало исследование, пользователи Groupon, попав на Yelp! писали более длинные отзывы, чем средний пользователь Yelp! – а такие отзывы нравятся больше. Подобное влияние обладает серьезным весом: оно приводит к тенденции снижения средней оценки ресторана. Любопытно, что тому виной не критика как таковая. На самом деле пользователи Groupon на Yelp! как отмечают авторы, высказываются более «умеренно».
Концепция масс, освободивших объекты критики от тирании критиков, омрачается тем, что большое количество оценок имеет заметную тенденцию к мелочному произволу. Читая на Yelp! или TripAdvisor отзывы, особенно из категории «однозвездочных», сразу чувствуешь некий личный интерес к сведению каких-то счетов. Хостесс «неправильно» посмотрела на группу девушек, решивших устроить «девичник»; официант без всякого энтузиазма воспринял милые шалости карапуза; «оценивающая мина» подавальщицы; слишком/ не слишком экспансивно приветствовали; официант по виду был «явно недоволен тем, что он просто официант», – и любые другие случайные эпизоды (все это реальные примеры, которые я нашел на сайте), не имеющие никакого отношения к еде. Это скорее трудовые споры между деньгами гостей и их же бесконечно субъективными ожиданиями, что они за эти деньги должны получить.
И поскольку экономика сферы обслуживания сегодня крутится вокруг «эмотивного труда» – вспомните искусственные улыбки, которыми многие работники обязаны встречать «гостей», – оценки «продукта», в свою очередь, становятся все более субъективными и межличностными. Журналист Поль Майерскауф заметил: «Современный труд все более сводится не столько (или не только) к производству вещей, сколько к передаче вашей энергии, физической и эмоциональной, при обслуживании других людей». Для тех, кто считает, что он не получил нужную долю эмоциональной энергии, Yelp! становится местом, где можно включить в общий каталог все свои жалобы. А откуда нам знать, не был ли оценщик в тот день банально в плохом настроении?
На самой границе проблемы доверия к сетевым отзывам лежат настоящие ложные отзывы: оставленные конкурирующим рестораном, завистливым писателем, лжепостояльцем гостиницы. Примерно четверть всех отзывов на Yelp! не проходят через фильтры аутентичности сайта. Большинство таких фальшивых отзывов, как выяснили Люка и Гергиос Зервас, имеют тенденцию следовать предсказуемым шаблонам. Чем хуже репутация ресторана или чем меньше отзывов, тем выше вероятность появления фальшивого положительного отзыва. Когда рестораны относятся к одной категории (например, тайские или вегетарианские) и близко расположены, есть большая вероятность фальшивого негативного отзыва. Аналогичные шаблоны отмечены на TripAdvisor.
Иногда причина обмана совершенно неясна: в исследовании Эрика Андерсона и Дункана Саймистера, проведенном на одном из сайтов по продаже одежды, было обнаружено, что 5 % всех отзывов было оставлено пользователями, которые в реальности не приобретали оцененную вещь (но приобрели на сайте много других вещей). Такие отзывы имеют негативную тенденцию, а авторы, представлявшиеся покупателями, фактически действуют как «бренд-менеджеры» – это одна из форм потребительского «ответа», описанная Акерлофом.
Но какова бы ни была причина подобных действий, как отличить ложную оценку? Прочтите отрывки из двух отзывов:
«Я не раз останавливался в гостиницах как в командировках, так и на отдыхе, так что могу честно заявить: «Джеймс» – лучший! Обслуживание первоклассное. Номера новые и очень удобные…» «Мы с мужем остановились в чикагской гостинице «Джеймс» на годовщину свадьбы. Место просто фантастическое! Как только приехали, сразу поняли, что сделали правильный выбор! Номера ОТЛИЧНЫЕ, персонал внимательный и вежливый!»
Когда вам впервые довелось попробовать пиво (или виски), вы вряд ли хлопнули себя по коленке и воскликнули: «Эх, и почему я раньше этого не пробовал?» Скорее всего вы подумали: «Неужели людям это нравится?»
Как выяснилось, второй отзыв – фальшивка. Группа исследователей из Корнелльского университета создала обучаемую вычислительную систему, которая с вероятностью 90 % может определить, настоящий отзыв или нет. Точность гораздо выше, чем обычно показывают обученные люди; мы ведь помимо иных проблем страдаем и от «склонности верить» – желания думать, что люди не лгут.
При создании алгоритма команда из Корнелльского университета в основном полагалась на десятилетний опыт исследований особенностей речи в неформальной беседе. В «придуманных отзывах» люди имеют тенденцию к меньшей аккуратности в деталях – поскольку на самом деле этого опыта у них не было. Выяснилось, что фальшивые отзывы о гостиницах содержат менее подробную информацию о таких вещах, как размер и расположение номера. Лгуны чаще используют превосходную степень («самый лучший», «хуже некуда»). Поскольку ложь требует больших усилий от головного мозга, фальшивые отзывы обычно короче. Когда люди лгут, они также проявляют тенденцию к большему (по сравнению с существительными) использованию глаголов, поскольку рассказывать о том, что вы сделали, проще, чем описывать то, что было. Лгуны меньше тех, кто говорит правду, склонны использовать личные местоимения – предположительно, чтобы увеличить «дистанцию» между собой и актом обмана.
Но разве в вышеприведенном примере фальшивки мало личных местоимений? На самом деле команда из Корнелльского университета обнаружила, что авторы фальшивых отзывов больше говорят о себе, чтобы отзыв звучал правдоподобнее. Любопытно, что исследователи отметили: люди меньше использовали личные местоимения в негативных отзывах, чем в позитивных, словно создание дистанции важнее в случае, когда ложь имеет негативный оттенок. Можно утверждать, что в целом лгать в Сети гораздо проще, поскольку отсутствует межличностный контакт и ограничения по времени, когда необходимо срочно что-то придумать прямо на глазах у собеседника. Но насколько проще? Когда я загрузил свой придуманный отзыв на «Отель «Калифорнию» в веб-сервис, созданный одним из членов команды Корнелльского университета, отзыв был признан «настоящим».
Фальшивые отзывы существуют и, бесспорно, влекут за собой экономические последствия. Однако огромное внимание, которого их удостаивают средства массовой информации, и энергия, направляемая на автоматическое вычисление ложных отзывов, может ввести в удобное заблуждение, будто все остальные отзывы – «чистая правда». Но хотя в них может и не быть сознательной лжи, существует множество ситуаций, когда они дают искаженную картину, когда они тенденциозны, расплывчаты и тому подобное.
Первой проблемой является то, что мало кто пишет отзывы. У одного из крупных игроков рынка онлайн-торговли отзывы писали менее 5 % покупателей – едва ли это демократично. Первые отзывы на продукт всегда отличаются от отзывов, которые оставляют, присоединяясь к общему хору через год, хотя бы потому, что существующие отзывы влияют на последующие. Даже просто факт покупки именно в этом месте может настроить вас позитивно; людям, которые оставляли оценки, но не покупали книгу на Amazon, как выяснили Саймистер и Андерсон, с удвоенной вероятностью книга не нравилась. И, наконец, пользователи часто пишут отзывы в силу того, что позитивный или негативный опыт был из ряда вон выходящим. Поэтому отзывы имеют тенденцию к «бимодальности» – они не равномерно распределяются по шкале рейтинга, а демонстрируют пики у самой верхней и самой нижней отметок шкалы. Это так называемое «J-образное распределение», или, более красочно, «феномен хвалить – журить».
Кривая именно J-образная, а не обратной формы (не в форме «леденца») благодаря еще одному феномену сетевых рейтингов: это так называемая «положительная тенденция». На Goodreads.com средний балл 3,8 «звездочки» из пяти возможных. На Yelp! как обнаружил один аналитик, оценки страдают «искусственно завышенным средним значением». Средний балл всех оценок на TripAdvisor – 3,7 «звездочки»; когда аналогичные предложения появляются на airbnb, оценки еще выше, поскольку там хозяева гостиниц имеют возможность ставить ответные оценки гостям. Аналогично на eBay практически никто не оставляет негативных отзывов отчасти потому, что там идет один из вариантов игры «Ультиматум»: и покупатель, и продавец могут поставить друг другу оценки. Положительная тенденция была столь безудержной, что в 2009 году eBay перестроила свою оценочную систему. Теперь продавцам, чтобы доказать, что они отвечают «минимальному стандарту обслуживания» на сайте, нужно не только достичь определенного порогового значения в «звездочках», но и получить определенное количество негативных отзывов. Чтобы быть хорошим, надо быть немного плохим.
Несколько лет назад на YouTube возникла проблема: все стали оставлять оценки в пять «звездочек». «Похоже, что оценки все ставят по принципу «Все или ничего»!» – появился комментарий в блоге сайта. Рейтинги, объяснила техподдержка сайта, использовались в основном просто как «лайк», а не как «редакторская пометка» об общем качестве (второй по популярности оценкой стала одна «звездочка», которую ставили все, кому не понравился ролик). Столкнувшись с этим общим тенденциозным и практически бессмысленным в плане статистики режимом, техподдержка переключилась на формат рейтинга «понравилось / не понравилось». Но и у бинарной системы есть свои недостатки. Ролик с «котиком», в котором демонстрируется обычный забавный котенок – скажем честно, уровень довольно низкий, – получает ту же оценку, что и самый смешной на свете ролик с «котэ». Но в эвристическом и молниеносном мире Интернета, где информация стоит дешево и стоимость переключения стремится к нулю, людям может быть просто не нужна система оценки, занимающая времени столько же, сколько и само потребление. Так что все «лайки» одинаковы.
А еще существует действие по оценке оценки или самого оценщика. Самые полезные отзывы в действительности побуждают людей покупать, особенно если речь о продуктах «длительного пользования». Но и у таких отзывов есть собственные странности. Самые первые отзывы получают больше оценок «было полезно», и чем больше у оценки оценок, тем больше оценок она привлекает. На Amazon оценки, которые получили больше оценок «было полезно», помогали увеличивать продажи вне зависимости от того, сколько «звездочек» они давали продукту.
Что же делает отзыв полезным? Команда из Корнелльского университета и исследователи из «Гугл», изучив поведение оценщиков на Amazon.com, обнаружили, что рейтинг «полезности» отзыва снижается, как только данный отзывом рейтинг выходил за пределы среднего количества «звездочек». Определение «полезности» отзыва само по себе сложно: помог ли этот отзыв кому-то совершить покупку или его отметили за то, что он говорил противоположное тому, что говорили другие? Для того чтобы это исследовать, ученые идентифицировали отзывы, текст которых являлся плагиатом; это «цветущая буйным цветом» практика на Amazon, как отметили они, и один и тот же текст используется для разных продуктов. В выявленных парах они обнаружили, что в случае, когда отзыв по своим «звездочкам» был ближе к среднему значению всех отзывов, его считали более полезным. Другими словами, вне зависимости от реального содержания отзыв считался тем лучше, чем больше он соответствовал тому, что сказали другие люди.
Вкус – это социальное сравнение. Тод Елин в Netflix говорил мне: «Вам доводилось видеть людей в незнакомых ситуациях – например, «пришел в театр на оперу, раньше не бывал»? Люди смотрят вправо, смотрят влево, оглядываются. А это хорошая опера?» Когда представление заканчивается, встанет ли человек и присоединится к овации, зависит в равной степени и от того, что будут делать люди вокруг, и от того, понравилось ли представление личноему. И наоборот: если мы не видим, что выбирают другие, мы с большой вероятностью делаем иной выбор.
Неудивительно, что в социальных сетях, где мнение множества распространено повсеместно и его невозможно избежать, наблюдается то, что профессор факультета управления Массачусетского технологического института Синан Эйрел назвал «склонностью к общественному влиянию». Эйрел и его коллеги поставили перед собой задачу узнать, существует ли зависимость между широко распространившейся положительной тенденцией в рейтингах и ранее оставленными оценками. Какая доля в оценке «четыре с половиной звезды» зависит от самого ресторана и какая – от ранее оценивших его в «четыре с половиной звезды» людей? Приведет ли первый «лайк» фото в «Инстаграм» к большему количеству «лайков», чем у фото без единого «лайка»?
Поэтому Эйрел с коллегами придумали умный эксперимент и поставили его с помощью сайта – агрегатора социальных новостей в стиле digg.com, где пользователи размещают статьи, делают комментарии к статьям, а затем жмут на кнопку «нравится» или «не нравится», оценивая эти комментарии. Исследователи поделили около 100 000 комментариев на три группы. Была «позитивная» группа, в которой комментарии были искусственным образом усеяны голосами «нравится». Была «негативная» группа, где комментарии были отмечены как «не нравится». В контрольной группе комментариев не было.
Как и на любом другом сайте, все началось с положительной тенденции. Люди были сразу в 4,6 раза более склонны голосовать «нравится», чем «не нравится». Когда первый (искусственный) голос был «нравится», это приводило к еще большему каскаду позитива. Положительным с большой вероятностью оказывался не только следующий голос, но и все остальные, шедшие вслед за ним. Когда первый комментарий оказывался негативным, следующий комментарий с большей вероятностью также был негативным. Но с течением времени весь этот негатив «нейтрализовался» противоборствующей силой позитивных отзывов, словно на помощь всегда спешила лихая кавалерия.
Что же происходило? Исследователи говорят, что сами по себе голоса «нравится» / «не нравится» не привлекали людей, которым нравится голосовать за или против. Просто наличие рейтинга у комментария подталкивало голосовать большее количество людей – и голосовать даже более позитивно, чем можно было ожидать. Люди, отзывавшиеся «негативно» на контрольные комментарии (на те, у которых не было рейтингов), проявили склонность к положительной тенденции в случае с комментариями, которые получили пометку «не нравится». Как описал Эйрел, «мы склонны присоединяться к положительному мнению и сохранять скептический настрой по отношению к негативному».
Ставки в этой игре гораздо выше, чем несколько кликов на сайте Digg.com, на время поднимающих статью на гребень волны. Первый же положительный отзыв, правдивый или ложный, будет давать легкую рябь во всех следующих отзывах. Исследование Эйрела продемонстрировало, что позитивно заряженный отзыв увеличивает общие оценки на 25 % и этот результат является постоянным. Первые положительные отзывы создают эффект зависимости от предшествующего развития. И даже при удалении ложных отзывов ущерб сохранится, поскольку они уже повлияли на правдивые отзывы. «Эти рейтинговые системы якобы предназначены для того, чтобы демонстрировать непредвзятое совокупное мнение множества, но это лишь иллюзия», – говорит Эйрел. Но, как и в случае с театральной овацией, услышим ли мы свое мнение в реве толпы?
Все это не означает, что рейтинги, которые подталкивают в положительном направлении, всегда растут. В реальности на таких сайтах, как Amazon, где были обнаружены схемы типа «склонность к последовательности», среди оценок книг со временем наблюдается общая отрицательная тенденция. «Чем больше оценок получает продукт, тем ниже будут оценки» – как было отмечено в одном из исследований. Amazon от рассмотренных в эксперименте Эйрела «однокликовых» оценочных механизмов отличает более высокая цена выражения мнения: там нельзя просто заявить, что вам что-то нравится или не нравится – нужно еще объяснить причину.
И это, похоже, влияет на поведение. Как обнаружили исследователи из лаборатории Hewlett Packard Фанг Ву и Бернардо Губерман при исследовании комментаторов на Amazon, в противоположность наблюдаемым на сайтах типа digg.com эффектам «стадности и раскола, на сайте Amazon комментаторы, по всей видимости, реагируют на предыдущих комментаторов экстремального толка. Тот, кто пишет отзыв вслед за отзывом с «однозвездочной» оценкой, может счесть нужным «сбалансировать» эту оценку своими «тремя звездочками», хотя на самом деле хотел бы поставить две «звезды». Такая реакция на экстремизм может со временем привести к «смягчению» мнения.
Одна из причин, как предполагают исследователи, это врожденное желание выделиться из толпы, действительно повлиять на результат или повысить чувство собственной значимости. «Зачем писать еще один «пятизвездочный отзыв», когда это уже сделали сто человек?» – спрашивают Ву и Губерман. При рациональном подходе смысла в этом нет – точно так же, как и в ситуации «парадокс избирателя», когда рациональный смысл голосования на выборах крайне мал, поскольку один-единственный голос не повлияет на общий итог (хотя, в отличие от выборов, есть данные, что свежие отзывы влияют на продажи). Поэтому по прошествии времени те, кто делится мнением, демонстрируют тенденцию не соглашаться с предыдущими мнениями.
Легко представить несколько этапов эволюции рейтинга книги на Amazon. Первые отзывы пишут люди, которых книга сильно заинтересовала (я уж не говорю о друзьях и родственниках автора, а то и о самом авторе) и которым она скорее всего понравилась.
Вкус – это вообще самостоятельный выбор. Но, после того как выскажут мнение поклонники писателя и другие мотивированные потребители, через какое-то время книга может привлечь к себе более широкую аудиторию с «более вялыми предпочтениями», как рассказывают исследователи Даниэль Годес и Хосе Сильва. Будут ли это более нелицеприятные и справедливые критики или они не «поймут» эту книгу в ключе прежних оценок, мнения начнут разделяться. Для многих книг включается то, что назвали «движущей силой недолета»: период, когда оценки отзывов ниже, чем будет впоследствии средняя оценка, поскольку читатели, на которых повлияла первоначальная «положительная тенденция» отзывов, делают ошибочные покупки. После чего высказывают свое мнение, порождая эффект «Не верьте рекламе!». В отзывах формируется обратная связь. «Чем больше отзывов, тем ниже качество доступной информации, что приводит к ошибочным решениям и более низким оценкам», – рассказывают Годес и Сильва. Часто случается обнаружить поздний, искренне недоуменный отзыв с оценкой «одна звездочка» и комментарием из единственного предложения: «Мне просто не понравилось».
Чем больше появляется отзывов, тем меньше времени люди тратят на обсуждение содержания – потому что об этом уже много сказано другими – и начинают обсуждать содержание чужих отзывов. При упоминании в отзыве другого отзыва растет вероятность, что отзыв будет негативным. Контекст побеждает.
И мы снова возвращаемся к Эйрелу. Можно ли уверенно определить, что отзыв подвергся влиянию предыдущего отзыва? Или просто подействовал закон притяжения: произошла корреляция групповых предпочтений и, проще говоря, «рыбак рыбака увидел издалека»? Эйрел приводит пример социолога Макса Вебера: когда в поле вы замечаете группу людей, открывающих зонтики, потому что начинается дождь, вы не говорите, что они друг на друга влияют. Просто люди реагируют на эндогенные условия, и происходит корреляция группового предпочтения не намокнуть. А если человек открывает зонтик, когда дождя нет, и при этом другие люди начинают делать то же самое, то уже можно говорить об общественном влиянии.
Пытаться выяснить, что происходит в мире сетевых отзывов, как и вообще в мире вкусов, – дело весьма хлопотное; Эйрел потратил на это десять лет. Там, где я живу, все ездят на «Субару». Люди покупают «Субару» потому, что видят вокруг множество «Субару», или владельцы «Субару» – какие-то особенные люди, которым, так уж получилось, нравится место, где я живу? Мои соседи в основной своей массе стройны потому, что на них влияют окружающие, следящие за фигурой, или мой район притягивает стройных людей? Единственный путь узнать – выбрать случайных людей по всей стране, которые совершенно необязательно хотят переехать в Бруклин, и поселить их здесь.
К этому вопросу мы еще вернемся в следующей главе, а пока давайте подумаем о том, что происходит на сайтах вроде Amazon по мере накопления отзывов. Как показали Годес и Сильва, чем больше отзывов, «тем больше отличается новый покупатель от предыдущей группы, оставившей отзывы». Другими словами, здесь начинают играть роль вкусы. Люди выражают свое разочарование книгой, но пишут и о восторженной реакции на нее других людей. Выступая против того, что не понравилось, они в такой же степени – а это уже тревожный сигнал – выступают и против людей, которые, очевидно, не похожи на них.
Как утверждал французский социолог Пьер Бурдьё, «вкусы (то есть выраженные предпочтения) являются практическим заявлением о неизбежном различии. Не случайно, когда о них приходится судить, оценка всегда дается сугубо негативно, путем отрицания других вкусов».
Когда речь заходит о вкусах применительно к чему-то заметному, диссонанс может быть еще резче. Если книга – особенно роман – награждается какой-то известной премией, то отзывы читателей о ней на принадлежащем Amazon сайте оценок Goodreads действительно становятся более негативными. Балаш Ковач и Аманда Шарки, выполнившие аналитическую работу, назвали это явление «парадоксом публичности». Дело не в том, что жюри не может выбрать хорошие книги, и не в том, что читатели не могут оценить книги по достоинству. В действительности книги, которые попали в шорт-лист конкурса, обладали более низкими оценками, чем книги, которые конкурс выиграли, – но до того, как были объявлены результаты конкурса. Как только на книге появился стикер «Удостоена приза», ее рейтинг пошел на спад, причем более резко, чем рейтинги книг из шорт-листа, которые обошла победившая книга.
С чего же такая негативная реакция на явный знак качества? Премии могут увеличить продажи книг, но это палка о двух концах. Премии, как отмечают исследователи, завышают ожидания: теперь эта книга не просто может понравиться, она уже должна понравиться! Премии также привлекают читателей, чьи вкусы не соответствуют вкусам тех, кто оставлял отзывы до того, как книга удостоилась премии. И это прямо противоположно тому, что происходило на Netflix в начале 2000-х, когда вверх поползли рейтинги всех фильмов на сайте: фильмы не стали лучше, просто улучшились алгоритмы. На Goodreads, когда книга «становится лучше», получив премию, к ней привлекается внимание потенциально не совсем подходящих для нее читателей – они слетаются, словно мотыльки на свет.
Неудивительно, что их надежды часто не оправдываются. Возможно, происходит то же самое, что и с пользователями Groupon на Yelp! – привлекаются более непритязательные потребители по не совсем «естественной» причине. В отличие от плавного распределения мнений, которое наблюдается применительно к обычным книгам на Amazon, «удар» от премии провоцирует всплеск полярных мнений: появляется не только больше отзывов с одной и двумя «звездочками», но и количество «лайков» у этих отзывов, как рассказал мне Ковач, «растет с бешеной скоростью». С мертвой точки процесс сдвигают не те, кто пишет отзывы со средними оценками, а контингент с позицией «ну да». Ненавистники, как и раньше, ненавидят. Но при этом ненавистники еще и оценивают!
После анализа порядка 30 000 отзывов исследование выявило давно известный факт: можно нравиться и критикам, и большинству читателей, но очень редко – сразу и тем и другим. Даже старые поклонники писателя могут ополчиться на новоявленную популярность, которую завоевал «только их» прежний любимец. Прославившийся своим сарказмом продюсер и панк-рокер из Чикаго Стив Альбини однажды так описал то, что происходило в период, когда его, на тот момент малоизвестная, группа Big Black завоевывала популярность: «Как только группа приобретает известность, на концертах начинают появляться люди, у которых совсем другие заморочки – они приходят вечер провести, понимаешь?» Эти люди не только равнодушно относятся к группе, говорит он, но и вообще – «это люди, которые скорее всего повели бы себя враждебно в нейтральной обстановке».
В этой ситуации вырисовывается довольно грустный эндшпиль: художник всего лишь создает произведение искусства, которое нравится людям, нравящимся художнику, а людей притягивают художники, которые, как думают люди, им понравятся. Открывает ли мир сетевых вкусов нечто новое или просто более эффективно направляет нас в замкнутое пространство наших склонностей?
В шуме мы стараемся найти «сигналы доверия». Когда автор отзыва подписывается своим настоящим именем, отзывы оцениваются как более «полезные». Что еще влияет на положительную оценку отзыва? Как уже говорилось ранее, более «полезными» считаются отзывы, которые ближе к общей средней оценке. Что интересно, исследование показало, что тенденция не симметрична: «легкий негатив отзыва в аспекте оценки «полезности» карается более строго, чем легкий позитив». Находясь в сомнениях, мы склоняемся в сторону позитива.
Но не всегда. Есть одна критически важная переменная, от которой зависит, поставим ли мы «лайк» негативному отзыву (точнее, отнесемся ли к нему с доверием): относится ли отзыв к качеству опыта (книги или фильмы) либо к качеству товара (фотоаппарат или автомобильные «дворники»)? В то время как негативные отзывы в целом считались менее полезными, чем «умеренные», сами эти отзывы, как выяснили Сьюзен Мадэмби и Дэвид Шуф при анализе отзывов на Amazon, оценивались гораздо суровей в том случае, если относились к книге или фильму. Почему? «Вкус играет значительную роль применительно к большей части «продуктов опыта», а потребители часто обладают высокой степенью уверенности в собственном вкусе и в своей субъективной оценке и скептически относятся к крайним взглядам других людей», – пишут они. В отличие от «дворников», по поводу книги или фильма человек уже в момент просмотра отзывов может иметь мнение, а это приводит к тому, что чей-то «однозвездочный» критический отзыв будет им отброшен как проявление когнитивного диссонанса.
В одном из моих любимых «однозвездочных» отзывов на роман Кормака Маккарти «Дорога» просто физически ощущается, как много сил потратил автор отзыва на подготовку своего нападения, чтобы избежать этой ловушки:
«Я знаю, что многим эта книга нравится. Помните, что хоть я с вами и не согласен, я все же готов поделиться информацией с теми, кто еще не решил, стоит ли ее покупать. Вот зачем я это пишу. Я вовсе не хочу принизить Маккарти и лично ваш вкус, а просто стараюсь написать отзыв с иной точки зрения».
Автор отзыва окружает китайскими церемониями вопрос вкуса, словно даже простое упоминание о нем уже выглядит нетактично. «Вкус безжалостно выдает социальную и культурную позицию и является еще более табуированной темой, чем секс или деньги», – замечает Стивен Бейли.
Что касается промышленных товаров, то людям нужна техническая информация, полезные советы, описание недостатков продукции и тому подобное. У них может не быть ни склонностей, ни предпочтений, и негативный отзыв может сигнализировать о том, что продукт негодный.
В самых негативных отзывах о, допустим, кухонном агрегате для просушки листьев салата марки «Oxo» обычно упоминается, что продукт оказался бесполезным. Но «однозвездочные» отзывы о (получившей премию) книге Рейчел Кушнер «Огнеметы», которую я читал, пока работал над этой главой, переполнены предложениями вроде: «Думаю, главной проблемой стало то, что у меня не получилось отождествить себя с кем-нибудь из героев». Это недостаток продукта – или же читателя? Книги могут проваливаться или становиться популярными, но это происходит по-разному для разных читателей. Перефразируя Толстого, каждый недовольный читатель недоволен по-своему. С другой стороны, у людей никогда не бывает проблем с рассказами о своих агрегатах для просушки салатных листьев. Так что можно вновь убедиться, что устройства для сушки салата, по всей видимости, обладают меньшей рефлективностью личностных аспектов, чем книги. Как пишет бизнес-теоретик Шина Айенгар, «чем меньше относится выбор к какой-либо утилитарной функции, тем более идентифицирующим он является».
Любопытно, что в исследовании премированных книг спад рейтингов после присуждения премий был меньше, если книга относилась к классу нон-фикшн. Вполне возможно, что нехудожественная литература рассматривается как имеющая в большей степени утилитарную функцию продукция, дающая меньше поводов для столкновения вкусов. Словно мы почти инстинктивно настроены на большую активность, когда замечаем, как другие люди выражают свои вкусы – и в особенности когда их вкусы отличаются от нашего.
Это заставляет задуматься, не связано ли негативное отношение (пусть даже и отдаленно) с врожденными механизмами отвращения, которые были упомянуты ранее при разговоре о пище? Фактически когда в одном из исследований люди просматривали негативные отзывы о различных продуктах – «утилитарного» или «гедонистического» толка, – они проявляли большую склонность приписывать причины негативности отзыва свойствам самого продукта, если продукт обладал утилитарной функцией, а если продукт обладал гедонистической функцией, то причиной негатива объявляли личностные качества. «Вкус группирует, и группирует тех, кто группирует», – писал Бурдьё. А уж затем мы разбиваем группы на группы.
Можно подумать, что оценивать рестораны на Yelp! оценивать книги и сушилки салатных листьев на Amazon и фильмы на Netflix – это совершенно разные вещи. Но в Сети побеждает странная металогика. Люди обычно не рассматривают работу в ее историческом контексте и не занимаются другой сложной классификацией, за что когда-то платили критикам, а просто делятся своим потребительским опытом.
При контентном анализе отзывов на фильмы на одном веб-сайте с целью выявления отличий между профессиональными критиками и сетевым «сарафанным радио» выяснилось, что кинокритики чаще говорят о сюжете, постановке и актерской игре, чем обычные кинозрители (интересно, что, когда они говорят о себе, их отзывы обладают сильной девиацией от усредненных значений; нет более яркого признака вкуса, чем слово «я»). В то же время критики-любители больше рассказывают о том, какое значение лично для них имела данная работа (в 33 % случаев по сравнению с нулем в профессиональных рецензиях). При этом примерно в половине отзывов кинозрителей имелись ссылки на мнения кинокритиков (естественно, никто из кинокритиков не ссылался на отзывы зрителей).
Вкратце, критики говорят о том, почему что-то должно (или не должно) нравиться, а люди говорят о том, почему это понравилось лично им. Любопытно, что критиков часто критикуют за то, что они навязывают свой вкус «всем остальным», хотя в реальности в этом можно упрекнуть лишь «всех остальных».
Люди настолько привыкли к роли критиков, что иногда встречаются даже растерянные «рецензии» на самые простые продукты вроде скрепок для бумаг: «Что я могу сказать? Ну… Это скрепки для бумаги!» Четыре «звездочки»! То, что сайты вроде Amazon торгуют практически любыми товарами, приводит к упрощению и размыванию границ. На книги яростно нападают за то, что издатель не выпустил электронную версию или шрифт не понравился. Размываются границы авторитетов. Что может сказать компетентный критик скрепок для бумаг о поэзии французского символизма? Каковы критерии оценки, например, генератора шумов, кто является авторитетом по данному вопросу? Реальный пример отзыва: «Белый шум показался нам чуть более глубоким, чем хотелось бы!» Расцвет сетевых отзывов как явления, может быть, сверг одинокого критика с пьедестала. Но после свержения вкус раскололся на тысячу мелких кусочков. И мы перебираем эти осколки, пытаясь найти хоть что-то ценное в том, что каждый пытается рассказать о значимости продукта лично для него.
А теперь давайте рассмотрим этот же вопрос, но с обратной стороны: поговорим не о том, что вы рассказываете о своих вкусах, а о том, что ваши вкусы рассказывают о вас.