Эту книгу хорошо дополняют:
Авинаш Диксит и Барри Нейлбафф
Чарльз Уилан
Стивен Строгац
Грейди Клейн и Алан Дебни
Алекс Беллос
Доступный учебник по теории игр, который завоевал заслуженную популярность благодаря наглядным примерам и упражнениям, а также доступному изложению, не требующему от читателей серьезной математической подготовки.
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.
Эту книгу хорошо дополняют:
Авинаш Диксит и Барри Нейлбафф
Чарльз Уилан
Стивен Строгац
Грейди Клейн и Алан Дебни
Алекс Беллос
Информация от издательства
Научный редактор Александр Минько
Издано с разрешения W.W.Norton&Company, Inc. и литературного агентства Andrew Nurnberg
На русском языке публикуется впервые
Диксит, Авинаш
Стратегические игры. Доступный учебник по теории игр / Авинаш Диксит, Сьюзан Скит и Дэвид Рейли-младший; пер. с англ. Н. Яцюк; [науч. ред. А. Минько]. — М.: Манн, Иванов и Фербер, 2017.
ISBN 978-5-00100-813-2
Доступный учебник по теории игр, который завоевал заслуженную популярность благодаря наглядным примерам и упражнениям, а также доступному изложению, не требующему от читателей серьезной математической подготовки.
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.
Все права защищены. Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.
© W. W. Norton & Company, Inc., 2015, 2009, 2004, 1999
© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2017
Предисловие партнера издания
Перед вами логическое продолжение книги Авинаша Диксита и Барри Нейлбаффа. В новой книге нас вновь вовлекают в разбор множества ситуаций, на основе которых мы учимся понимать виды различных стратегий и прогнозировать поведение участников игр.
В России теория игр стала уже не просто модной темой, но и обязательным знанием для людей, решающих сложные стратегические задачи. Спрос на литературу по этой теме растет, и вот перед вами одна из немногих достойных книг, в которой авторам удалось доступно раскрыть концепции и методики стратегической игры.
Интересный момент: стратегические игры не ограничиваются одним лишь математическим анализом ситуации. Одно из главных условий игры — наличие игроков, каждый из которых имеет свои желания, задачи и цели. И именно объединение методов психологии и математики дает возможность выстроить наиболее успешную стратегию игры.
Несмотря на то что все люди так или иначе сталкиваются с играми в повседневной жизни, есть те, кому эти знания необходимы в первую очередь. Я говорю о руководителях. Их роль заключается в том, чтобы достигать целей подразделения или организации, учитывая множество вовлеченных в процесс людей. Управление проектом, ведение переговоров, внедрение изменений — каждое из этих направлений бизнеса является стратегической игрой.
Как это выглядит на практике? Не так давно консультанты Samolov Group вели проект по сопровождению переговоров для руководителя крупной строительной компании. Задачей нашего заказчика было приобретение большого участка земли для строительства. Ему было затруднительно вести переговоры с партнером на своих условиях. Вместе с заказчиком мы проанализировали интересы и возможности оппонента. После сбора обнаружилось, что у партнера близится срок погашения большого кредита. Наш клиент предложил новые условия сделки, при которых оппонент имел возможность погасить этот самый кредит. Таким образом, контракт был подписан на ту сумму, на какую рассчитывал наш клиент. Пример иллюстрирует важность анализа игроков, поскольку это позволяет определить наиболее выигрышную стратегию.
Чем выше уровень руководителя, тем важнее для него развивать стратегическое мышление и умение применять методы теории игр на практике. В реальности же российские менеджеры привыкли решать ситуации «здесь и сейчас», не думая о долгосрочных сценариях. Поэтому обучение навыкам планирования, постановки целей, разработки стратегий дается довольно тяжело даже опытным руководителям. Необходимо признаться самому себе в том, что, если не развивать эти компетенции и не уделять должного внимания планированию, будет сложнее добиваться серьезных целей.
В книге «Стратегические игры» методика преподносится через кейсы. Этот формат может быть несколько непривычным для российского читателя. В России обучение предполагает сначала описание методики, а после уже — ее применения. В этой же книге вначале даются кейсы, а уже по ним делается разбор и вывод методики. Возможно, текст книги будет казаться сложным для восприятия, но информация, содержащаяся в нем, имеет большую ценность, поэтому рекомендую заинтересованному читателю выделить время на чтение и получить от этого интеллектуальное удовольствие.
Иван Самолов,
коммерческий директор Samolov Group
Предисловие
Мы написали этот учебник для преподавателей и студентов первого или второго курса колледжа, чтобы помочь последним освоить основы теории игр. Он не требует предварительных знаний в областях, в которых применяется эта наука (таких как экономика, политология, эволюционная биология и т. д.); достаточно школьного уровня математики. Должны сказать, что полученный результат превзошел все наши ожидания. Сегодня немало учебных курсов по этой дисциплине читаются там, где 20 лет назад о них и не слышали, к тому же некоторые из них разработаны под влиянием нашего учебника. А появление на рынке конкурентов и подражателей — еще один убедительный признак успеха.
Тем не менее успех не повод для самоуспокоения. В каждом последующем издании учебника мы продолжали совершенствовать изложенный в нем материал с учетом замечаний и предложений преподавателей и студентов, а также собственного опыта его использования.
Основные нововведения в четвертом издании связаны со смешанными стратегиями. В третьем издании мы рассматривали этот вопрос в двух главах исходя из различий между простыми и сложными темами. Простые темы включали решение и интерпретацию равновесий в смешанных стратегиях в играх 2 × 2, а главной сложной темой была общая теория смешивания в играх с более чем двумя чистыми стратегиями, когда некоторые из них могут остаться неиспользованными в равновесии. Однако мы обнаружили, что мало кто из преподавателей обращается ко второй из этих глав. Поэтому мы решили свести простые темы и ряд базовых концепций более сложных тем в одну главу, посвященную смешанным стратегиям (). Некоторые материалы, не попавшие в эту главу, будут доступны читателям, намеревающимся более глубоко изучить темы повышенного уровня сложности, в виде онлайн-приложений.
Мы улучшили и упростили материал об информации в играх (). В частности, дали расширенное описание и больше примеров предварительного обмена ею с тем, чтобы разъяснить взаимосвязь между согласованием интересов и возможностью достоверной коммуникации. Кроме того, мы проанализировали примеры сигнализирования и скрининга в начале, а не в конце главы, как это было в третьем изданием, чтобы убедить студентов в важности этой темы и подготовить почву для более сухой теории, представленной в следующих разделах.
Игры в некоторых областях применения теории игр, о которых рассказывается в следующих главах, были достаточно просты, и их можно было анализировать без развернутого дерева игры или таблицы выигрышей. Но это ослабляло связь между предыдущими главами, в которых излагались методические принципы теории игр, и примерами практического применения этих принципов. Поэтому теперь мы показываем больше инструментов логического вывода в контексте их практического использования.
Мы расширили и усовершенствовали набор упражнений. Они, как и в третьем издании, в каждой главе разделены на две группы — с решениями и без — и в большинстве случаев представлены параллельно: на каждое упражнение с решением приходится соответствующее упражнение без решения, но с незначительными изменениями, что позволяет студентам дополнительно попрактиковаться. Доступ к решениям упражнений первой группы читатели могут получить на сайте . Решения упражнений второй группы будут предоставляться преподавателям, использующим этот учебник в работе: им необходимо связаться с издателем для получения доступа к сайту для преподавателей. В каждой группе упражнений с решениями и без них есть упражнения двух типов. Одни дают возможность повторить и отработать изучаемые методы, в других мы шаг за шагом проводим студента через процесс создания модели анализа того или иного вопроса или проблемы с позиции теории игр (на наш взгляд, именно эти упражнения имеют самую большую образовательную ценность). Такой опыт, полученный в ходе анализа упражнений с решениями и закрепленный с помощью соответствующих упражнений без решений, способствует развитию навыков стратегического мышления у студентов.
Большая часть других глав тоже обновлена, улучшена, систематизирована и упрощена. Самым существенным изменениям подверглись главы, посвященные таким темам, как дилемма заключенных (), коллективные действия (), эволюционные игры () и голосование (). Мы исключили последнюю главу третьего издания («Рынки и конкуренция»), поскольку, как показывают данные, ее почти никто не использовал. В случае необходимости преподаватели могут ее найти в третьем издании учебника.
Мы признательны многочисленным читателям предыдущих изданий за высказанные замечания и предложения. Благодаря им, а также проницательным и конструктивным советам преподавателей, использующих учебник на лекциях, содержание и изложение материала было существенно улучшено. В ходе работы над четвертым изданием мы учли комментарии Кристофера Максвела (Бостонский колледж), Алекса Брауна (Техасский университет A&M), Джонатана Вуна (Питтсбургский университет), Клауса Бекера (Техасский технологический университет), Хуансиня Янга (Университет штата Огайо), Мэтью Рулофса (Университет Западного Вашингтона) и Дебашис Пал (Университет Цинциннати). Спасибо всем вам.
Авинаш Диксит
Сьюзан Скит
Дэвид Рейли-младший
Часть I. Общие принципы
Глава 1. Основные концепции и примеры
* * *
Все вводные учебники начинаются с попытки убедить студентов, что рассматриваемая дисциплина крайне важна в нашем мире и поэтому заслуживает их внимания. Естественные и прикладные науки претендуют на роль основы современных технологий, а значит, и современной жизни; общественные науки исследуют серьезные вопросы управления, такие как демократия и налогообложение; гуманитарные утверждают, что возродят вашу душу после того, как она омертвеет под воздействием естественных, прикладных и общественных наук. Как вписывается в эту картину теория стратегических игр, часто называемая теорией игр, и почему ее следует изучать?
Мы предлагаем практическую мотивацию, которая носит более индивидуальный характер и ближе к вашим личным проблемам, чем большинство других предметов. Вы играете в стратегические игры постоянно: с родителями, братьями и сестрами, друзьями и врагами и даже с преподавателями. По всей вероятности, вы накопили достаточно приличный объем интуитивных знаний и навыков ведения таких игр, и мы надеемся, что вам удастся связать эти знания с изложенным в учебнике материалом. Мы будем опираться на ваш опыт, систематизируем его и разовьем до уровня, на котором вы сможете улучшить свои стратегические навыки и более методично их применять. Возможности для этого у вас будут появляться на протяжении всей жизни: вы продолжите играть в подобные игры с работодателями, подчиненными, супругами, детьми и даже незнакомыми людьми.
Этот предмет имеет существенное значение и в более широком контексте. Такие игры ведутся в бизнесе, политике, дипломатии и войнах — на самом деле в любой ситуации, в которой люди вступают во взаимодействие друг с другом с целью заключить взаимовыгодную сделку или разрешить конфликт. Способность распознавать эти игры углубит ваше понимание окружающего мира и позволит более эффективно участвовать в происходящих в нем событиях. Кроме того, понимание стратегических игр принесет непосредственную пользу при изучении ряда других предметов. На курсах по экономике и бизнесу уже применяются многие элементы теоретико-игрового мышления. Теория игр также используется в политологии, психологии и философии для анализа взаимоотношений между людьми. То же самое можно сказать и о биологии, на которую существенно повлияли концепции эволюционных игр и которая, в свою очередь, привнесла эти идеи в экономику. Психология и философия тоже не обходятся без стратегических игр. Теория игр предоставляет концепции и методы анализа в распоряжение многих, можно сказать, практически всех дисциплин, разве что за исключением изучающих полностью неодушевленные объекты.
1. Что такое стратегическая игра
При слове игра у вас может создаваться впечатление, что речь идет о поверхностном, малозначащем предмете в масштабной картине мира, изучающем такие тривиальные занятия, как азартные игры и спорт, тогда как в мире масса более важных вопросов — война, бизнес, образование, карьера и отношения. На самом деле стратегическая игра не просто игра; все вышеперечисленные вопросы и есть примеры игр, и теория игр помогает нам понять их суть. Тем не менее нет ничего плохого в том, чтобы начать изучение теории игр применительно к азартным играм или видам спорта.
Составляющие большинства игр — удача, мастерство и стратегии в различных пропорциях. Ставить все на подбрасывание монеты — это игра чистого везения, если, конечно, вы не спец в области подтасовок или подбрасывания монет. Забег на сто метров — игра, требующая исключительно физических навыков, хотя в ней тоже может присутствовать некий элемент случайности — например, у бегуна без видимых причин выдался не очень удачный день.
Стратегия — набор навыков иного рода. В контексте спорта это ментальные навыки, необходимые для того, чтобы хорошо играть, а еще умение рассчитать, как лучше всего использовать свои физические способности. Например, в теннисе вы их развиваете, отрабатывая подачи (сначала жесткие и плоские, затем подачи с подкруткой и кик-подачи) и обводящие удары (жесткие, низкие и точные). Стратегические навыки — это понимание того, куда следует отправить подачу (по косой к боковой линии или по центру, в крестовину между полями подачи) и целесообразно ли выполнять обводящий удар (по диагонали или по линии поля). В футболе вы развиваете умение ловить и бросать мяч, блокировать соперника, отбирать у него мяч и т. д. Тренер, зная физические возможности членов своей команды и команды противника, организует игру так, чтобы по максимуму использовать навыки своих игроков и слабые стороны соперника. Именно расчеты тренера определяют стратегию. Физическую игру в футбол ведут сами спортсмены, а стратегическую — тренеры и их помощники в кабинетах и на боковой линии.
Ваша задача в забеге на сто метров — как можно выгоднее применить свои физические навыки. На этой дистанции нет возможности наблюдать за соперниками и реагировать на их действия, а значит, нет места и для стратегии. А вот более длинные забеги уже подразумевают ее наличие: следует ли вам возглавлять забег и задавать темп бега, за какое время до финиша делать попытку вырваться вперед и т. д.
По сути, стратегическое мышление — это способность анализировать взаимодействие с другими людьми, тогда как они, в свою очередь, делают то же самое. Во время марафона ваши соперники могут срывать или поддерживать ваши попытки возглавить забег в зависимости от того, что больше отвечает их интересам. В теннисе противник старается угадать, куда вы направите свою подачу или обводящий удар; в футболе тренер команды противника строит игру так, чтобы она наилучшим образом, по его мнению, противостояла вашей стратегии игры. Безусловно, вы должны учитывать планы соперника, точно так же, как и он учитывает ваши. Теория игр — это анализ или, если хотите, наука о таком интерактивном процессе принятия решений.
Когда вы тщательно все взвешиваете, прежде чем что-либо предпринять, то есть осознаете свои цели или предпочтения, а также любые ограничения или требования к вашим действиям, и обдуманно выбираете свои действия, чтобы добиться максимального успеха исходя из собственных критериев, считается, что вы ведете себя рационально. Теория игр привносит еще один аспект в понятие рационального поведения, а именно: взаимодействие с другими, в равной степени рациональными людьми, принимающими решения. Иными словами, теория игр — это наука о рациональном поведении в интерактивных ситуациях.
Мы не утверждаем, что теория игр научит вас секретам идеальной игры или поможет никогда не проигрывать. Во-первых, ваш соперник может прочитать те же книги; кроме того, вы оба не можете постоянно выигрывать. Еще важнее то, что многие игры содержат немало сложных и тонких нюансов, а большинство реальных ситуаций включают в себя достаточно своеобразных или случайных факторов. Теория игр не может предложить безошибочный рецепт действий; что она действительно делает, так это предоставляет ряд общих принципов анализа стратегических взаимодействий. Вам предстоит дополнить их и некоторые методы вычислений множеством деталей, характерных для вашей ситуации, прежде чем разработать успешную стратегию выхода из нее. Хорошие стратеги используют теорию игр в сочетании со своим опытом; можно сказать, что ведение стратегических игр — в не меньшей степени искусство, чем наука. Мы объясним вам общие концепции науки стратегических игр, а также расскажем о ее ограничениях и о том, когда на первый план выходит искусство стратегических игр.
Хотя вы можете полагать, что уже освоили искусство стратегических игр благодаря своему опыту или интуиции, тем не менее изучение науки стратегических игр покажется вам весьма полезным. Она систематизирует множество общих принципов, действующих в разных контекстах или областях применения. Без этих принципов вам пришлось бы заново анализировать каждую новую ситуацию, требующую стратегического мышления, что было бы особенно сложно в новых областях применения теории игр — например, если вы овладели искусством стратегии в играх со своими родителями, братьями или сестрами, а теперь должны использовать стратегические навыки против бизнес-конкурентов. Общие принципы теории игр дают вам точку отсчета. Отталкиваясь от нее, вы сможете гораздо быстрее и увереннее отыскивать характерные для вашей ситуации признаки или элементы искусства стратегии, а также дополнять ими свои размышления и действия.
2. Примеры и истории о стратегических играх
С учетом целей, поставленных в , мы сначала предложим вам ряд простых примеров, многие из которых позаимствованы из ситуаций, с которыми вы наверняка сталкивались в своей жизни. В каждом примере мы указываем важный стратегический принцип. Все эти принципы более детально рассматриваются в следующих главах; кроме того, после каждого примера мы сообщим, где найти более подробную информацию. Однако не торопитесь сразу же переходить к соответствующим главам, сначала просто прочитайте все примеры, чтобы получить предварительное представление обо всех аспектах стратегии и стратегических игр.
А. Как выполнить обводящий удар
Теннис высокого уровня состоит из незабываемых поединков между лучшими игроками: Джон Макинрой против Ивана Лендла, Пит Сампрас против Андре Агасси, Мартина Навратилова против Крис Эверт. Возьмем в качестве примера финальный матч Открытого чемпионата США по теннису между Эверт и Навратиловой. Навратилова у сетки только что ударила по мячу с лета, отправив его в сторону Эверт на заднюю линию. Эверт вот-вот выполнит обводящий удар. Какой удар ей лучше сделать — по линии поля или по диагонали? И следует ли Навратиловой ожидать удара по линии и сделать наклон в соответствующую сторону или удара по диагонали и наклониться в другую сторону?
Здравый смысл говорит в пользу удара по линии. При таком ударе мячу предстоит преодолеть меньшее расстояние до сетки, а значит, у другого игрока останется меньше времени на то, чтобы правильно среагировать. Однако это не означает, что Эверт следует постоянно использовать этот удар. Если бы она поступала именно так, Навратилова ожидала бы этого и подготовилась, поэтому удар не был бы результативным. Для того чтобы повысить шансы на успех в случае обводящего удара по линии поля, Эверт необходимо использовать удар по диагонали достаточно часто, чтобы Навратиловой каждый раз приходилось угадывать его направление.
То же самое происходит и в футболе: когда на третьем дауне остается продвинуть мяч еще на один ярд, бег с мячом на середину поля — это процентная игра (то есть наиболее часто применяемая тактика игры), но время от времени нападающие должны делать в таких ситуациях пас, чтобы держать команду защиты в напряжении.
Таким образом, самый важный общий принцип действий в подобных ситуациях состоит не в том, что Эверт следует делать, а в том, чего ей делать не следует: она не должна выполнять одно и то же действие постоянно или систематически. В противном случае Навратилова будет знать, как реагировать на ее действия, и шансы на успех у Эверт снизятся.
Отсутствие систематичности в действиях означает нечто большее, чем попытки не делать один и тот же удар в подобных ситуациях. Эверт также не должна сугубо механически переключаться между двумя ударами — Навратилова заметит и использует эту закономерность или любую другую систему, поддающуюся обнаружению. Эверт необходимо делать выбор в каждом конкретном случае в произвольном порядке, чтобы помешать такому угадыванию.
Общая идея о смешивании приемов игры хорошо известна даже спортивным комментаторам на телевидении. Но у нее есть и другие аспекты, требующие углубленного анализа. Почему удар вдоль линии поля — процентная игра? Должен ли теннисист вести ее в 80, 90 или 99 процентах случаев? Насколько важен масштаб соревнований — например, следует ли делать пас на третьей попытке во время регулярного сезона, но не делать во время Суперкубка? Как игроки смешивают приемы игры в реальных условиях? Что происходит, когда появляется третья возможность (например, свеча в теннисе)? Мы проанализируем эти вопросы и ответим на них в .
Фильм The Princess Bride («Принцесса-невеста», 1987) иллюстрирует эту идею на примере «состязания на смекалку» между героем (Уэстли) и злодеем (Виззини). Уэстли должен отравить вино в одном из двух кубков, а Виззини предстоит решить, кто из какого кубка будет пить. Виззини анализирует ряд запутанных доводов в пользу того, почему Уэстли должен отравить вино в определенном кубке. Однако все они внутренне противоречивы, поскольку Уэстли может разгадать логику Виззини и добавить яд в другой кубок. И наоборот, если Уэстли выберет определенный кубок с помощью какой-то конкретной логики или системы, Виззини может предвидеть это и выпить вино из другого кубка, оставив Уэстли кубок с отравленным вином. Стало быть, стратегия Уэстли должна быть случайной и бессистемной.
Эта сцена иллюстрирует еще один момент. В фильме Виззини проигрывает и расплачивается за это жизнью. Как оказалось, Уэстли отравил вино в обоих кубках: на протяжении последних нескольких лет он вырабатывал иммунитет к этому яду. Следовательно, Виззини вел игру в крайне неблагоприятных условиях с точки зрения наличия информации, что и привело к фатальному исходу. Иногда игроки могут преодолеть проблему асимметричности информации; в и рассматривается вопрос о том, когда и как они могут это сделать.
Б. Мышиная возня со средним баллом
Вы записались на курс, который оценивается по средней успеваемости. Независимо от того, каких успехов вы добьетесь в абсолютном выражении, всего 40 процентов студентов получат оценки А и всего 40 процентов — оценки B. Следовательно, вы должны упорно трудиться, причем не только в абсолютном выражении, но и относительно того, насколько старательно трудятся ваши товарищи по учебе (на самом деле «враги по учебе» кажется в данном контексте более подходящим выражением). Это понимают все студенты, поэтому после первой же лекции они собираются на импровизированное совещание и договариваются не проявлять чрезмерного усердия. Спустя несколько недель искушение получить преимущество перед остальными, приложив чуть больше усилий, становится непреодолимым. В конце концов, ваши сокурсники не могут видеть все, что вы делаете, и не имеют реального влияния на вас, а выгода от повышения среднего балла весьма существенна. В итоге вы начинаете чаще заходить в библиотеку и оставаться там подольше.
Проблема в том, что остальные делают то же самое. Следовательно, вы получите такую же оценку, как и в случае, если бы придерживались договоренности. Единственное отличие — все вы потратили на учебу больше времени, чем вам хотелось бы.
Это пример дилеммы заключенных. В ее оригинальной версии двух подозреваемых допрашивают по отдельности и предлагают каждому признать свою вину. Одному из них, скажем, подозреваемому А, говорят следующее: «Если другой подозреваемый (Б) не сознается, то вы можете заключить выгодную сделку и смягчить наказание, признав свою вину. Но если Б сознается, тогда вам тоже лучше это сделать, иначе суд будет особенно суровым по отношению к вам. Так что вам следует сознаться в любом случае». Подозреваемого Б убеждают с помощью аналогичных доводов. Столкнувшись с таким выбором, А и Б сознаются, хотя для обоих было бы лучше, если бы они молчали, поскольку у полиции нет против них никаких веских доказательств.
В случае с оцениванием знаний складывается похожая ситуация. Если другие студенты будут работать меньше, то вы получите гораздо более высокий средний балл благодаря усердной учебе; если же другие будут усердно трудиться, тогда вам лучше делать то же самое, иначе вы получите низкий балл. Вы даже можете подумать, что слово «заключенный» очень уместно для обозначения группы студентов, попавших в ловушку обязательного учебного курса.
У преподавателей и учебных заведений собственная дилемма заключенных. Каждый преподаватель может сделать так, чтобы его курс выглядел привлекательно, оценивая знания студентов менее строго, а каждое учебное заведение может подыскать своим выпускникам более достойную работу или привлечь более перспективных абитуриентов, менее взыскательно оценивая знания студентов по всем курсам. Безусловно, если все так и поступят, ни у кого не будет преимущества перед остальными; единственное, что произойдет, — это стремительное повышение оценок, которое приводит к сжатию их диапазона, а значит, затрудняет возможность разграничивать способности студентов.
Люди часто думают, что в любой игре должны быть победитель и побежденный. Дилемма заключенных — это нечто иное: оба игрока (или все игроки) могут проиграть. Люди играют в такие игры (и проигрывают) каждый день, и проигрыши могут быть самыми разными, от небольших неудобств до потенциальных катастроф. Во время спортивных соревнований зрители поднимаются со своих мест, чтобы лучше все видеть, но когда все стоят, зона обзора, наоборот, сужается. Сверхдержавы накапливают больше оружия, чтобы получить преимущество перед противниками, но когда это делают обе стороны, соотношение сил не меняется, зато это приводит к нерациональному использованию экономических ресурсов, которые можно было бы направить на более достойные цели, чем вооружение, и повышению риска случайного развязывания войны. Учитывая величину возможных потерь всех участников таких игр, важно знать способы налаживания взаимовыгодного сотрудничества. Изучению подобной игры посвящена .
В противоположность дилемме заключенных — игре, в которой могут проиграть все, — существуют и беспроигрышные игры, когда выигрывают все участники. Один из примеров такой игры — международная торговля: если та или иная страна производит больше продукта, который она может делать лучше всех, то плодами такого международного разделения труда могут воспользоваться все страны. Однако, чтобы реализовать весь потенциал международной торговли, необходимы успешные переговоры относительно разделения этого «пирога». То же касается и многих других переговорных ситуаций. Эта тема подробно рассматривается в .
В. «Мы не можем сдавать экзамен, потому что у нас спустила шина»
Вот история (возможно, вымышленная), которая обычно распространяется по электронной почте старшекурсников; каждый из нас независимо друг от друга тоже получил ее от студентов.
Два друга изучали химию в Университете Дьюка. Оба достаточно хорошо сдали тесты, лабораторные работы и промежуточные экзамены, поэтому рассчитывали получить на итоговом экзамене твердую оценку А. Во время выходных накануне экзамена друзья были так уверены в успехе, что решили пойти на вечеринку в Университете штата Вирджиния. Вечеринка настолько удалась, что они проспали все воскресенье, поскольку вернулись слишком поздно и уже не могли готовиться к итоговому экзамену, который был назначен на утро понедельника. Вместо того чтобы сдавать экзамен без подготовки, друзья подошли к профессору и рассказали душещипательную историю о том, как ездили в Университет штата Вирджиния и планировали вернуться пораньше, но на обратном пути у них спустила шина, а так как запасной не оказалось, им пришлось всю ночь искать помощь. Так нельзя ли им сдать экзамен завтра, потому что сейчас они еле держатся на ногах от усталости? Профессор подумал и согласился.
Ребята занимались весь вечер понедельника и во вторник пришли на экзамен хорошо подготовленными. Профессор усадил их в разных аудиториях и выдал каждому задание. Первый вопрос на первой странице оценивался в 10 баллов и был очень простым. Оба студента написали правильные ответы и с огромным облегчением перевернули страницу. Там был всего один вопрос на 90 баллов: «Так какая шина спустила?»
В этой истории есть два важных стратегических урока для будущих завсегдатаев вечеринок. Первый состоит в признании того факта, что профессор — весьма искусный игрок. Он может заподозрить студентов в обмане и использовать какой-то прием, чтобы вывести их на чистую воду. Учитывая объяснения студентов, поставленный профессором вопрос был самым верным способом узнать правду. Друзьям следовало бы это предвидеть и заранее договориться. Второй — в том, что в игре необходимо просчитывать будущие ходы, а затем анализировать ее в обратном порядке с тем, чтобы определить оптимальное текущее действие, — общий принцип стратегии, на котором мы остановимся более подробно в и, что особенно важно, .
Однако предвидеть все профессорские уловки такого рода можно не всегда, ведь у преподавателей опыт распознавания отговорок студентов гораздо богаче, чем у студентов в их придумывании. Если герои этой истории не подготовились заранее, есть ли у них шанс независимо друг от друга назвать одинаковые вымышленные причины? Если каждый из них выберет шину случайным образом, вероятность того, что их выбор совпадет, составляет всего 25 процентов. (Почему?) Есть ли вариант повысить процент?
Вы можете подумать, что прежде всего в зоне риска находится шина переднего правого колеса, поскольку гвозди или осколки стекла чаще всего лежат ближе к этой стороне дороги, чем к середине, и переднее правое колесо наедет на них первым. Такая логика рассуждений кажется вполне обоснованной, но этого недостаточно, чтобы сделать правильный выбор, поскольку тут важна не логика выбора, а то, чтобы так же мыслил и ваш друг. Следовательно, вам нужно поразмышлять о том, воспользуется ли он той же логикой и посчитает ли ее очевидной. Но и это не конец цепочки рассуждений. Придет ли ваш друг к выводу, что такой выбор очевиден для вас? И так далее. Дело не в очевидности или логичности вашего выбора, а в том, очевидно ли для другого игрока то, что очевидно для вас, что очевидно для него… Иными словами, в данном случае необходима сходимость ожиданий в отношении того, что следует выбрать в подобных обстоятельствах. Ожидаемая стратегия, посредством которой игроки могут успешно координировать свои действия, называется «фокальной точкой».
В структуре таких игр нет общих или присущих им элементов, которые бы обеспечивали сходимость ожиданий. Иногда фокальная точка может быть достигнута по причине случайного стечения обстоятельств при обозначении стратегий или ввиду наличия у игроков некоего общего опыта или знаний. Например, если бы по какой-то причине переднее правое колесо называлось колесом Дьюка, то оба студента Университета Дьюка выбрали бы его без всяких предварительных размышлений. Или если бы переднее левое колесо каждого автомобиля было выкрашено в оранжевый цвет (в целях безопасности, чтобы его хорошо видели водители встречных автомобилей), то его с большей долей вероятности выбрали бы два студента Принстона, поскольку оранжевый — цвет Принстонского университета. Однако без таких подсказок координация действий вообще была бы невозможна.
Мы рассмотрим фокальные точки более подробно в . Пока же хотелось просто отметить, что, когда мы задаем вопрос о шине в аудиториях, более 50 процентов студентов выбирают шину переднего левого колеса. В большинстве случаев они не могут объяснить почему, но утверждают, что такой выбор кажется им очевидным.
Г. Почему профессора такие зануды
Многие преподаватели придерживаются непреложного правила не переносить экзамены и никогда не принимать выполненные задания или курсовые работы после установленного срока. Студентам кажется, что такое поведение говорит о том, что преподаватели совершенно бесчувственные люди. Однако истинная стратегическая причина зачастую прямо противоположна. Большинство профессоров добры и отзывчивы и были бы не против делать студентам поблажки и принимать любые разумные оправдания. Проблема в том, что считать приемлемым и разумным. Трудно различить однотипные оправдания и почти невозможно определить их истинность. Преподаватель знает: в любом случае все закончится тем, что он примет слова студента на веру. Но он также прекрасно понимает, что это скользкая дорожка. Стоит студентам узнать, что профессор — добрая душа, и они начнут чаще затягивать процесс и находить еще больше отговорок. В итоге крайние сроки перестанут что-либо означать, а экзамены превратятся в беспорядочную смесь отсрочек и переносов.
В большинстве случаев единственный способ избежать этого опасного пути — не делать по нему ни единого шага. Отказ выслушать какие бы то ни было оправдания — единственная реальная альтернатива их принятию. Заранее взяв на себя обязательство придерживаться стратегии «никаких оправданий», преподаватель сможет устоять против искушения признать их все.
Но как отзывчивому преподавателю выполнить столь жесткое обязательство? Он должен найти способ сделать свой отказ твердым и достоверным. Самый простой вариант — сослаться на административную процедуру или политику университета. «Поверьте, я готов пойти вам навстречу, но университет не позволит мне этого» — такая позиция не только представляет профессора в более выгодном свете, но и устраняет соблазн, действительно не оставляя ему выбора в данной ситуации. Безусловно, подобные правила могут определять те же преподаватели, которые сами же будут на них ссылаться, но стоит их установить, и ни один преподаватель ни при каких обстоятельствах не сможет их нарушить.
Если университет не обеспечивает такого прикрытия, преподаватель может создать инструменты выполнения обязательств самостоятельно. Например, сделать в самом начале курса обучения четкое и твердое заявление о том, какой политики он будет придерживаться. Каждый раз, когда какой-то студент попросит сделать для него исключение, преподаватель может сослаться на принцип справедливости, сказав: «Если я сделаю это для вас, мне придется это делать и для остальных». Кроме того, профессор может создать себе репутацию строгого преподавателя, несколько раз поступив жестко. Возможно, ему это будет неприятно и такое поведение может идти вразрез с его истинными наклонностями, но оно принесет пользу в долгосрочной перспективе, на протяжении всей карьеры. Когда преподавателя считают строгим, мало кто из студентов осмелится наплести ему с три короба, а значит, студентам будет не так трудно отказать.
В мы подробно изучим обязательства и связанные с ними стратегии, такие как угрозы и обещания.
Д. Соседи по комнате и родственники на грани конфликта
Предположим, вы делите квартиру с одним или несколькими студентами и заметили, что в ней заканчивается запас моющего средства, бумажных полотенец, овсяных хлопьев, пива и прочих нужных вещей. У вас есть договоренность распределять фактические расходы поровну, но поход в магазин требует времени. Готовы ли вы его выделить и сходить за покупками или понадеетесь на кого-то из товарищей, оставив себе больше времени для учебы или отдыха? Вы отправитесь в магазин за мылом или будете смотреть телевизор, чтобы не пропустить очередной сериал?
Во многих подобных ситуациях игра в ожидание может продолжаться достаточно долго, прежде чем тот, кому действительно понадобится одна из этих вещей (как правило, пиво), не выдержит и пойдет в магазин. В итоге все это может привести к серьезным ссорам и даже разрыву отношений между соседями по комнате.
Такую стратегическую игру можно рассматривать с двух точек зрения. Согласно первой, перед каждым соседом по комнате стоит простой бинарный выбор — идти за покупками или нет. Вне сомнения, лучший вариант для вас — чтобы сосед пошел в магазин, а вы остались дома, а худший — обратный порядок действий. Если вы оба сделаете покупки без ведома друг друга, скажем, по пути домой из университета или с работы, произойдет ненужное дублирование и даже, возможно, порча некоторых продуктов; если никто не совершит покупок, могут возникнуть серьезные неудобства, а то и катастрофа местного масштаба, если вдруг в самый неподходящий момент закончится туалетная бумага.
Эта ситуация аналогична игре в труса, в которую имели обыкновение играть американские подростки. Два подростка мчались навстречу друг другу на автомобилях. Тот, кто сворачивал в сторону, чтобы избежать столкновения, считался проигравшим (трусом), а тот, кто продолжал ехать прямо, побеждал. Мы подробно проанализируем эту игру в , а также , и .
Согласно второй, более интересной и динамичной точке зрения, та же ситуация рассматривается как «война на истощение», в которой каждый сосед по комнате пытается переждать остальных, рассчитывая на то, что у кого-то терпение лопнет раньше. Тем временем риск того, что в квартире закончится запас чего-то важного, что приведет к серьезным неудобствам или крупной ссоре, повышается. Каждый игрок допускает такое повышение до своей точки терпимости; проигрывает самый невыдержанный. Каждый пытается понять, насколько близко к грани катастрофы позволят ситуации развиваться другие участники игры. Отсюда и термин «балансирование на грани», которым обозначаются подобные стратегия и игра. Это динамическая версия игры в труса, открывающая более широкие и интересные возможности.
Один из нас (Диксит) имел удовольствие наблюдать блестящий пример балансирования на грани во время званого ужина одним субботним вечером. Когда перед ужином гости собрались в гостиной, в дверях появилась пятнадцатилетняя дочь хозяина дома и сказала: «Папа, пока». Отец спросил: «Куда ты идешь?» — и дочь ответила: «Прогуляться». После короткой, буквально в несколько секунд, паузы хозяин дома произнес: «Хорошо, пока».
Ваш внутренний стратегический наблюдатель погрузился в размышления о том, могла ли эта ситуация сложиться иначе. Хозяин дома мог бы спросить: «С кем?», а дочка ответить: «С друзьями». Отец мог бы не разрешить прогулку, если бы дочь не объяснила, куда и с кем пойдет. На более позднем этапе диалога кто-нибудь из них сдался бы или, наоборот, все это привело бы к крупной ссоре.
Игра была рискованной для обоих. Дочь могла быть наказана или унижена в присутствии посторонних, а возникший инцидент испортил бы отцу званый ужин. Каждому пришлось оценивать свои дальнейшие шаги без полной уверенности в том, уступит ли другой и когда или же последует неприятная сцена. Риск крупной ссоры повысился бы, если бы отец настаивал на подробном отчете дочери, а она бы все упорнее отказывалась это делать.
В этом отношении игра между отцом и дочерью напоминала прения между профсоюзом и руководством компании о сферах влияния. Ни одна сторона не может быть полностью уверена в намерениях другой стороны, поэтому каждая изучает их посредством последовательности небольших дополнительных шагов, каждый из которых повышает риск обоюдной катастрофы. Дочь в нашей истории исследовала ранее не опробованные границы свободы, а отец анализировал ранее не опробованные (а может, и непонятные для него самого) границы своего влияния.
Это был пример балансирования на грани — игры, главным образом сводящейся к повышению обоюдного риска. Такие игры обычно заканчиваются одним из двух сценариев. В первом один из игроков достигает своего предела терпимости к риску и уступает. (Отец в нашей истории сдался быстро, на первом же этапе. Дочери других, более строгих отцов, возможно, даже не начинали бы эту игру.) Во втором, прежде чем кто-либо из участников конфликта уступит, риск повышается до критического уровня и начинается крупная ссора (или забастовка, или война). Конфликт в семье хозяина дома разрешился «благополучно»: хотя отец признал поражение, а дочь победила, ссора была бы гораздо хуже для обоих.
Мы проанализируем стратегию балансирования на грани более подробно в , а в рассмотрим самый важный пример данной стратегии — Карибский (Кубинский) ракетный кризис 1962 года.
Е. Игра в свидания
Когда вы собираетесь к кому-то на свидание, вы хотите предстать перед этим человеком с лучшей стороны и скрыть недостатки. Безусловно, вы не можете скрывать их бесконечно, особенно если ваши отношения будут развиваться, но вы полны решимости стать лучше или надеетесь, что к тому времени партнер примет вас таким, какой вы есть. Вы также знаете, что отношения будут бесперспективны, если вы не произведете хорошего первого впечатления: увы, второго шанса у вас уже не будет.
Разумеется, вы хотите узнать о человеке, с которым у вас свидание, все (и хорошее, и плохое). Но вам также известно, что если ваш партнер владеет техникой знакомства не хуже вас, то он (или она) тоже попытается показать свою лучшую сторону и скрыть худшую. Вы проанализируете ситуацию более тщательно и попробуете понять, какие признаки хороших качеств настоящие, а какие без труда можно имитировать, чтобы произвести благоприятное впечатление. Даже самый неряшливый человек может появиться на важной встрече в опрятной одежде, но обходительность и хорошие манеры, которые проявляются во множестве мелких деталей, трудно изображать весь вечер, если вы к ним не приучены. Цветы — относительно дешевый подарок; более дорогие подарки могут иметь определенную ценность, но не по своей сути, а как достоверные свидетельства того, чем этот человек готов ради вас пожертвовать. А «валюта», в которой исчисляется ценность такого подарка, может иметь разную значимость в зависимости от контекста: подаренный миллионером бриллиант может стоить в данном случае меньше, чем потраченное человеком на общение с вами время или какое-то дело, выполненное по вашей просьбе.
Вы должны осознавать, что ваш визави будет не менее тщательно анализировать информационное содержание ваших действий. Следовательно, вам необходимо делать то, что подаст достоверный сигнал о ваших истинных положительных качествах, а не о тех, которые можно имитировать. Это важно не только на первом свидании: раскрытие, сокрытие и сбор информации о глубинных намерениях другого человека актуальны на протяжении всего периода поддержания отношений. Вот история, которая это иллюстрирует.
В Нью-Йорке жили мужчина и женщина, имевшие отдельные квартиры с регулируемой арендной платой [6] . Отношения пары достигли апогея, и они решили жить вместе. Женщина предложила мужчине отказаться от второй квартиры, но он, будучи экономистом, объяснил ей основополагающий принцип: всегда лучше иметь больше вариантов выбора. Возможно, вероятность их разрыва минимальна, но, учитывая даже небольшой риск, было бы разумно сохранить вторую квартиру с низкой арендной платой. Женщина восприняла это крайне негативно и немедленно разорвала с партнером отношения!
Экономисты, услышав эту историю, говорят, что она лишь подтверждает принцип целесообразности более широкого выбора. Однако стратегическое мышление предлагает несколько иное, более убедительное объяснение. Женщина не была уверена в серьезности намерений мужчины, и ее предложение стало блестящим стратегическим способом узнать правду. Слова ничего не стоят: кто угодно может сказать «Я тебя люблю». Если бы мужчина подкрепил слова делом и согласился разорвать договор аренды, это было бы конкретным свидетельством его любви, но его отказ стал веским доказательством обратного, а значит, женщина поступила правильно, разорвав с ним отношения.
Все эти примеры, рассчитанные на ваш непосредственный опыт, относятся к очень важному классу игр, в которых основной стратегический вопрос — манипулирование информацией. Стратегии, позволяющие передавать о себе выигрышную информацию, называются сигналами; а стратегии, которые побуждают людей действовать так, чтобы они достоверно раскрывали личную информацию, будь то хорошую или плохую, называются инструментами скрининга. Следовательно, предложение женщины отказаться от одной из квартир и явилось инструментом, поставившим мужчину перед выбром: либо отказаться от квартиры, либо продемонстрировать отсутствие серьезных намерений. В и мы изучим игры в информацию, а также методы сигнализирования и скрининга.
3. Наша стратегия изучения стратегических игр
Мы выбрали несколько примеров, касающихся вашего опыта как стратегов-любителей, полученного в реальной жизни, чтобы проиллюстрировать базовые концепции стратегического мышления и стратегических игр. Мы могли бы продолжить, предложив вам десятки аналогичных историй в расчете на то, что, столкнувшись с реальной стратегической ситуацией, вы проведете параллель с одной из них и сможете разработать подходящую стратегию. Подхода, сводящегося к анализу примеров из практики, придерживаются в большинстве бизнес-школ. Он представляет собой конкретный запоминающийся инструмент изучения базовых концепций. Тем не менее каждая новая стратегическая ситуация состоит из уникальной комбинации стольких переменных, что понадобилось бы слишком много примеров, чтобы охватить их все.
Альтернативный подход базируется на общих принципах, лежащих в основе примеров из практики, а значит, конструирует теорию стратегического действия, то есть формальную теорию игр. Он рассчитан на то, что в случае возникновения фактической стратегической ситуации вы сможете понять, какой принцип или принципы к ней применить. По этому пути пошли такие академические дисциплины, как экономика и политология. Недостаток данного подхода состоит в том, что теория подается в крайне абстрактном и математическом виде, без достаточного количества примеров из практики. Это делает ее трудной для восприятия большинством начинающих, чтобы затем связать с реальностью.
Однако знание общей теории обладает огромным компенсирующим преимуществом, обеспечивая более глубокое понимание игр и того, почему они имеют тот или иной исход. Это поможет вам играть лучше, чем если бы вы просто прочитали еще больше примеров и узнали рецепт, как играть в некоторые конкретные игры. Понимание того, почему нужно играть так или иначе, позволит вам тщательно анализировать непредвиденные ситуации, в которых сторонник использования готовых рецептов просто растерялся бы. Чемпион мира по игре в шашки Том Уисуэлл сформулировал эту мысль так: «Игрок, который знает, как играть, обычно играет вничью. Игрок, который знает, почему так надо играть, как правило, выходит победителем». Этот принцип не стоит воспринимать буквально для всех без исключения игр — некоторые игры могут ставить одного из игроков в безвыходное положение независимо от его осведомленности, — однако он содержит зачаток важной общей истины: знание причин дает вам важное преимущество, которого у вас не было бы, имей вы только практические навыки. Например, знание причин игры поможет вам предвидеть безнадежную ситуацию и вообще не ввязываться в такую игру.
Учитывая вышесказанное, мы пойдем по промежуточному пути, сочетающему в себе преимущества обоих подходов — примеры из практики («как») и теорию («почему»). Каждая тема рассматривается в контексте основных принципов (как правило, по одному принципу в каждой из глав 3−7), так что вам не придется самостоятельно выводить их из конкретных примеров. Однако мы будем формулировать их посредством иллюстративных примеров, а не в абстрактной форме, поэтому контекст и масштаб каждой концепции будет понятен и очевиден. Другими словами, мы сфокусируемся на теории, но выстроим ее на примерах, а не абстрактных рассуждениях. Начиная с мы будем применять эту теорию к нескольким типам стратегических ситуаций.
Безусловно, такой подход требует определенных компромиссов. Важно не забывать, что каждый из приведенных примеров служит для передачи сути некоей общей концепции или принципа теории игр. Поэтому мы опустим в каждом практическом примере детали, которые носят второстепенный характер по отношению к рассматриваемому принципу. Если какие-то из примеров покажутся вам надуманными, отнеситесь к этому с пониманием: в большинстве случаев мы проанализировали опущенные детали и исключили их вполне обоснованно.
Позвольте заверить вас в следующем. Хотя примеры, способствующие формированию концептуальной и теоретической основы теории игр, подобраны специально для этой цели (даже ценой отбрасывания некоторых других аспектов реальности), после изложения теории мы уделяем больше внимания ее связи с реальностью. На протяжении всей книги мы исследуем фактические и экспериментальные доказательства того, насколько хорошо теория объясняет реальность. Распространенный ответ на этот вопрос (что хорошо в одних отношениях и гораздо хуже в других) должен придать вам определенную уверенность в применении этой теории и стать стимулом для содействия в разработке более совершенных теорий. В некоторых разделах мы подробно исследуем, как различные учреждения учатся на практике решать проблемы, на которые указывает теория. В частности, в обсудим причины возникновения и практического решения дилеммы заключенных, а также проанализируем более общие проблемы коллективного действия в . И наконец, в рассмотрим использование стратегии балансирования на грани в ходе Карибского ракетного кризиса. Теоретически обоснованное изучение примеров из практики, в ходе которого большой объем подробных фактических данных о ситуации подвергается столь же подробному теоретическому анализу, все активнее распространяется в таких разноплановых областях науки, как деловое администрирование, политология и история экономики. Мы надеемся, что наше первичное исследование важного эпизода в дипломатической или военной сфере станет для вас интересным введением в соответствующую область.
Для того чтобы придерживаться подхода, позволяющего на основании примеров делать общие теоретические выводы, которые затем проверяются на соответствие фактам и используются для интерпретации реальных ситуаций, необходимо сначала определить общие принципы изложения материала. Мы сделаем это в , разделив игры на категории по ряду ключевых параметров различных стратегических вопросов и концепций. По каждому параметру мы выделим два крайних чистых типа. Например, один из параметров касается порядка ходов, а два чистых типа соответствуют их поочередному (игры с последовательными ходами) или одновременному (игры с одновременными ходами) выполнению. Реальные игры редко относятся к одной из этих концептуальных категорий; большинство из них сочетают в себе свойства обоих крайних типов. Тем не менее позицию каждой игры в нашей классификации можно определить посредством анализа присутствующих в ней концепций или параметров, а также того, как два чистых типа смешиваются в ней по каждому параметру. Для принятия решения о том, как действовать в конкретной ситуации, достаточно надлежащим образом использовать знания о чистых типах.
После того как в будет построена общая концептуальная схема, на нее будут опираться следующие главы, развивая ряд общих идей и принципов в отношении стратегического выбора каждого игрока и взаимодействия стратегий всех игроков в различных играх.
Глава 2. Подход к анализу стратегических игр
* * *
В приведено несколько простых примеров стратегических игр и стратегического мышления, а в этой главе мы используем более систематический и аналитический подход к данной теме и остановимся на ряде важных концептуальных категорий, или параметров, по каждому из которых существует дихотомия типов стратегических взаимодействий. Например, один такой параметр касается сроков выполнения действий игроками, а два его чистых типа игр — их очередности, то есть участники действуют строго поочередно (последовательные ходы) или в одно и то же время (одновременные ходы). Мы рассмотрим некоторые вопросы, возникающие в ходе анализа каждого чистого типа в такой дихотомии, а также аналогичные дихотомии в контексте других вопросов, таких как, например, проводится ли игра разово или многократно и что известно игрокам друг о друге?
В главах 3−7 мы расскажем о каждой из этих категорий, или параметров, более детально, а в главах 8−17 покажем, как использовать данный анализ в нескольких контекстах. Безусловно, большинство реальных примеров практического применения стратегических игр представляют собой не чистый тип, а скорее, сочетание разных типов. Более того, каждый пример практического применения связан с двумя или более категориями. Следовательно, знания, полученные в процессе изучения чистых типов, предстоит должным образом комбинировать. Мы покажем, как это делать, в контексте наших примеров из практики.
В данной главе сформулированы основные концепции и термины (такие как стратегии, выигрыши и равновесие), используемые в ходе анализа, а также сжато описаны методы решения. Кроме того, мы предлагаем краткое обсуждение примеров применения теории игр и общий обзор структуры оставшейся части книги.
1. Решения и игры
Когда человек (команда, компания или правительство) решает, как строить взаимоотношения с другими людьми (командами, компаниями или правительствами), это обязательно предполагает взаимовлияние действий: то есть то, что делает одна сторона, неизбежно сказывается на результате, полученном другой стороной. Когда Джорджа Пикетта (возглавлявшего одну из атак в битве при Геттисберге) попросили объяснить поражение Конфедерации в ходе Гражданской войны, он ответил: «Думаю, тут не обошлось без янки».
Однако для того, чтобы взаимодействие получило статус стратегической игры, необходимо нечто большее, а именно взаимная осведомленность участников игры о наличии такого перекрестного эффекта. То, что делает другой человек, отражается на вас; зная об этом, вы сможете отреагировать на его действия или принять превентивные меры, чтобы предотвратить его негативное влияние или усилить положительное или даже предпринять такие упреждающие действия, которые бы изменили его будущую реакцию в вашу пользу. Когда вы знаете, что другой человек тоже в курсе, что ваши действия повлияют на него, вы понимаете, что он предпримет аналогичные шаги, и т. д. Именно эта обоюдная осведомленность о взаимовлиянии действий, а также меры, предпринятые вследствие такого знания, и есть самые интересные аспекты стратегии.
Мы проводим это различие, обозначая термином стратегические игры (или иногда просто игры, поскольку нас не интересуют игры других типов: например, игры, которые рассчитаны исключительно на везение или мастерство) взаимодействие между взаимно осведомленными игроками и термином решения ситуации, в которых каждый человек волен делать выбор, не заботясь о реакции или ответных действиях окружающих. Если Роберт Ли (который отдал Пикетту приказ провести обреченную на поражение атаку) полагал, что его артиллерийский обстрел ослабит янки до такой степени, что те утратят способность сопротивляться, то его приказ атаковать был решением; если же он знал о том, что это заведомо провальный ход и янки готовы к атаке, тогда его выбор — часть кровопролитной игры. Простое правило гласит: если нет двух или более игроков, реагирующих на действия (или, по мнению каждого игрока, возможные действия) других, тогда это не игра.
Стратегические игры особенно ярко проявляются в случаях прямого противостояния двух участников игры. Например: гонка вооружений между Соединенными Штатами Америки и Советским Союзом в 1950–1980-х годах, переговоры о повышении заработной платы между General Motors и United Auto Workers (Профсоюзом рабочих автомобильной промышленности) или матч Суперкубка между двумя «пиратами» — командами Tampa Bay Buccaneers и Oakland Raiders. Напротив, взаимодействие между большим количеством участников кажется менее подверженным воздействию проблем, обусловленных обоюдной осведомленностью. Поскольку объем продукции, выращенной одним фермером, — лишь незначительная часть объема продукции всей страны или мира, решение этого фермера вырастить больше или меньше кукурузы практически никак не сказывается на рыночной цене, поэтому на первый взгляд нет оснований рассматривать сельское хозяйство как стратегическую игру. Данная точка зрения действительно преобладала в экономике на протяжении многих лет. Немногочисленные случаи противостояния между крупными компаниями (как на автомобильном рынке США, на котором некогда доминировали GM, Ford и Chrysler) вполне обоснованно рассматривались как стратегические игры, но при этом предполагалось, что большинство других случаев экономического взаимодействия регулируются такими обезличенными факторами, как спрос и предложение.
В действительности у теории игр гораздо более широкая область действий. Многие ситуации, которые начинаются как обезличенный рынок с тысячами участников, превращаются в стратегическое взаимодействие между двумя или несколькими участниками. Это происходит по одной из двух крупных категорий причин: взаимные обязательства или личная информация.
Рассмотрим сначала обязательства. Когда вы планируете строить дом, вы выбираете одного из нескольких десятков подрядчиков в вашем регионе; точно так же подрядчик выбирает одного из нескольких потенциальных клиентов. На первый взгляд может показаться, что это обезличенный рынок. Однако после того, как каждая сторона делает свой выбор, клиент выплачивает первоначальный взнос, а подрядчик покупает стройматериалы, оба становятся связанными друг с другом независимо от рынка, и отношения между ними приобретают двусторонний характер. Подрядчик может слегка халтурить или затягивать с выполнением работ, а клиент — задерживать очередной платеж. В игру вступает стратегия. Первоначальный контракт между клиентом и подрядчиком, заключенный на рынке, должен учитывать их индивидуальные стимулы в игре и заранее определять график внесения платежей, привязанный к очередным этапам выполнения работ в рамках проекта. Но даже в этом случае впоследствии придется вносить коррективы, и они повлекут за собой новые элементы стратегии.
Теперь рассмотрим личную информацию. Тысячи фермеров стремятся взять кредит на оплату первоначальных расходов на машины, семена, удобрения и т. д., и сотни банков готовы им эти кредиты предоставить. Тем не менее рынок таких кредитов не обезличен. Заемщик с хорошими фермерскими навыками, вкладывающий в свой бизнес массу усилий, с большей долей вероятности добьется успеха и погасит кредит, чем менее квалифицированный или ленивый заемщик, который может не выполнить обязательств по кредиту. Риск неплатежа носит в высшей степени персонифицированный характер. Кредит не возвращает не неопределенный объект под названием «рынок», а конкретный заемщик. Именно поэтому каждый банк рассматривает свои кредитные отношения с каждым заемщиком как отдельную игру. Банк тщательно изучает кредитоспособность заемщика или требует от него обеспечения по кредиту. В итоге фермер будет искать способы убедить банк в своей платежеспособности, а банк будет искать подтверждения заявлению фермера.
Аналогичным образом страховая компания предпринимает определенные шаги, чтобы получить информацию о состоянии здоровья отдельных заявителей, и обязательно проверит, не было ли поджога, в случае выплаты страхового возмещения в связи с пожаром. Работодатель изучает уровень квалификации отдельных сотрудников и отслеживает эффективность их работы. В более общем смысле, когда участники отношений располагают личной информацией, влияющей на результат, каждая двусторонняя сделка становится стратегической игрой, даже если более широкая картина происходящего состоит из тысяч подобных сделок.
Таким образом, когда каждый участник играет важную роль во взаимодействии (либо потому, что с самого начала был крупным игроком, либо потому, что обязательства или личная информация сводят отношения между игроками до уровня, при котором каждый игрок становится ключевым в рамках данных отношений), такое взаимодействие следует рассматривать как стратегическую игру. Подобные ситуации — скорее правило, чем исключение, в бизнесе, политике и даже социальных отношениях. Следовательно, изучение стратегических игр — важный элемент всех областей, которые анализируют подобные вопросы.
2. Классификация игр
Стратегические игры возникают во множестве различных контекстов и, соответственно, имеют множество разных свойств, подлежащих изучению. Данную задачу можно упростить, разделив эти свойства на несколько категорий, в каждой из которых можно выделить два чистых типа игр, а затем представить любую реальную игру как их смешение. Мы создадим такую классификацию на основе ряда вопросов, имеющих отношение к тем фактическим играм, в которые вы играете или изучаете.
А. Ходы в игре выполняются последовательно или одновременно?
В шахматах игроки ходят по очереди: сначала белыми, затем черными, потом снова белыми и т. д. Напротив, участники аукциона по продаже лицензий на бурение нефтяных скважин или лицензий на диапазон частот делают ставки одновременно, не зная о ценах, заявленных конкурентами. Большинство реальных игр объединяют ходы обоих типов. Разработкой нового продукта компании занимаются параллельно, но каждая владеет неполной информацией об успехах конкурента и может предпринять соответствующие ответные действия. Во время одного футбольного матча тренеры защиты и нападения противоборствующих команд одновременно отправляют их на поле, ожидая от них определенных действий, но, увидев, как выстроена защита, квотербек может изменить план игры у линии розыгрыша мяча или потребовать тайм-аут с тем, чтобы тренер мог внести изменения в игру.
Различие между играми с последовательными и одновременными ходами крайне важно, поскольку эти два вида игр требуют разных типов интерактивного мышления. В игре с последовательными ходами каждый игрок должен думать вот о чем: если я сделаю это, то как мой соперник отреагирует? Ваш текущий ход зависит от оценки его последствий. В случае игры с одновременными ходами перед вами стоит более сложная задача: попытаться определить, что ваш соперник предпримет в данный момент. Однако вы должны понимать, что ваш оппонент также пытается предугадать ваш текущий ход, осознавая при этом, что вы делаете то же самое по отношению к нему. И вам обоим придется найти выход из этого замкнутого круга.
В следующих трех главах мы рассмотрим эти два чистых случая. В проанализируем игры с последовательными ходами, в которых вы должны думать на несколько шагов вперед, а действовать сейчас; и посвящены играм с одновременными ходами; в них вам предстоит совершить невозможное в ситуации «Он думает, что я думаю, что он думает…». В каждом из этих случаев мы предложим вам простые инструменты выполнения такого анализа (деревья и таблицы выигрышей), а также объясним ряд простых правил, которым вы должны следовать.
Изучение игр с последовательными ходами позволяет определить, когда выгодно делать ход первым, а когда вторым. Грубо говоря, это зависит от относительной важности обязательств и гибкости в рассматриваемой игре. Например, в такой игре, как экономическая конкуренция между соперничающими на рынке компаниями, применяется преимущество первого хода, если одна компания, твердо решив вести агрессивную конкурентную борьбу, может опередить конкурентов. Однако в случае политической конкуренции кандидат, который занял твердую позицию по тому или иному вопросу, может дать соперникам четкую цель для контрагитации, а значит, в такой игре мы наблюдаем преимущество второго хода.
Умение учитывать все эти факторы и достигать их оптимального соотношения может помочь вам разработать способы манипулировать порядком ходов в свою пользу. Это, в свою очередь, приводит к изучению таких стратегических шагов, как угрозы и обещания, которые мы будем рассматривать в .
Б. У игроков есть общие интересы или они полностью противоречат друг другу?
В простых играх, таких как шахматы или футбол, есть победитель и побежденный. Победа одного игрока означает поражение другого. Точно так же в азартных играх выигрыш одного игрока означает проигрыш другого, то есть общий итог равен 0. Именно поэтому эти ситуации называют играми с нулевой суммой. Общая идея состоит в том, что в подобных играх интересы игроков полностью противоречат друг другу. Такой конфликт интересов возникает в случаях, когда игроки делят между собой фиксированную сумму возможного выигрыша, в каких бы единицах он ни измерялся — в ярдах, долларах, акрах или шариках мороженого. Поскольку общий итог не всегда равен 0, термин «игра с нулевой суммой» часто заменяется термином «игра с постоянной суммой». Мы будем использовать эти термины как синонимы.
Большинство экономических и социальных игр не относятся к категории игр с нулевой суммой. Торговля или экономическая деятельность в более общем смысле предлагает широкие возможности для сделок, приносящих пользу всем. Совместные предприятия могут использовать совокупность навыков отдельных участников, тем самым создавая синергию, позволяющую выпускать больше продукции, чем они могли бы произвести по отдельности. Однако в этих случаях интересы партнеров не всегда совпадают: партнеры могут сотрудничать, чтобы создать больший общий «пирог», но начнут конфликтовать, когда дело дойдет до его дележа.
Даже войны и забастовки не относятся к числу игр с нулевой суммой. Ядерная война — самый яркий пример ситуации, в которой могут быть только проигравшие, однако на самом деле концепция игр с нулевой суммой появилась гораздо раньше. В 280 году до н. э. царь Эпира Пирр, одержав победу над римлянами у Гераклеи слишком дорогой ценой для своей армии, воскликнул: «Еще одна такая победа — и мы погибнем!» Отсюда и выражение «пиррова победа». В 1980-х годах, в разгар ажиотажа вокруг поглощения компаний, битвы между конкурирующими покупателями приводили к настолько разорительному повышению цен, что победа одного из покупателей зачастую напоминала пиррову.
В действительности большинству игр присуще противоречие между конфликтом и партнерством, и многие из самых интересных примеров анализа в теории игр связаны с необходимостью его устранения. Игроки пытаются разрешить конфликт (разделить территорию или прибыль) исходя из знания о том, что, если им не удастся договориться, результат окажется неблагоприятным для всех участников игры. При этом угроза одной из сторон начать войну или забастовку представляет собой способ запугать другую сторону, чтобы та согласилась на выдвигаемые требования.
Даже в случае игры с постоянной суммой для всех игроков, если в ней три (или более) участника, существует вероятность, что два из них объединятся против третьего, что приводит к необходимости изучения альянсов и коалиций. Мы проанализируем и проиллюстрируем эти идеи позже, особенно в о переговорах.
В. Игра проводится разово или многократно, с одним и тем же или с меняющимися соперниками?
Игра, которая проводится один раз, в чем-то проще, а в чем-то сложнее игры, включающей в себя множество взаимодействий. Вы можете анализировать однократную игру, не задумываясь о ее последствиях для других игр, в которые вам, не исключено, придется играть в будущем против того же человека или людей, возможно, слышавших о ваших действиях в данной игре. Следовательно, действия в однократных играх могут быть безнравственными или жесткими. Например, в автомастерской завышенную цену скорее назначат проезжающему водителю, чем постоянному клиенту.
В однократных играх каждый игрок мало знает об остальных — например, каковы их возможности и приоритеты, умеют ли они просчитывать свои наилучшие стратегии, есть ли у них слабые стороны, которые можно было бы использовать, и т. д. Следовательно, в таких играх конфиденциальность или неожиданность — важная составляющая эффективной стратегии.
Игры с развивающимися отношениями требуют противоположных рассуждений. Здесь у вас есть шанс создать себе репутацию (жесткости, справедливости, честности, надежности и пр., в зависимости от обстоятельств), а также больше узнать о сопернике. Вместе игроки могут лучше использовать взаимовыгодные перспективы, договорившись со временем разделить трофеи («выигрывая» по очереди) или наказать обманщика в будущих играх (стратегия равноценных ответных действий, или «око за око»). Эти возможности более подробно рассматриваются в , посвященной дилемме заключенных.
В более общем смысле игра может быть с нулевой сумой в краткосрочном периоде, но при этом иметь взаимовыгодные сферы сотрудничества в долгосрочном периоде. Например, каждая футбольная команда предпочитает выигрывать, но все команды понимают, что упорная борьба между ними вызывает больший зрительский интерес, что приносит обеим командам пользу в долгосрочной перспективе. Именно поэтому команды договариваются о такой схеме привлечения игроков, в соответствии с которой они должны выбирать игроков в порядке, обратном их текущим позициям, тем самым нивелируя неравенство талантов. В забегах или заездах на длинные дистанции бегуны или велосипедисты часто прибегают к сотрудничеству: два или более спортсменов могут помогать друг другу, по очереди передвигаясь в слипстриме. Однако в конце гонки сотрудничество прекращается и все участники делают стремительный рывок к финишной черте.
Вот полезное эмпирическое правило для ваших собственных стратегических действий в жизни. В игре, где присутствует определенная доля конфликта и сотрудничества, вы часто будете разрабатывать отличные стратегии того, как сорвать крупный куш и стереть соперника в порошок, но при этом вас неизменно будет преследовать ощущение, что вы ведете себя как худший образец яппи 1980-х. В такой ситуации велика вероятность того, что в игре есть повторяющийся или постоянный аспект, который вы упустили из виду. Ваша агрессивная стратегия может обеспечить вам краткосрочное преимущество, но ее долгосрочные побочные эффекты обойдутся вам гораздо дороже. Следовательно, вам необходимо копнуть глубже и найти элемент сотрудничества, а затем внести соответствующие коррективы в стратегию. Вы будете удивлены, как часто вежливость, порядочность и золотое правило поступать с людьми так, как вы хотели бы, чтобы поступали с вами, оказываются не просто старинными проверенными средствами от всех бед, а и эффективными стратегиями во всем комплексе игр, в которые вы будете играть на протяжении жизни.
Г. Располагают ли игроки полной или равноценной информацией?
В шахматах каждый игрок точно знает текущую ситуацию и все ходы, которые к ней привели, а также тот факт, что соперник тоже ставит перед собой цель выиграть. Эта ситуация исключительная: участники большинства других игр сталкиваются с определенными ограничениями информации, которые бывают двух видов. Во-первых, игрок может не знать всей информации, имеющей отношение к выбору, который ему предстоит делать в каждый момент игры. Такая информационная проблема возникает по причине неопределенности игрока относительно соответствующих переменных, которые носят как внутренний, так и внешний характер по отношению к самой игре. Например, игрок может не знать наверняка, какими будут внешние обстоятельства, такие как погода во время выходных или качество продукта, который он хочет купить; мы называем эту ситуацию внешней неопределенностью. Или игрок может сомневаться насчет того, какие именно ходы сделал его соперник в прошлом или делает одновременно с его собственными ходами; мы называем это стратегической неопределенностью. Если в игре нет ни внешней, ни стратегической неопределенности, мы говорим, что это игра с совершенной информацией; в противном случае — игра с несовершенной информацией. Более точное формальное определение совершенной информации мы дадим в после введения концепции информационного множества. Теория игр с несовершенной информацией (неопределенностью) представлена в трех главах. В мы поговорим об играх с одновременными действиями, которые влекут за собой стратегическую неопределенность, а в и проанализируем методы выбора в условиях неопределенности.
Более сложные стратегические ситуации складываются в случаях, когда одному игроку известно больше, чем другому, и называются играми с неполной или (что еще лучше) с асимметричной информацией. В подобных ситуациях попытки игрока логически вывести, скрыть, а иногда и сообщить личную информацию становятся важным элементом игры и стратегий. В бридже или покере игрок располагает частичной информацией о картах соперников. Их действия (заявка и розыгрыш в бридже, количество взятых карт и поведение игрока в покере) дают противнику определенные сведения. Каждый игрок пытается манипулировать своими действиями, чтобы ввести соперников в заблуждение (а в бридже — чтобы передать правдивую информацию партнеру), однако при этом должен учитывать, что оппонентам это известно и они используют свое стратегическое мышление для того, чтобы соответствующим образом интерпретировать его действия.
Возможно, вам кажется, что, владея исключительной информацией, вы всегда должны скрывать ее от соперников. Но это не так. Предположим, вы управляете фармацевтической компанией, которая параллельно с другими компаниями занимается разработкой нового лекарственного препарата. Если ваши ученые делают поистине революционное открытие, вы можете сообщить об этом конкурентам в расчете на то, что они прекратят разработки и вам не придется конкурировать с ними в будущем. Во время войны каждая из сторон хочет сохранить свою тактику и данные о расположении войск в тайне, однако в дипломатии, если у вас мирные намерения, вы отчаянно нуждаетесь в том, чтобы другие страны узнали и поверили в этот факт.
Общий принцип таков: необходимо раскрывать информацию выборочно. Вы должны обнародовать хорошую информацию (то есть ту, которая повлечет за собой выгодные для вас ответные действия других игроков) и скрывать плохую (то есть ту, которая может нанести вам вред).
Однако здесь возникает одна проблема. Ваши соперники по стратегической игре — это целеустремленные, рациональные игроки, и они знают, что вы тоже относитесь к их числу. Такие соперники обязательно распознают ваш побудительный мотив преувеличить или даже солгать. Следовательно, они не примут ничем не подкрепленные заявления о ваших успехах или возможностях. Их убедят только объективные данные или действия, подтверждающие надежность вашей информации. Такие действия со стороны более осведомленного игрока называются сигналами, а стратегии, которые их используют, — сигнализированием. Напротив, менее осведомленный игрок может создавать ситуации, в которых более осведомленному игроку придется предпринять действия, достоверно раскрывающие информацию о нем; такие стратегии называются скрининговыми, а применяемые в них методы — инструментами скрининга. Слово скрининг употребляется здесь в значении проверки в целях просеивания или разделения информации, а не в смысле ее сокрытия.
Иногда одно и то же действие может использоваться и в качестве сигнала со стороны осведомленного игрока, и в качестве инструмента скрининга, применяемого неосведомленным игроком. Вспомните об игре в свидания из , в которой женщина проверяла серьезность отношений с партнером, предложив ему отказаться от одной из квартир с регулируемой арендной платой, что представляло собой инструмент скрининга. Если бы мужчина дорожил их отношениями, он мог бы начать действовать первым и добровольно отказаться от своей квартиры, что сигнализировало бы о серьезности его намерений.
Теперь мы видим, что когда разные игроки имеют различную информацию, то само манипулирование ею становится стратегической игрой, возможно, даже более значимой, чем та, которая начнется после информационного этапа. Такие информационные игры распространены повсеместно, и умение хорошо в них играть очень важно для достижения успеха в жизни. Мы подробно изучим эти игры в и .
Д. Являются ли правила игры фиксированными или ими можно манипулировать?
Правила игры в шахматы, карточные или спортивные игры устанавливаются заранее, и каждый игрок должен их придерживаться, какими бы необоснованными или странными они ни казались. Тем не менее в играх, которые ведутся в бизнесе, политике и обычной жизни, игроки могут следовать собственным правилам. Например, в семьях родители постоянно диктуют правила, а дети неизменно ищут способы ими манипулировать или их обходить. В законодательных органах правила продвижения законопроекта (в том числе порядок голосования по поправкам и основным предложениям) зафиксированы, однако в игре с определением повестки дня (какие поправки ставятся на голосование первыми) возможны манипуляции. Именно здесь больше всего вариантов задействовать политическое мастерство и политическую власть. Мы обсудим эти вопросы подробнее в .
В таких ситуациях настоящая игра происходит на ее предварительном этапе, в ходе которого устанавливаются правила; и свои стратегические навыки вы должны применить непосредственно в этот момент. Фактическое ведение дальнейшей игры может носить сугубо механический характер, вы даже могли бы делегировать эту задачу кому-то другому. Однако, «проспав» предварительный этап, вы рискуете обнаружить, что проиграли игру еще до ее начала. На протяжении многих лет американские компании именно так игнорировали рост внешней конкуренции, за что в итоге и поплатились. Но некоторые предприниматели, такие как нефтяной магнат Джон Рокфеллер — старший, взяли на вооружение стратегию участия только в тех играх, в которых они вольны устанавливать правила.
Различие между изменением правил и действиями в рамках выбранных правил будет для нас наиболее важным при изучении таких стратегических ходов, как угрозы и обещания. По сути, вопрос о том, как сделать свои угрозы и обещания достоверными или как снизить уровень достоверности угроз соперника, относится к предварительному этапу игры, когда происходит манипулирование правилами дальнейшей игры и может возникнуть необходимость в выполнении обещаний или угроз. В более общем смысле такие стратегические ходы, которые мы рассмотрим в , фактически представляют собой приемы для подобных манипуляций.
Но если манипулирование правилами и есть настоящая игра, то что тогда определяет правила самой предварительной игры? В большинстве случаев они зависят от достоверных фактов о врожденных способностях игроков. В условиях конкуренции в бизнесе одна компания может предпринять упреждающие действия, которые изменят последующие игры между нею и конкурентами. В частности, она может расширить свои производственные мощности или рекламировать свою продукцию таким образом, что это изменит результаты последующей ценовой конкуренции в ее пользу. Какой компании удастся это осуществить быстрее или проще, зависит от наличия необходимых управленческих или организационных ресурсов, позволяющих сделать инвестиции или запустить рекламную кампанию.
Кроме того, игроки не всегда осведомлены о способностях соперников, что зачастую превращает предварительную игру в игру с неполной или асимметричной информацией, которая требует более тонких стратегий и время от времени приводит к большим неожиданностям. Мы прокомментируем все эти вопросы в соответствующих разделах следующих глав.
Е. Можно ли обеспечить выполнение соглашений о сотрудничестве?
Мы видели, что большинство стратегических взаимодействий состоят из смешения конфликта и общих интересов. Стало быть, у участников взаимодействия есть все основания собраться и договориться о том, что каждый из них должен делать, чтобы уравновесить взаимную заинтересованность в максимизации общей выгоды и устранить противоречия в плане разделения выигрыша. Такие переговоры могут вестись в несколько раундов, в ходе которых переговорщики заключают предварительные соглашения, ищут более приемлемые альтернативы и завершают сделку только тогда, когда ни одна группа игроков не находит что-либо лучше. Тем не менее даже после окончания процесса часто возникают дополнительные трудности с практической реализацией достигнутого соглашения. Например, все игроки в конечном счете должны выполнить оговоренные в соглашении действия. А когда все остальные делают это, отдельно взятый игрок может получить более приемлемый для себя результат, делая нечто иное. И если каждый из них подозревает, что остальные могут его таким образом обмануть, было бы глупо с его стороны придерживаться договоренностей.
Соглашения о сотрудничестве будут эффективными, если все игроки действуют незамедлительно в присутствии всей группы, однако такие договоры достаточно редки. Гораздо чаще участники игры расходятся после достижения соглашения и предпринимают свои действия в частном порядке. Тем не менее если за этими действиями могут наблюдать другие игроки, а третья сторона (например, суд) способна обеспечить их выполнение, то соглашение о сотрудничестве может достичь поставленной цели.
Однако зачастую действия отдельных игроков не поддаются непосредственному наблюдению или принудительному выполнению, а без этого соглашение о сотрудничестве может достичь цели только в случае, если соблюдение его условий отвечает интересам всех участников игры. К этой категории относятся игры между суверенными странами, многие игры с личной информацией и игры, в которых действия либо находятся вне закона, либо слишком тривиальны, либо требуют чересчур больших затрат, чтобы обеспечивать их выполнение в суде. На самом деле игры, в которых соглашение о совместных действиях не имеет силы, составляют подавляющее большинство стратегических взаимодействий.
В теории игр используются специальные термины, отображающие различие между ситуациями, в которых соглашения о сотрудничестве подлежат исполнению и в которых их реализация невозможна. Первые называются кооперативными играми; вторые — некооперативными играми. Эти термины стали общепринятыми, хотя они не совсем удачны, поскольку создается впечатление, будто первая категория игр обеспечивает кооперативный исход, тогда как вторая — нет. В действительности отдельное действие может соответствовать достижению большой взаимной выгоды, особенно в случае повторяющихся взаимодействий. Важное различие состоит в том, что в так называемых некооперативных играх сотрудничество осуществляется только в случае, если каждый отдельно взятый участник игры заинтересован в продолжении выполнения предписанных действий. Возможность получения кооперативного исхода от некооперативного поведения — одно из самых интересных открытий теории игр. Мы остановимся на нем более подробно в , и .
Мы будем придерживаться стандартного употребления терминов кооперативная игра и некооперативная игра, но с оговоркой, что они описывают не характер полученных результатов, а способ реализации или принудительного выполнения соответствующих действий (общими усилиями в первом случае и в индивидуальном порядке во втором).
Как мы уже отмечали, на практике в большинстве игр нет адекватного механизма контроля за выполнением соглашений о совместных действиях. Следовательно, большая часть наших аналитических материалов будет посвящена некооперативным играм. Единственное исключение составит обсуждение темы переговоров в .
3. Некоторые термины и исходные предположения
В процессе анализа стратегической игры было бы логично начать с определения ее структуры, включающей доступные для всех игроков стратегии, информацию и цели. Первые два аспекта в каждой игре имеют свою специфику и отличаются друг от друга параметрами, рассмотренными в предыдущем разделе, поэтому игрок должен определить позицию своей игры в этой системе. В связи с целями возникает ряд новых и интересных понятий. Ниже мы проанализируем различные аспекты этих вопросов.
А. Стратегии
Стратегии — это не что иное, как имеющиеся в распоряжении игроков варианты выбора, однако даже эта базовая концепция требует дальнейшего изучения и уточнения. Если игра состоит исключительно из одновременных разовых ходов, то стратегия каждого игрока сводится к однократному выполнению соответствующего действия. Однако если игра состоит из последовательных ходов, то игрок, делающий ход на более позднем этапе, может отреагировать на действия других игроков (или собственные действия), предпринятые на предыдущих этапах. Следовательно, каждый игрок должен составить исчерпывающий план подобных действий: «Если другой игрок предпримет действие А, то я выполню Х, но если он сделает Б, я выберу Y». Исчерпывающий план действий представляет собой стратегию такой игры.
Для того чтобы понять, можно ли считать вашу стратегию исчерпывающей, достаточно ответить на один простой вопрос: содержит ли она настолько четкие указания в отношении ведения игры (с описанием ваших действий в любых непредвиденных обстоятельствах), что если вы запишете их на бумаге, отдадите другому человеку и уедете в отпуск, то этот человек, действуя в качестве вашего представителя, сможет вести игру точно так же, как это сделали бы вы сами? Этот человек будет знать, как поступать в каждой ситуации, возникающей в ходе игры, и у него отпадет необходимость беспокоить вас во время отпуска.
Мы рассмотрим этот простой тест более подробно в , где раскроем его суть и применим в некоторых конкретных ситуациях. А пока вам просто следует помнить, что стратегия — это исчерпывающий план действий.
Данная концепция вписывается в стандартную трактовку слова «стратегия» как долгосрочного или масштабного плана действий, в отличие от тактики, которая связана с краткосрочными или менее масштабными планами. Например, генералы армии составляют стратегические планы войны или крупного сражения, тогда как нижестоящие офицеры разрабатывают тактику для более мелких столкновений или конкретного театра военных действий с учетом местных условий. Однако в теории игр термин «тактика» вообще не применяется. Термин «стратегия» охватывает все ситуации, обозначая как исчерпывающий план предпринимаемых действий, так и единственный ход, если это все, что требуется в конкретной игре.
Кроме того, слово «стратегия» широко используется для обозначения решений человека, касающихся довольно продолжительного периода жизни и последовательности вариантов выбора, хотя здесь и нет игры в нашем понимании этого слова, то есть как целенаправленного взаимодействия с другими людьми. По всей вероятности, вы уже определились со стратегией построения карьеры. Когда вы начнете получать доход, вам понадобится разработать стратегию сбережений и инвестиций, а со временем запланировать стратегию выхода на пенсию. Такое использование термина «стратегия» совпадает с нашим пониманием стратегии как плана выполнения последовательности действий в ответ на меняющиеся обстоятельства. Единственное различие — мы обозначаем этим термином ситуацию (а именно игру), в которой обстоятельства возникают в результате действий, предпринятых другими целеустремленными игроками.
Б. Выигрыши
На вопрос, какова цель участника игры, большинство новичков в области стратегического мышления отвечают: выиграть. Однако далеко не всегда все так просто. Порой весомое значение имеет уровень победы. Например, если при разработке нового продукта ваш вариант оказывается лишь чуточку лучше, чем у конкурентов, велика вероятность того, что ваш патент могут оспорить. Иногда могут быть и более мелкие призы для нескольких участников игры, а значит, победа — это еще не все. Самое важное, что стратегических игр исключительно с нулевой суммой, или тех, в которых одна сторона выигрывает, а другая проигрывает, совсем мало. Как правило, они сочетают в себе элементы как общего интереса, так и конфликта между игроками. Анализ таких игр со смешанными мотивами требует более точных расчетов, чем простая дихотомия «выигрыш/проигрыш», например сравнения выгоды от сотрудничества с выгодой от отказа от него.
Мы предоставим в распоряжение каждого игрока полноценную числовую шкалу, с которой он сможет сравнивать все логически допустимые исходы игры, отвечающие каждой возможной комбинации вариантов выбора стратегий всеми игроками. Число, соответствующее каждому возможному исходу игры, называется выигрышем игрока для данного исхода. Более высокое значение выигрыша соотносится с результатом, который считается лучшим в системе оценок этого игрока.
Иногда выигрыш представляет собой простой численный рейтинг исходов игры, в котором самый худший исход имеет рейтинг 1, следующий — рейтинг 2 и так далее вплоть до лучшего исхода. В других играх может быть более естественная числовая шкала — например, денежный доход или прибыль компаний, доля зрителей телевизионных сетей и т. д. Зачастую величина выигрыша — всего лишь эмпирическая оценка. В таких случаях необходимо убедиться, что итоги анализа существенно не изменятся в результате изменения этих оценок в рамках допустимого предела погрешности.
В отношении выигрышей нужно четко понимать два важных момента. Во-первых, выигрыш одного игрока охватывает все аспекты исхода игры, представляющие для него интерес. В частности, игроку необязательно быть эгоистом, однако его забота о других должна быть включена в числовую шкалу выигрышей. Во-вторых, мы будем исходить из предположения, что если игрок сталкивается со случайным множеством исходов игры, то число, связанное с этим множеством, представляет собой среднее от выигрышей по каждому отдельному исходу, взвешенных по их вероятности. Таким образом, если в рейтинге одного игрока исход А имеет выигрыш 0, а исход Б — выигрыш 100, то множество исходов А с вероятностью 75 процентов и Б с вероятностью 25 процентов должно обеспечивать выигрыш 0,75 × 0 + 0,25 × 100 = 25. Этот показатель часто называют ожидаемым выигрышем от случайного множества исходов игры. Слово «ожидаемый» имеет особый подтекст на языке теории вероятностей. Под ним подразумевается не то, что вы предполагаете или ожидаете получить, а математическое (вероятностное, статистическое) ожидание, которое означает среднее от всех возможных исходов, где каждому исходу присваивается вес, пропорциональный его вероятности.
Второй момент создает потенциальные трудности. Рассмотрим игру, в которой участники получают или теряют деньги, а выигрыш измеряется в денежной сумме. Если игрок может ничего не получить с вероятностью 75 процентов и получить 100 долларов с вероятностью 25 процентов, то ожидаемый выигрыш составит 25 долларов, если его рассчитывать так, как в предыдущем примере. Допустим, что столько же игрок бы выиграл и в результате простого неслучайного исхода. Иными словами, основываясь на таком подходе к расчету выигрышей, человеку должно быть безразлично, получит он 25 долларов наверняка или пойдет на риск в случае множества возможных исходов, по которому средний выигрыш составляет 25 долларов. На первый взгляд может показаться, что большинство людей предпочтут верные 25 долларов рискованной игре, обеспечивающей средний выигрыш в том же размере.
Очень простая модификация процесса вычисления выигрышей позволяет обойти эту трудность. Мы будем их измерять не в денежном выражении, а с использованием нелинейного взвешивания денежных сумм. Речь идет о методе ожидаемой полезности, на котором мы подробнее остановимся в . А пока поверьте нам на слово: включение в концептуальную модель теории игр такого показателя, как отношение игроков к риску, — вполне выполнимая задача. В теории игр почти все основано на методе ожидаемой полезности, и он действительно полезен, хотя и не лишен недостатков. Мы будем его придерживаться в данной книге, но при этом укажем на ряд проблем, которые он оставляет нерешенными. Простой пример применения этого метода представлен в .
В. Рациональность
Цель каждого участника игры — получить максимально возможный выигрыш. Но насколько успешно каждый игрок справляется с ее реализацией? Этот вопрос касается самой природы игры со стратегическим взаимодействием, а не того, как другие игроки, преследующие собственные интересы, будут препятствовать этому игроку. Получение высокого выигрыша зависит скорее от того, насколько хорошо игрок умеет подбирать стратегию, наилучшим образом соответствующую его интересам, и в какой степени придерживается ее в ходе игры.
В большинстве случаев теория игр исходит из предположения, что игроки умеют это делать. Это предположение о рациональном поведении. Обратите внимание, в каком именно значении здесь используется слово рациональный. Подразумевается наличие у каждого игрока непротиворечивой системы ранжирования (ценностей и выигрышей) по всем логически возможным исходам игры и способности вычислять стратегию, максимально отвечающую его интересам. Следовательно, рациональность имеет две основные составляющие: полное понимание собственных интересов и безукоризненный расчет действий, наилучшим образом им соответствующий.
Не менее важно понимать, что не входит в концепцию рационального поведения. Рациональность не означает, что игроки эгоистичны: игрок может высоко ценить благополучие другого игрока (игроков) и включить эту оценку в свои выигрыши. Рациональность также не означает, что игроки мыслят в краткосрочной перспективе; на самом деле анализ последствий — важный аспект стратегического мышления, а действия, которые кажутся иррациональными в ближайшей перспективе, в дальнейшем могут играть существенную стратегическую роль. Быть рациональным не значит иметь такую же систему ценностей, как другие игроки, или разумные люди, или люди с высокими этическими и моральными принципами. Быть рациональным — это просто четко придерживаться собственной системы ценностей. Поэтому, когда один игрок анализирует реакцию других игроков в игре с последовательными шагами или сменяющиеся раунды в игре с одновременными ходами, он должен признать, что другие игроки просчитывают последствия своего выбора посредством собственной системы ценностей или ранжирования. Вы не должны приписывать им свою систему ценностей или свои стандарты рациональности, а также исходить из того, что они будут действовать так, как поступили бы в данной ситуации вы. В свое время многие «эксперты», комментировавшие вооруженный конфликт в Персидском заливе в конце 1990-х, а затем в 2002–2003 годах, выдвигали предположение, что Саддам Хусейн сдастся, «поскольку он рациональный человек». Однако они не понимали, что система ценностей Хусейна отличается от системы ценностей большинства западных правительств и экспертов.
Как правило, игроки даже не знают о системах ценностей других игроков; это одна из причин того, почему в действительности многие игры относятся к категории игр с неполной или асимметричной информацией. В таких играх попытки определить ценности других игроков и скрыть или продемонстрировать собственные — важный элемент стратегии.
Теория игр исходит из предположения, что рациональность свойственна всем игрокам. Насколько оно корректно, а следовательно, насколько эффективна теория, использующая его? С одной стороны, очевидно, что это предположение не может быть истинным в буквальном смысле слова. Зачастую люди даже не знают, какой будет их система ценностей, они не думают заранее, как будут ранжировать гипотетические альтернативы, а затем запоминать их рейтинг, пока не столкнутся с проблемой выбора. Поэтому им трудно отследить все возможные последствия различных вариантов стратегического выбора, который могут сделать они и другие игроки, и загодя составить рейтинг различных исходов игры, чтобы определиться с выбором стратегии. Даже если бы они знали свои предпочтения, процесс вычислений все равно был бы далеко не прост. Большинство игр в реальной жизни очень сложны, а многие реальные игроки имеют ограниченные мыслительные и вычислительные способности. Известно, что в таких играх, как шахматы, лучшую стратегию можно вычислить посредством конечного числа шагов, но оно настолько велико, что еще никому не удавалось выполнить такие расчеты, и хорошая игра по-прежнему в значительной мере остается искусством.
Предположение о рациональности приближается к реальности тогда, когда игроки — постоянные участники игры, играющие в нее достаточно часто и извлекающие для себя пользу из ее различных исходов. Такие игроки понимают, как стратегический выбор соперников приводит к тем или иным исходам и насколько хорошо или плохо играют они сами. В этом случае мы можем рассчитывать, что их выбор, даже сделанный не посредством исчерпывающих и осмысленных вычислений, весьма к ним близок. Мы будем считать, что эти игроки неявно выбирают оптимальную стратегию или ведут себя так, будто умеют выполнять такие расчеты наилучшим образом. В представлены экспериментальные доказательства того, что накопление опыта ведения игры обусловливает формирование более рационального поведения.
Определение самой лучшей стратегии с учетом аналогичных вычислений соперника — гарантия того, что вы не совершите ошибок, которыми он сможет воспользоваться. Во многих реальных ситуациях вы можете располагать конкретной информацией о том, в чем именно другие игроки недотягивают до стандарта рациональности, и воспользоваться ею в процессе разработки собственной стратегии. Мы кое-что расскажем о подобных расчетах, однако зачастую это все же элемент искусства ведения игр, и его трудно представить в виде правил, подлежащих выполнению. Вы всегда должны помнить о том, что соперники могут просто притворяться, что у них плохие навыки или неэффективная стратегия, проигрывая незначительные суммы в результате плохой игры в надежде на то, что вы поднимете ставки, а они продемонстрируют свой реальный уровень игры и воспользуются вашей доверчивостью. При наличии такого риска безопаснее отталкиваться от предположения, что соперники ведут себя рационально и умеют делать необходимые вычисления, и выбирать лучший ответ на их действия. Иными словами, вам следует исходить из возможностей соперников, а не из их ограничений.
Г. Общее знание правил
Мы полагаем, что на определенном уровне у игроков есть общее понимание правил игры. В комиксе Peanuts («Мелочь пузатая») Люси считала, что в гольфе разрешены силовые приемы, и сбила Чарли Брауна с ног как раз в тот момент, когда он собирался сделать свинг. В теории игр это недопустимо.
Оговорка «на определенном уровне» крайне важна. Мы уже видели, как можно манипулировать правилами текущей игры. Но это лишь признание того, что на более глубоком уровне ведется другая игра — та, в ходе которой игроки выбирают правила игры верхнего уровня. В таком случае возникает резонный вопрос: фиксированы ли эти правила? Например, обратимся к законодательному контексту: каковы правила игры в процессе формирования повестки дня? Они могут сводиться к наличию у председателей комитетов тех или иных полномочий. Тогда как избираются члены комитетов и их председатели? И так далее. На определенном базовом уровне эти правила закреплены конституцией, технологией проведения предвыборной кампании или общими социальными нормами поведения. Мы считаем, что все игроки должны признавать правила этой базовой игры, что и составляет предмет анализа. Безусловно, это идеал; на практике вам может и не представиться возможности продвинуться на достаточно глубокий уровень анализа.
Строго говоря, правила игры состоят: 1) из списка игроков; 2) стратегии, имеющейся в распоряжении каждого игрока; 3) выигрышей каждого игрока по всем возможным комбинациям стратегий, которых придерживаются все игроки; 4) предположения о том, что каждый игрок — это рациональный максимизатор.
Теория игр не позволяет должным образом проанализировать ситуацию, когда один игрок не знает, участвует ли другой игрок в игре, из какого общего множества действий другие игроки выбирают свои действия, какова их система ценностей и являются ли они сознательными максимизаторами своего выигрыша. Однако в реальных стратегических взаимодействиях самую большую выгоду порой можно получить, воспользовавшись элементом неожиданности или совершив то, чего ваши соперники от вас никак не ожидали. Ряд ярких примеров подобного поведения можно найти среди исторических военных конфликтов. Так, в 1967 году Израиль нанес упреждающий удар и уничтожил военно-воздушные силы Египта прямо на земле; в 1973 году наступила очередь Египта застать противника врасплох, начав танковую атаку по всему району Суэцкого канала.
Создается впечатление, что строгое определение теории игр не учитывает столь важного аспекта стратегического поведения, но на самом деле все не так плохо. Теорию можно сформулировать таким образом, чтобы каждый игрок присваивал некую небольшую вероятность ситуации, когда другим игрокам доступны кардинально отличающиеся стратегии. Безусловно, каждый игрок знает имеющийся у него набор стратегий. Следовательно, игра становится игрой с асимметричной информацией и может вестись с использованием методов, представленных в .
Сама концепция общего знания требует некоторого пояснения. Для того чтобы определенная информация или ситуация X представляла собой общее знание двух человек, А и Б, недостаточно, чтобы каждому из них было известно об Х в отдельности. Каждый игрок должен также знать, что другой знает об Х, в противном случае А может подумать, что Б неизвестно об Х, и в разгар игры предпринять то или иное действие исходя из этого заблуждения. Однако тогда игрок А тоже должен знать, что Б знает, что А знает об Х, и наоборот, иначе А может по ошибке воспользоваться предполагаемым неведением Б о знании А. Безусловно, это еще не конец. Игрок А должен знать, что Б знает, что А знает, что Б знает, и так до бесконечности. Философы находят много забавного в изучении тонкостей этой бесконечной регрессии и тех интеллектуальных парадоксов, которые она может генерировать. Для нас общего представления о том, что игрокам свойственно общее понимание правил игры, будет достаточно.
Д. Равновесие
Что происходит при взаимодействии стратегий рациональных игроков? В большинстве случаев ответ на этот вопрос сводится к концепции равновесия, под которой подразумевается, что каждый игрок использует стратегию, которая является лучшим откликом на стратегии других игроков. Мы сформулируем теоретико-игровые концепции равновесия в главах 3−7, а затем используем их в последующих главах.
Равновесие не означает, что ситуация не меняется; в играх с последовательными ходами стратегии игроков представляют собой исчерпывающий план действий и ответных реакций, а ситуация постоянно развивается по мере выполнения очередных ходов и реагирования на них. Равновесие также не означает, что складывается благоприятный ход игры; взаимодействие выбранных всеми игроками рациональных стратегий может привести к отрицательным результатам для всех, как в дилемме заключенных. Тем не менее в большинстве случаев мы будем исходить из того, что равновесие — полезный описательный инструмент и организующая концепция анализа игры. Подробнее мы рассмотрим эту идею позже, при обсуждении конкретных концепций равновесия. Мы также увидим, как понятие равновесия можно расширить или модифицировать, чтобы устранить некоторые его недостатки и включить в него поведение, которое недотягивает до полной расчетливой рациональности.
Подобно тому как рациональное поведение отдельных игроков может стать следствием накопления ими опыта ведения игры, они могут научиться корреспондировать свой выбор с общим равновесием после нескольких раундов игры, которые проводятся методом проб и ошибок и заканчиваются неравновесным исходом. Мы рассмотрим этот вопрос в .
Определить равновесие нетрудно, а вот найти его в конкретной игре (иными словами, решить ее) гораздо сложнее. На протяжении всей книги мы разберем целый ряд простых игр с участием двух или трех игроков, каждый из которых использует две-три стратегии или делает ход по очереди. Многие полагают, что это и есть предел возможностей теории игр, считая ее бесполезной для более сложных игр, ведущихся в действительности. Однако это не так.
Человек сильно ограничен в плане скорости вычислений (особенно длинных) и терпения при их выполнении. Следовательно, он способен легко решать только простые игры с двумя-тремя участниками и стратегиями. Но компьютеры прекрасно справляются с подобной задачей. Многие игры, решение которых выходит за рамки вычислительных возможностей человека, компьютерам вполне под силу. Они уже сейчас без проблем решают игры с высоким уровнем сложности, касающиеся бизнеса и политики. Даже в таких играх, как шахматы, которые слишком сложны, чтобы их можно было решить полностью, потенциал компьютеров уже сопоставим с возможностями самых именитых гроссмейстеров. Мы поговорим о шахматах более подробно в .
В настоящее время существует немало компьютерных программ для решения достаточно сложных игр, и постоянно появляются новые. Mathematica и другие аналогичные программные пакеты содержат стандартные программы для поиска равновесий в смешанных стратегиях в играх с одновременными ходами. В рамках проекта Национального научного фонда Gambit («Гамбит»), возглавляемого профессором Калифорнийского технологического института Ричардом Маккелви и профессором Миннесотского университета Эндрю Макленнаном, разрабатывается всеобъемлющий набор стандартных программ для поиска равновесий в играх с последовательными и одновременными ходами, в чистых и смешанных стратегиях, а также в играх с разными уровнями неопределенности и неполной информацией. В нескольких следующих главах мы будем неоднократно возвращаться к этому проекту. Его ключевое преимущество — открытый исходный код программ, доступ к которому можно получить на сайте проекта .
Но тогда зачем мы подробно описываем в этой книге решение ряда простых игр? Причина в том, что понимание концепций — важная предпосылка эффективного применения технических решений, которые может предоставить компьютер, а понимание приходит только в процессе самостоятельного выполнения ряда простых задач. Именно так вы изучили и теперь используете арифметику. Вы усвоили базовые принципы сложения, вычитания, умножения и деления путем решения простых задач устно или письменно. Теперь это знание позволяет вам выполнять на калькуляторах и компьютерах гораздо более сложные вычисления, чем те, что вы могли бы произвести вручную. Однако без понимания базовых концепций вы при использовании калькуляторов допускали бы ошибки. Например, могли бы решить пример 3 + 4 × 5 неправильно, сгруппировав слагаемые и множители как (3 + 4) × 5 = 35 вместо 3 + (4 × 5) = 23.
Следовательно, первый этап усвоения концепций и методов крайне важен. Без него вы никогда бы не научились правильно формулировать игры, решение которых возлагаете на компьютер. Вы не смогли бы проверить полученное решение на предмет его резонности, и если бы оно действительно таковым не оказалось, вы не смогли бы вернуться к первоначальному описанию игры, улучшить его и решить ее снова, поступая так до тех пор, пока описание игры и ее решение не будут корректно отображать ту стратегическую ситуацию, которую вы хотите изучить. Поэтому, пожалуйста, серьезно отнеситесь к простым примерам, решаемым в этой книге, и к предложенным нами учебным упражнениям, особенно в главах 3−7.
Е. Динамические и эволюционные игры
Теория игр, основанная на предположениях о рациональности и равновесии, весьма полезна, однако было бы ошибкой полагаться исключительно на нее. Когда игры ведут новички, не имеющие опыта выполнения необходимых вычислений для выбора оптимальных стратегий в явном или неявном виде, их выбор, а значит, и исход игры, может существенно отличаться от прогноза, полученного посредством анализа на основании концепции равновесия.
Тем не менее мы не должны отказываться от всех принципов хорошего выбора; нам следует лишь признать тот факт, что даже игроки, не владеющие навыками расчета стратегий, заинтересованы в успешном, выгодном для них исходе игры и будут учиться как на собственном опыте, так и наблюдая за другими игроками. Необходимо учитывать динамический процесс, в соответствии с которым лучшие стратегии, использовавшиеся на предыдущих этапах игры, с большей долей вероятности будут выбраны и на следующих этапах.
Именно это и делает эволюционный подход к играм, основанный на концепции эволюции в биологии. Гены любого отдельно взятого животного существенно влияют на его поведение. Некоторые модели поведения оказываются более успешными в существующей среде в том смысле, что животные, демонстрирующие их, скорее всего, будут благополучно размножаться и передадут свои гены потомству. Эволюционно устойчивое состояние, связанное с данной средой, — это и есть конечный результат процесса, охватывающего несколько поколений.
Аналогично в играх необходимо исходить из предположения, что стратегии не выбираются сознательными рациональными максимизаторами, а вместо этого каждый игрок вступает в игру с определенной «встроенной», или «запрограммированной», стратегией. Далее они противостоят другим игрокам, которые могут быть запрограммированы на применение тех же или иных стратегий. После этого все участники игр получают тот или иной выигрыш. Более эффективные стратегии (в том смысле, что игроки, запрограммированные на их применение, получают более высокий выигрыш) быстро берутся на вооружение, а использование менее результативных снижается. В биологии механизм такого развития или угасания выражается через передачу генетической информации посредством воспроизводства. В контексте стратегических игр в бизнесе и обществе он чаще всего носит социальный или культурный характер и сводится к наблюдению и имитации, обучению и получению знаний, большей доступности капитала для более успешных предприятий и т. д.
Объектом исследования является динамика данного процесса. Стремится ли он к эволюционно устойчивому состоянию? Доминирует ли в итоге одна стратегия, или несколько стратегий могут сосуществовать? Интересно, что во многих играх эволюционно устойчивый предел — это то же самое, что и равновесие, которое было бы достигнуто, если бы игроки сознательно вели себя как рациональные вычислители. Следовательно, эволюционный подход предоставляет нам лазейку для равновесного анализа.
Таким образом, концепция эволюционных игр привнесла биологические идеи в теорию игр, хотя наблюдается и обратное влияние. Биологи поняли, что важные аспекты поведения животных сводятся к стратегическому взаимодействию с другими животными. Члены одного вида конкурируют между собой за среду обитания и партнеров, члены разных видов относятся друг к другу как хищники и охотятся в рамках пищевой цепи. Выигрыш в таких играх, в свою очередь, способствует успешному размножению, а значит, и биологической эволюции. Подобно тому как теория игр извлекла для себя пользу, почерпнув идеи из биологической эволюции для анализа выбора и динамики игр, биология извлекла для себя пользу от заимствования идей теории игр в отношении стратегий и выигрышей для описания характера базовых взаимодействий между животными. Истинный пример синергии и симбиоза! Основные концепции эволюционных игр представлены в .
Ж. Наблюдение и эксперимент
Весь третий раздел главы до этого момента был посвящен тому, как анализировать игры и стратегические взаимодействия. Это теория. В данной книге она изложена на очень простом уровне с помощью примеров из практики и иллюстраций вместо формальных математических выкладок или теорем, но это все же теория. Любая теория должна соотноситься с реальностью двумя способами. Реальность должна помогать структурировать теорию и обеспечивать проверку ее результатов.
Определить реальные характеристики стратегических взаимодействий позволяют два метода: 1) наблюдение за ними в естественных условиях и 2) проведение специальных экспериментов, помогающих сделать некоторые выводы относительно влияния конкретных условий. Мы приведем несколько примеров применения каждого из этих методов в соответствующем контексте.
Многие изучали стратегические взаимодействия (поведение их участников и его результаты) в условиях эксперимента, в аудиториях среди невольных игроков или в специальных лабораториях с участием добровольцев. Аукционы, переговоры, дилемма заключенных и ряд других игр были исследованы именно таким способом и привели к разным результатам. Некоторые выводы теоретического анализа подтвердились. Например, участники игр в куплю-продажу в большинстве случаев быстро находят экономическое равновесие. В других типах игр результаты существенно отличаются от теоретических прогнозов. В частности, в дилемме заключенных и играх с переговорами участники в большей степени шли на сотрудничество, чем можно было ожидать согласно теории, основанной на предположении об эгоистичном стремлении игроков к получению максимального выигрыша, тогда как аукционы демонстрируют несколько примитивное перебивание цены.
В следующих главах мы представим краткий обзор знаний, накопленных посредством наблюдений и экспериментов, обсудим, как они соотносятся с теорией, и проанализируем, какие ее повторные интерпретации, расширения и модификации были или должны быть выполнены в свете этих знаний.
4. Функции теории игр
В начале мы говорили, что стратегические игры присутствуют буквально повсюду: в личной и трудовой жизни, в экономике, обществе и политической системе, в спорте и других серьезных занятиях, в военное и мирное время. Это должно быть достаточной мотивацией для их систематического изучения, чем и занимается теория игр. Однако наличие четкого представления о том, как применять теорию игр на практике, позволит вам более целенаправленно изучать этот предмет. Мы предлагаем вашему вниманию три функции теории игр.
Первая — объяснение. Многие события и их последствия заставляют нас задаваться вопросом: почему это произошло? Когда ситуация требует взаимодействия принимающих решения людей, которые ставят перед собой разные цели, теория игр часто предоставляет ключ к пониманию ситуации. Например, жесткая конкуренция в бизнесе — это результат попадания конкурентов в ловушку дилеммы заключенных. В нескольких местах книги мы рассмотрим реальные случаи, когда теория игр помогает понять, как и почему события развивались так, а не иначе. В частности, подробно проанализируем в Карибский кризис с точки зрения теории игр.
Оставшиеся две функции естественным образом вытекают из первой. Вторая функция — прогнозирование. Упреждающий анализ ситуаций, в которых несколько человек, принимающих решение, будут поддерживать стратегическое взаимодействие, позволяет использовать теорию игр, чтобы спрогнозировать, какие действия они предпримут и к каким последствиям это приведет. Безусловно, моделирование конкретной ситуации зависит от деталей, но мы научим вас пользоваться методом прогнозирования, проанализировав несколько широких классов игр, существующих во многих областях применения теории игр.
Третья функция теории игр — консультации или рекомендации. Мы можем действовать в интересах одного участника будущего взаимодействия и подсказать ему, какие стратегии с большей вероятностью обеспечат хорошие результаты, а какие, скорее всего, приведут к катастрофе. Такая работа тоже зависит от контекста, и мы можем вооружить вас рядом общих принципов и методов, а также показать, как их применять в некоторых общих типах ситуаций. Например, в мы объясним, как можно смешивать ходы; в проанализируем, как придать достоверность обязательствам, угрозам и обещаниям, а в рассмотрим альтернативные способы преодоления дилеммы заключенных.
Теория далека от совершенства, когда доходит до реализации одной из трех функций на практике. Для того чтобы объяснить исход игры, необходимо сначала составить правильное представление о мотивах и поведении ее участников. Как мы уже видели, в большинстве случаев теория игр придерживается особого подхода к этим вопросам — а именно модели рационального выбора отдельных игроков и равновесия их взаимодействия, но реальные игроки и взаимодействия в игре могут ей не соответствовать. Однако практика — критерий истины. Анализ с позиции теории игр существенно улучшил наше понимание многих явлений — в чем вы убедитесь, прочитав эту книгу. Теория игр продолжает развиваться и совершенствоваться благодаря непрерывным исследованиям. Эта книга поможет вам освоить ее основы, чтобы вы могли без труда изучать и пользоваться новыми достижениями в области теории игр по мере их появления.
При объяснении прошедшего события мы зачастую можем воспользоваться историческими данными для получения объективного представление о мотивах и поведении участников игры. При попытках составлять прогнозы или давать советы возникает дополнительная проблема — определить, какие мотивы обусловят действия игроков, с какими информационными и прочими ограничениями они столкнутся и кто именно будет играть. Важно помнить о следующем: если анализ с позиции теории игр отталкивается от предположения, что другой игрок — рациональный максимизатор собственных целей, хотя на самом деле он не в состоянии произвести расчеты, а то и вовсе невежда, действующий наугад, советы, основанные на этом предположении, могут не сработать. Риск такого развития событий снижается по мере того, как все больше и больше игроков осознают важность стратегического взаимодействия и просчитывают стратегические ходы или прибегают к помощи экспертов в этих вопросах, но тем не менее частично остается. Но даже в таком случае системное мышление, ставшее возможным благодаря теории игр, помогает свести количество ошибок к минимуму, устранив те, которые возникают в результате неправильных логических размышлений о стратегическом взаимодействии. Кроме того, теория игр принимает во внимание многие типы неопределенности и неполноты информации, в том числе касающиеся стратегических возможностей и рациональности соперника. В следующих главах мы рассмотрим ряд примеров, иллюстрирующих эту идею.
5. Структура оставшейся части книги
В данной главе представлен ряд идей, возникающих почти во всех реальных играх. Для того чтобы понять или предсказать исход любой игры, мы должны подробнее изучить их все. Кроме того, мы ввели несколько базовых концепций, которые будут полезны при выполнении такого анализа. Однако попытки усвоить их одновременно приводят лишь к путанице и неспособности понять их суть. Поэтому мы будем выстраивать теорию по одной концепции за раз. Для этого разработаем подходящий метод анализа соответствующей концепции и проиллюстрируем ее на конкретных примерах.
В первой группе глав (с 3-й по 7-ю) мы сконструируем и обсудим самые важные из этих понятий и методов. В рассмотрим игры с последовательными ходами и введем методы, такие как дерево игры и обратные рассуждения, используемые для анализа и решения подобных игр. В и перейдем к играм с одновременными ходами и сформулируем для них свой набор концепций: таблица выигрышей, доминирование и равновесие Нэша. Обе главы сфокусированы на играх, в которых игроки используют чистые стратегии; в мы ограничим игроков конечным множеством чистых стратегий, а в введем стратегии, представляющие собой непрерывные переменные. Кроме того, в мы рассмотрим противоречивые эмпирические данные, концептуальную критику и контраргументы против равновесия Нэша, а также его важную альтернативу — рационализируемость. В покажем, как анализировать игры с последовательными и одновременными ходами с помощью методов, представленных в главах 3−5. В обсудим игры с одновременными ходами, требующие применения метода рандомизации или смешанных стратегий. Мы начнем с введения основных идей о смешивании стратегий в играх «два на два», разработаем простейшие методы поиска равновесий Нэша в смешанных стратегиях, а затем рассмотрим более сложные примеры, содержащие эмпирические данные о смешивании стратегий.
В главах 3−7 сформулированы базовые концепции и методы: 1) правильные построения прогнозных рассуждений для игр с последовательными ходами; 2) равновесные стратегии (чистые и смешанные) для игр с одновременными ходами. Вооружившись этими концепциями и инструментами, вы сможете применить их в процессе изучения более широких классов игр и стратегий, представленных в главах 8−12.
В анализируется ситуация, когда игроки находятся в условиях неопределенности или располагают асимметричной информацией. Мы рассмотрим стратегии борьбы с риском и возможность его стратегического использования. Кроме того, изучим такие важные стратегии, как сигнализирование и скрининг, применяемые для манипулирования и получения информации. Мы разработаем приемлемое обобщение равновесия Нэша в условиях неопределенности (байесовское равновесие Нэша) и покажем различные типы равновесий, которые могут возникнуть в данном контексте. В мы продолжим изучать роль манипуляций игроков в играх и рассмотрим, как они, воспользовавшись преимуществом первого хода и сделав стратегический ход, умело воздействуют на правила игры. Такие ходы бывают трех типов — обязательства, угрозы и обещания, и их успех в значительной мере зависит от их достоверности; мы опишем в общих чертах некоторые способы ее обеспечения.
В мы изучим самую известную стратегическую игру — дилемму заключенных — и проанализируем, насколько сотрудничество в такой игре может быть устойчивым, особенно в случае повторяющегося или постоянного взаимодействия. Затем в рассмотрим стратегическое взаимодействие в больших группах, а не в парах или небольших группах игроков, иными словами, игры, касающиеся проблем коллективного действия, когда действия каждого игрока оказывают влияние (в одних случаях полезное, в других — пагубное) на остальных игроков. Как правило, исход таких игр нельзя назвать лучшим с точки зрения общества в целом. Мы объясним природу подобных исходов и опишем несколько простых методов, которые могут их улучшить.
Все эти теории и области их применения основаны на предположении, что игроки полностью осознают характер игры и применяют стратегии, максимально соответствующие их целям в этой игре. Столь рационально оптимальное поведение порой предъявляет к игроку слишком высокие требования в плане анализа информации и вычисления стратегий, чтобы можно было поверить в то, будто именно так люди себя ведут в реальной жизни. Поэтому в игры рассматриваются под совершенно другим углом. Здесь игроки не просчитывают ходы и не придерживаются оптимальных стратегий. Вместо этого каждый игрок привязан (как будто генетически предрасположен) к конкретной стратегии. Состав той или иной популяции отличается высоким уровнем многообразия, поэтому разные игроки применяют различные предопределенные стратегии. Когда такие игроки пересекаются друг с другом и активизируют свои стратегии, какие из них работают эффективнее? А если более успешные стратегии широко распространятся в данной группе, будь то посредством наследования или имитации, то как будет выглядеть со временем структура этой группы? Оказывается, такая эволюционная динамика во многих случаях отдает предпочтение именно тем стратегиям, которые использовали бы рациональные игроки, демонстрирующие оптимальное поведение. Стало быть, наш анализ эволюционных игр косвенно поддерживает те теории оптимального стратегического выбора и равновесия, которые мы изучали в предыдущих главах.
В заключительной группе глав (главы 13−17) рассматриваются конкретные примеры применения теории игр в ситуациях со стратегическими взаимодействиями. По мере необходимости мы будем использовать в них идеи и методы, представленные во всех предыдущих главах. Так, в с помощью методов, изложенных в главе 8, мы проанализируем стратегии, которые должны применять отдельные люди и компании при взаимодействии с теми, кто располагает личной информацией. Мы проиллюстрируем механизмы скрининга, используемые для получения информации, — например, многоуровневую систему тарифов с различными ограничениями, применяемую авиакомпаниями для разделения пассажиров на совершающих деловые поездки и готовых платить больше и туристов, более чувствительных к цене билетов. Кроме того, мы представим методы разработки поощрительной системы оплаты труда, позволяющей добиться от работников максимальной отдачи в случаях, когда прямой контроль затруднен или слишком дорог. В использованы идеи из для анализа особенно интересной динамической версии угрозы, известной как стратегия балансирования на грани. Мы выясним ее характер и применим при рассмотрении Карибского ракетного кризиса 1962 года. посвящена голосованию в комитетах и на выборах. Мы рассмотрим все разнообразие правил голосования, а также некоторые парадоксальные результаты, к которым они могут привести. Кроме того, проанализируем возможности для стратегического поведения не только избирателей, но и кандидатов в ходе выборов различных типов.
В и представлены механизмы распределения ценных экономических ресурсов: посвящена аукционам, а — процессу переговоров. В описании аукционов мы акцентируемся на роли информации и отношения к риску в разработке оптимальных стратегий для покупателей и продавцов. Кроме того, мы воспользуемся возможностью применить теорию игр к самому новому типу аукционов — интернет-аукционам. И наконец, в рассматриваются переговоры в кооперативной и некооперативной среде.
Поскольку в книге содержится большой объем материала, как читателям и преподавателям с профильными интересами выбрать те главы, которые им нужны? В главах 3−7 представлены ключевые теоретические концепции, которые понадобятся на протяжении оставшейся части книги. Материал и также важен для понимания общих классов игр и рассматриваемых стратегий. Все остальные главы книги можно выбирать в соответствии со своими интересами. Например, в , , и изложены более сложные темы. Эти разделы могут заинтересовать читателей с более серьезной научной и математической подготовкой, а специалисты в области общественных и гуманитарных наук могут их пропустить без потери целостности смысла. В затронут важный вопрос о наличии на практике в большинстве игр неполной или асимметричной информации, а попытки игроков манипулировать информацией — важнейший аспект многих стратегических взаимодействий. Однако концепции и методы анализа информационных игр гораздо сложнее. Учитывая это, некоторые читатели и преподаватели могут изучить только примеры, объясняющие основные идеи сигнализирования и скрининга, и опустить остальное. Тем не менее, учитывая значимость этой темы, мы разместили посвященную ей главу в самом начале третьей части книги. и — ключевые для понимания многих явлений реального мира, поэтому большинство преподавателей захотят включить их в свои учебные курсы, однако содержит более сложные математические выкладки и его можно пропустить. В и рассматриваются игры с участием большого количества игроков. В акцент сделан на социальных взаимодействиях, а в — на эволюционной биологии. Затронутые в вопросы могут представлять наибольший интерес для биологов, однако аналогичные темы появляются и в общественных науках, поэтому студенты, изучающие их, должны поставить перед собой цель вникнуть в суть изложенных концепций, даже если они упустят детали. наиболее важна для студентов, изучающих теорию бизнеса и теорию организации. и посвящены вопросам политологии (международная дипломатия и выборы), а и — вопросам экономики (аукционы и переговоры). Для более специализированных учебных курсов можно выбрать одну из тем, обсуждаемых в главах 11−17, и подробно остановиться на концепциях, которые в них рассматриваются.
Чем бы вы ни занимались — математикой, биологией, экономикой, политикой, историей, социологией или другими науками, — теория и примеры стратегических игр будут стимулировать вас и станут вызовом вашему интеллекту. Мы желаем вам насладиться этим предметом в процессе его изучения или преподавания.
Резюме
Стратегические игры отличаются от индивидуального принятия решений наличием значимых взаимодействий между игроками. Игры можно классифицировать по нескольким категориям, таким как время игры, общие или противоречащие друг другу интересы игроков, частота взаимодействия между игроками, объем доступной игрокам информации, типы правил и целесообразность согласованных действий.
Знание терминологии имеет решающее значение для анализа структуры игры. В распоряжении игроков есть стратегии, которые обеспечивают различные исходы игры с разными выигрышами. Последние включают в себя все, что важно для игрока, и рассчитываются методом вероятностного среднего, или математического, ожидания, если исход игры носит случайный характер или связан с определенным риском. Предполагается, что рациональность (или последовательное поведение) свойственна всем игрокам, которые должны знать все соответствующие правила поведения. Равновесие в игре возникает в случае использования всеми игроками стратегий, представляющих собой наилучший ответ на стратегии других игроков. Некоторые классы игр позволяют учиться на собственном опыте и анализировать динамическое движение к равновесию. Изучение поведения в реальных игровых ситуациях предоставляет дополнительную информацию об эффективности данной теории.
Теорию игр можно использовать для объяснения, прогнозирования или рекомендаций при самых разных обстоятельствах. Хотя она пока и неидеальна в выполнении этих функций, она продолжает развиваться; кроме того, важность стратегического взаимодействия и стратегического мышления становится все более очевидной и осознаваемой.
Ключевые термины
Асимметричная информация
Внешняя неопределенность
Выигрыш
Игра
Игра с нулевой суммой
Игра с постоянной суммой
Инструменты скрининга
Кооперативная игра
Некооперативная игра
Несовершенная информация
Одновременные ходы
Ожидаемый выигрыш
Последовательные ходы
Равновесие
Рациональное поведение
Решение
Сигнал
Сигнализирование
Скрининг
Совершенная информация
Стратегическая игра
Стратегическая неопределенность
Стратегия
Эволюционная игра
Упражнения с решениями
[18]Примечание для студентов: решения этих упражнений можно найти на сайте http://books.wwnorton.com/studyspace/disciplines/economics.aspx?DiscId=6 , бесплатный доступ к которому предоставляется всем желающим.
S1. Определите, какая из следующих ситуаций представляет собой игру, а какая — решение. В каждом конкретном случае укажите, какие особенности заставили вас отнести ее к той или иной категории.
a) В молочном отделе продуктового магазина находится группа покупателей, каждый из которых решает, с каким наполнителем купить йогурт.
b) Пара девочек-подростков выбирают платья для выпускного бала.
c) Студент колледжа размышляет над тем, на какой курс записаться для получения степени магистра.
d) New York Times и Wall Street Journal определяют стоимость онлайн-подписки на текущий год.
e) Кандидат на пост президента выбирает кандидата на должность вице-президента.
S2. Проанализируйте описанные ниже стратегические игры. В каждом случае укажите, к какой категории вы бы отнесли данную игру по шести параметрам, перечисленным в тексте. (i) Ходы в игре последовательные или одновременные? (ii) Это игра с нулевой суммой или нет? (iii) Это повторяющаяся игра? (iv) Присутствует ли в игре несовершенная информация и если да, то имеет ли место неполная (асимметричная) информация? (v) Правила игры фиксированные или нет? (vi) Возможны ли соглашения о сотрудничестве или нет? Если вам не хватает информации, чтобы отнести игру к какой-то определенной категории, объясните причины.
a) «Камень, ножницы, бумага»: на счет три каждый игрок делает рукой жест, соответствующий одному из этих трех предметов. Камень побеждает ножницы, ножницы — бумагу, а бумага — камень.
b) Поименное голосование: голосующие отдают свои голоса в устной форме, когда называют их имена. Выигрывает вариант с максимальным количеством голосов.
c) Закрытый аукцион: участники аукциона подают заявку на покупку бутылки вина в конвертах. Покупатель, предложивший самую высокую цену, выигрывает и выплачивает заявленную сумму.
S3. «Участник игры никогда не предпочтет исход игры, при котором каждый игрок получает небольшую прибыль, исходу, при котором он единолично получит ее всю». Это утверждение истинно или ложно? Обоснуйте свой вывод посредством двух-трех предложений.
S4. Вы и ваш соперник ведете игру, в которой могут быть три возможных исхода: вы побеждаете, побеждает ваш соперник (вы проигрываете) или игра заканчивается вничью. В случае выигрыша вы получите 50 долларов, если будет ничья — 20 долларов, проиграете — 0 долларов. Чему равен ваш ожидаемый выигрыш в каждой из следующих ситуаций?
a) Вероятность того, что игра закончится вничью, составляет 50 процентов, а того, что вы победите, — всего 10 процентов (значит, вероятность вашего поражения 40 процентов).
b) Вы можете выиграть или проиграть с вероятностью 50 на 50.
c) Вероятность того, что вы проиграете, равна 80 процентов, победите — 10 процентов, ничья — тоже 10 процентов.
S5. Объясните разницу между использованием теории игр в качестве инструмента прогнозирования и в качестве рекомендательного инструмента. В каких типах реальных ситуаций эти две функции могут оказаться наиболее важными?
Упражнения без решений
U1. Определите, какая из следующих ситуаций представляет собой игру, а какая — решение. В каждом конкретном случае укажите, какие особенности заставили вас отнести ее к той или иной категории.
a) Кандидат от партии на пост президента США должен решить, использовать для своей кампании частное финансирование или государственное.
b) Бережливый Фред получает подарочную карту стоимостью 20 долларов на загрузку музыки, и ему предстоит решить, что покупать — отдельные композиции или альбомы.
c) Красавица Белла получила 100 ответов на свой профиль на сайте онлайн-знакомств и должна определиться, отвечать на каждое предложение или нет.
d) Канал NBC решает, как распределить свои телевизионные шоу в интернете в текущем сезоне. Руководство канала рассматривает такие варианты: Amazon.com, iTunes и/или NBC. Комиссионные, которые могут быть выплачены Amazon или iTunes, открыты для обсуждения.
e) Китай выбирает уровень тарифных ставок на импорт из США.
U2. Проанализируйте описанные ниже стратегические игры. В каждом случае укажите, к какой категории вы бы отнесли данную игру по шести параметрам, перечисленным в тексте. (i) Ходы в игре последовательные или одновременные? (ii) Это игра с нулевой суммой или нет? (iii) Это повторяющаяся игра? (iv) Присутствует ли в игре несовершенная информации и если да, то имеет ли место неполная (асимметричная) информация? (v) Правила игры фиксированные или нет? (vi) Возможны ли соглашения о сотрудничестве или нет? Если вам не хватает информации, чтобы отнести игру к какой-то определенной категории, объясните причины.
a) Гарри и Росс — торговые представители одной и той же компании. Менеджер сообщает им, что тот из них, кто обеспечит более высокий объем продаж, получит «кадиллак».
b) В игровом шоу «Правильная цена» четыре участника угадывают цену телевизора. Игра начинается с крайнего левого игрока, а сумма, которую называет каждый очередной игрок, должна отличаться от догадок предыдущих игроков. Участник шоу, который назовет максимально близкую к реальной цену, но не превысит ее, выиграет телевизор.
c) Шесть тысяч игроков выплачивают по 10 000 долларов каждый, чтобы принять участие в Мировой серии покера. Каждый игрок начинает турнир с фишек на сумму 10 000 долларов, после чего разыгрывается серия No-Limit Texas Hold ’Em (разновидность покера), которая продолжается до тех пор, пока кто-то не выиграет все фишки. Первые 600 игроков получают денежные призы согласно порядку окончания ими игры, при этом победителю достаются 8 миллионов долларов.
d) За пассажирами Desert Airlines не закрепляются места в самолетах; они выбирают их только после того, как окажутся на борту. Авиакомпания устанавливает очередность посадки пассажиров в соответствии со временем их регистрации либо на сайте не более чем за 24 часа до вылета, либо лично в аэропорту.
U3. «Любая выгода для победителя должна вредить проигравшему». Это утверждение истинно или ложно? Обоснуйте свой вывод посредством одного-двух предложений.
U4. Алисе, Бобу и Конфуцию становится скучно во время каникул, и они решают сыграть в новую игру. Каждый вносит в общий фонд 1 доллар, а затем подбрасывает монету. Алиса выиграет, если выпадут три орла или три решки. Боб выиграет, если выпадут два орла и одна решка, а Конфуций — если выпадет один орел и две решки. Все монеты правильные, и победитель получит чистый выигрыш в размере 2 доллара (3–1 = 2 доллара), а каждый проигравший потеряет 1 доллар.
a) Какова вероятность того, что Алиса победит или проиграет?
b) Чему равен ожидаемый выигрыш Алисы?
c) Какова вероятность того, что Конфуций победит или проиграет?
d) Чему равен ожидаемый выигрыш Конфуция?
e) Это игра с нулевой суммой? Обоснуйте ответ.
U5. «Когда один игрок застает другого игрока врасплох, это говорит о том, что у них нет общего понимания правил игры». Приведите пример, который иллюстрирует это утверждение, и контрпример, показывающий, что оно не всегда верно.
Часть II. Концепции и методы
Глава 3. Игры с последовательными ходами
* * *
Игры с последовательными ходами предполагают стратегические ситуации, в которых существует строгий порядок ведения игры. Игроки ходят поочередно и осведомлены о действиях соперников, сделавших свои ходы до них. Для того чтобы хорошо играть в такую игру, ее участникам необходимо использовать определенный тип интерактивного мышления. Каждый игрок должен просчитать возможную реакцию противника на тот или иной ход. Всякий раз при выполнении действий игрокам следует думать о том, как их текущие действия повлияют на будущие действия как самого игрока, так и его соперников. Следовательно, игроки выбирают ходы на основании расчета вероятных последствий.
Большинство реальных игр сочетают в себе аспекты игр как с последовательными, так и с одновременными ходами. Но концепции и методы анализа легче понять, если вводить их сначала отдельно для двух чистых типов игр. Исходя из этого, в данной главе рассматриваются только игры с последовательными ходами. и целиком и полностью посвящены играм с одновременными ходами, а в и нескольких разделах показано, как объединить оба типа анализа в более реалистичных смешанных ситуациях. Представленный здесь анализ можно использовать всякий раз, когда игра включает в себя последовательное принятие решений. Кроме того, изучение игр с последовательными ходами позволяет определить, когда игроку выгоднее ходить первым, а когда вторым. Затем игроки могут разработать способы, так называемые стратегические ходы, манипулирования порядком игры в свою пользу. Подробно они рассматриваются в .
1. Дерево игры
Начнем с описания графического метода отображения и анализа игр с последовательными ходами, именуемого дерево игры. На таком дереве, также называемом экстенсивной формой игры, представлены все ее элементы, о которых шла речь в : игроки, действия и выигрыши.
Скорее всего, вы уже сталкивались с деревьями решений в других контекстах. Такие деревья демонстрируют всю последовательность точек принятия решений (или узлов) одним игроком в нейтральной среде. Дерево решений также включает в себя ветви, которые соответствуют имеющимся вариантам выбора и исходят из каждого узла. Дерево игры — это просто совокупность деревьев решений всех ее участников. Такое дерево отображает все возможные действия, которые могут предпринять все игроки, а также все возможные исходы игры.
А. Узлы, ветви и пути игры
На рис. 3.1 изображено дерево конкретной игры с последовательными ходами. Мы не будем здесь описывать ее историю, поскольку хотим опустить многочисленные детали, чтобы вы могли сфокусироваться на общих концепциях. В игре участвуют четыре человека: Энн, Боб, Крис и Деб. Согласно правилам игры, первый ход делает Энн; это показано в крайней левой точке дерева, или узле под названием начальный узел или корень дерева игры. В этом узле, который еще можно называть узлом действия или узлом принятия решений, у Энн есть два доступных варианта выбора. Они обозначены как «стоп» и «вперед» (не забывайте, что это абстрактные обозначения и они не обязательно должны иметь какой-то смысл) и показаны на рисунке в виде ветвей, исходящих из начального узла.
Рис. 3.1. Иллюстративное дерево игры
Если Энн выберет «стоп», наступит очередь Боба делать ход. У него в узле действия есть три варианта выбора, обозначенные как 1, 2 и 3. Если Энн выбирает «вперед», то следующий ход делает Крис с вариантами выбора «рискованно» и «безопасно». Другие узлы и ветви следуют друг за другом, но вместо того чтобы их перечислять, мы просто обратим ваше внимание на некоторые характерные особенности данного дерева.
Если Энн выберет «стоп», после чего Боб выберет 1, Энн получит право на следующий ход с новыми вариантами выбора — «вверх» и «вниз». В реальных играх с последовательными ходами достаточно типична ситуация, когда игрок делает несколько ходов, причем они могут быть разными в разных узлах. В шахматах, например, два игрока ходят по очереди; каждый такой ход меняет ситуацию на доске, а значит, меняются и ходы, доступные для игрока, который будет ходить следующим.
Б. Неопределенность и «ходы природы»
Если Энн выберет ход «вперед», а Крис — «рискованно», произойдет случайное событие, например подбрасывание монеты, и исход игры будет зависеть от того, выпадет орел или решка. Этот аспект игры представляет собой пример внешней неопределенности и отображается на дереве игры посредством введения внешнего игрока под названием «природа». Ему передается контроль над случайным событием, и он как будто выбирает одну из ветвей, каждую с вероятностью 50 %. Вероятность здесь определяется посредством случайного события одного типа, а именно подбрасывания монеты, но в других обстоятельствах могут использоваться и события иных типов. Например, в случае бросания игральных костей «природа» могла бы указать шесть возможных вариантов, каждый с вероятностью 162/3 процента. Использование игрока под названием «природа» позволяет ввести в игру фактор внешней неопределенности и предоставляет в наше распоряжение механизм, который делает возможным наступление событий, находящихся вне контроля реальных участников игры.
Вы можете определить количество различных путей, существующих на дереве игры, передвигаясь по следующим друг за другом ветвям. На каждый путь приводит к конечной точке игры за конечное число ходов. Конечная точка не является обязательным элементом всех игр, некоторые из них теоретически могут вестись до бесконечности. Но в большинстве наших примеров представлены конечные игры.
В. Исходы и выигрыши
В последнем узле каждого пути, так называемом концевом узле, ни один игрок не может сделать очередной ход. (Обратите внимание, что именно этим концевые узлы отличаются от узлов действия.) Вместо этого мы показываем в этом узле исход определенной последовательности действий, выраженный в выигрышах игроков. Выигрыши наших четырех героев перечислены в таком порядке: Энн, Боб, Крис, Деб. Важно указать, какой выигрыш соответствует каждому игроку. Обычно выигрыши принято указывать в том порядке, в каком игроки делают ходы. Однако иногда этот метод бывает неоднозначным; в нашем примере непонятно, кто должен делать следующий ход, Боб или Крис. Поэтому мы перечислили их в алфавитном порядке (англ. Ann, Bob, Chris, Deb), а кроме того, использовали цветную маркировку информации об игроках. Так, имя Энн, ее варианты выбора и выигрыши выделены черным цветом, Боба — темно-серым, Криса — светло-серым, а Деб — серым. При построении деревьев для игр, которые вы будете анализировать, можно выбрать любую понравившуюся вам систему обозначений, но вы должны четко сформулировать и объяснить ее тому, кто будет читать дерево игры.
Выигрыш — это числовая величина, и, как правило, для каждого игрока чем она больше, тем лучше исход игры. Таким образом, для Энн самый нижний путь (выигрыш 3) лучше самого верхнего (выигрыш 2). Однако выигрыши разных игроков не обязательно должны быть сопоставимы. В данном примере неочевидно, что в конце самого верхнего пути Боб (выигрыш 7) добивается большего, чем Энн (выигрыш 2). Иногда, например если выигрыш исчисляется в денежных единицах, сравнение выигрышей может иметь смысл.
Игроки используют информацию о выигрышах при выборе доступных действий. Включение случайного события (выбор, сделанный «природой») означает, что игрокам необходимо определить, что они получат в среднем, когда «природа» сделает свой ход. Например, если Энн выберет «вперед» в качестве первого хода в игре, Крис может выбрать «рискованно», что приведет к подбрасыванию монеты и выбору «природой» варианта «хорошо» или «плохо». В такой ситуации Энн в половине случаев может рассчитывать на выигрыш 6 и в половине случаев — на выигрыш 2; иными словами, статистическое среднее, или ожидаемый выигрыш, составит 4 = (0,5 × 6) + (0,5 × 2).
Г. Стратегии
И наконец, мы используем дерево игры, представленное на , чтобы объяснить концепцию стратегии. Единичное действие, предпринятое игроком в узле, называется ходом. Но игроки могут и должны составлять планы последовательности выполнения ходов, которые они намерены сделать во всех возможных случаях в ходе игры. Такой план действий и называется стратегией.
На данном дереве игры Боб, Крис и Деб получают возможность сделать ход максимум один раз; например, Крис будет ходить только в случае, если Энн в качестве первого хода выберет «вперед». Для этих игроков между ходом и стратегией нет разницы. Мы можем определить ход, указав условие, при котором он будет сделан; так, в случае Боба может быть следующая стратегия: «Выбрать 1, если Энн выберет “стоп”». Однако у Энн есть две возможности сделать ход, поэтому ее стратегия требует более полного описания. Одна из стратегий Энн: «Выбрать “стоп”, а если Боб выберет 1, выбрать “вниз”».
В более сложных играх, таких как шахматы, где есть длинные последовательности ходов с большим количеством вариантов выбора в каждой, описание стратегий усложняется; мы обсудим данный аспект более подробно далее в этой главе. Однако общий принцип построения стратегий достаточно прост, за исключением одной особенности. Если Энн выберет «вперед» на первом ходе, она так и не получит шанса сделать второй ход. Следует ли в стратегии, согласно которой она выбирает «вперед», указывать то, что Энн сделала бы в гипотетическом случае, если бы каким-то образом оказалась в узле своего второго действия? Возможно, ваша интуиция скажет «нет», но формальная теория игр говорит «да» по двум причинам.
Во-первых, выбор Энн варианта «вперед» в качестве первого хода может зависеть от ее рассуждений о том, что ей пришлось бы сделать на втором ходе, если бы она изначально предпочла вариант «стоп». Например, тогда Боб мог бы выбрать 1, и Энн получила бы второй ход, а ее лучшим выбором стал бы вариант «вверх», обеспечивающий ей выигрыш 2. Если Энн для первого хода выберет «вперед», Крис выберет вариант «безопасно» (поскольку его выигрыш 3 в случае варианта «безопасно» больше, чем ожидаемый выигрыш от варианта «рискованно»), и такой исход игры обеспечит Энн выигрыш 3. Для того чтобы процесс размышлений был понятнее, можно сформулировать стратегию Энн так: «Выбрать “вперед” на первом ходе и выбрать “вверх”, если появится возможность походить еще раз».
Вторая причина для такого, казалось бы, педантичного описания стратегий имеет отношение к устойчивости равновесия. При анализе устойчивости мы спрашиваем, что бы произошло, если бы выбор игроков был подвержен влиянию небольших помех, среди которых и мелкие ошибки самих игроков. Скажем, если бы выбор нужно было делать посредством нажатия клавиши, не исключено, что у Энн дрогнула бы рука и она случайно вместо клавиши «вперед» нажала бы клавишу «стоп». Исходя из этого, важно определить, как Энн будет действовать, обнаружив ошибку, поскольку Боб выберет 1 и наступит очередь Энн делать следующий ход. На более продвинутых уровнях теории игр анализ устойчивости обязателен, поэтому мы хотим подготовить вас заранее, настаивая на том, чтобы вы изначально формулировали свои стратегии в виде исчерпывающих планов действий.
Д. Построение дерева
Теперь подытожим общие концепции, проиллюстрированные деревом, представленным на . Дерево игры состоит из узлов и ветвей. Узлы соединены между собой ветвями и бывают двух типов. Узел первого типа обозначается термином «узел принятия решений». Каждый такой узел соответствует игроку, который выбирает в нем действие. Каждое дерево имеет один узел принятия решений — это начальный узел дерева, отправная точка игры. Узел второго типа называется «концевой узел». Каждому концевому узлу соответствует совокупность исходов игры для ее участников; эти исходы представляют собой выигрыши, полученные каждым игроком, если игра проходила по ветвям, приведшим к данному концевому узлу.
Ветви дерева игры представляют действия, которые можно предпринять из любого узла принятия решений. Каждая ветвь на дереве ведет от узла принятия решений либо к другому узлу принятия решений (как правило, другого игрока), либо к концевому узлу. В дереве должны учитываться все допустимые варианты действий, которые игрок может выбрать в каждом узле, поэтому некоторые деревья включают также ветви, соответствующие варианту «ничего не делать». Из каждого узла принятия решений должна исходить как минимум одна ветвь, но ограничений на количество ветвей нет. При этом к каждому узлу принятия решений может вести только одна ветвь.
Деревья игры часто рисуют на странице слева направо, однако их можно рисовать в любом наиболее подходящем для рассматриваемой игры направлении: снизу вверх, в сторону, сверху вниз или даже радиально, от центра. Дерево — это метафора, в основе которой лежит идея о последовательном ветвлении, поскольку решения принимаются в узлах деревьев.
2. Решение игр с помощью деревьев
Мы проиллюстрируем использование деревьев на примере поиска равновесных исходов игр с последовательными ходами в очень простой ситуации, с которой, по всей вероятности, сталкивались многие из вас, — курить или не курить. Эту и многие другие аналогичные стратегические ситуации с участием одного игрока можно рассматривать как игры, если мы признаем, что впоследствии выбор предстоит делать будущему «я» игрока, которое подвержено влиянию различных факторов и иначе оценивает идеальный исход игры.
Возьмем, к примеру, подростка по имени Кармен, которая решает, следует ли ей курить. Во-первых, она должна определиться, стоит ли ей вообще пробовать курить. Если она все же попробует, в будущем ей предстоит принять еще одно решение: продолжать ли курить. Мы проиллюстрируем этот пример с помощью дерева, представленного на рис. 3.2.
Рис. 3.2. Принятие решения о курении
Узлы и ветви обозначены доступными Кармен вариантами выбора, но мы должны объяснить выигрыши. Примем исход игры «никогда не курить» за эталон для сравнения и присвоим ему выигрыш 0. Число 0 в этом контексте ничего особо не значит; все, что имеет значение для сравнения исходов, а следовательно, и решения Кармен, — соответствующий выигрыш больше или меньше остальных. Предположим, что для Кармен наиболее предпочтителен исход игры, при котором она попробует какое-то время курить, а потом бросит. Возможно, причина в том, что Кармен не привыкла верить на слово и желает обо всем составить собственное представление, или в том, что это позволит ей со знанием дела заявить: «Я это пробовала и уверяю, что ничего хорошего в этом нет», когда в будущем ей придется наставлять своих детей на путь истинный. Присвоим этому исходу выигрыш +1. Худший исход игры — когда Кармен попробует курить и не сможет остановиться. Даже если не брать во внимание вред, наносимый курением здоровью в долгосрочной перспективе, в краткосрочном периоде появятся не менее насущные проблемы: волосы и одежда Кармен будут неприятно пахнуть, а друзья станут ее избегать. Присвоим этому исходу выигрыш −1. В итоге выбор Кармен кажется очевидным: попробовать курить, но не продолжать это делать.
Однако в этом анализе не учтена проблема зависимости. Как только Кармен попробует какое-то время курить, у нее сформируются другие вкусы и изменятся выигрыши. Решение о том, продолжать ли курить, будет принимать уже не нынешняя Кармен с ее теперешней оценкой исходов игры в том виде, как показано на , а будущая Кармен, которая иначе оценит дальнейшие альтернативы. Делая выбор сегодня, Кармен нужно проанализировать его последствия и учесть это в своем решении, которое она должна принять исходя из текущих предпочтений. Другими словами, проблема выбора, касающаяся курения, — на самом деле не решение в том смысле, о котором шла речь в (выбор, сделанный в нейтральной среде), а игра в формальном смысле, также представленная в , в которой другой игрок — это будущее «я» Кармен со своими особыми приоритетами. И нынешней Кармен при принятии решения предстоит вести игру с будущей Кармен.
Мы превратим дерево решений, представленное на , в дерево игры на рис. 3.3 посредством введения двух игроков, делающих выбор в двух узлах. В начальном узле нынешняя Кармен решает, стоит ли ей пробовать курить. В случае положительного ответа появляется будущая Кармен, попавшая в зависимость от курения, и уже она решает, продолжать ей курить или нет. Давайте изобразим здоровую, не загрязняющую окружающую среду нынешнюю Кармен, ее действия и выигрыши серым цветом, а пристрастившуюся к курению будущую Кармен, ее действия и выигрыши — черным (такими стали ее легкие). Выигрыши нынешней Кармен остались прежними. А вот будущая Кармен продолжит наслаждаться курением, а при попытке бросить у нее наступит ужасный абстинентный синдром. Пусть выигрыш будущей Кармен при выборе варианта «курить» составляет +1, а при выборе «не курить» — −1.
Рис. 3.3. Игра «курение»
Учитывая предпочтения будущей курильщицы Кармен, в узле принятия решений она выберет вариант «продолжать». Нынешняя Кармен должна проанализировать эту перспективу и учесть ее при принятии текущего решения, признав, что если перевесит желание покурить, то это неизбежно приведет к тому, что она будет курить и впоследствии. Несмотря на то что нынешняя Кармен этого не хочет, она не сможет в дальнейшем реализовать свой текущий выбор, поскольку будущая Кармен, у которой совсем иные наклонности, сделает именно такой выбор. Следовательно, нынешняя Кармен должна предвидеть, что выбор варианта «попробовать» приведет к выбору «продолжать» и обеспечит ей выигрыш −1 по ее текущим оценкам, тогда как выбор варианта «нет» даст выигрыш 0. Таким образом, ей следует предпочесть второе.
Подобная аргументация более наглядно представлена на рис. 3.4. На рис. 3.4а мы обрезаем, или отсекаем, ветвь «нет», исходящую из второго узла. Такое отсекание говорит о том, что будущая Кармен, которая делает выбор в этом узле, не выберет действие, соответствующее этой ветви, учитывая ее предпочтения, выделенные черным цветом.
Рис. 3.4. Отсечение ветвей дерева игры «курение»
На дереве остались две ветви, исходящие из первого узла, в котором делает выбор нынешняя Кармен; каждая из ветвей ведет непосредственно к концевому узлу. Такое отсечение позволяет нынешней Кармен просчитать все возможные последствия любого своего решения. Выбор варианта «попробовать» приведет к варианту «продолжать» и обеспечит выигрыш −1 с точки зрения предпочтений нынешней Кармен, тогда как выбор варианта «нет» даст выигрыш 0. Таким образом, на данный момент Кармен должна выбрать вариант «нет», а не «попробовать». Следовательно, мы можем отсечь ветвь «попробовать», исходящую из первого узла (вместе с ее предполагаемым продолжением), как показано на рис. 3.4б. На нем изображено «полностью усеченное» дерево всего с одной ветвью, исходящей из начального узла и ведущей к концевому. Единственный оставшийся путь, пролегающий по дереву игры, демонстрирует, что произойдет в игре, если все ее участники сделают лучший выбор на основании правильного прогнозирования всех вероятных исходов.
При обрезке ветвей дерева игры на мы вычеркнули ветви, которые не выбрали. Еще один эквивалентный, но альтернативный способ показать выбор игрока — как-то выделить выбираемые им ветви. Для этого можно отметить их галочками или стрелками или выделить более жирными линиями. Подойдет любой способ (на рис. 3.5 показаны все перечисленные варианты), вам виднее, но все же второй вариант, особенно выделение стрелками, имеет свои преимущества. Во-первых, он обеспечивает формирование более четкой картины происходящего. Во-вторых, в случае вычеркивания ветвей не всегда понятен порядок их отсечения. Например, на читатель может подумать, что ветвь «продолжать», исходящая из второго узла, была отсечена первой, а уже после этого была отсечена ветвь «попробовать» в первом узле и следующая за ней ветвь «нет» во втором узле. Последний и самый важный аргумент в пользу этого способа состоит в том, что стрелки более наглядно показывают результат последовательности оптимальных вариантов выбора в виде непрерывной цепочки стрелок от начального до концевого узла. Вот почему в других диаграммах такого типа, представленных далее в книге, мы используем стрелки вместо вычеркивания ветвей. В процессе построения деревьев игр вам следует попрактиковаться в применении обоих способов, а когда научитесь строить такие деревья, можете выбрать тот способ, который вам больше нравится.
Рис. 3.5. Выбор ветвей на дереве игры «курение»
Независимо от того, как вы отобразите свои размышления на дереве игры, логика анализа во всех случаях будет одинаковой и важной. Вы должны начать с рассмотрения узлов действий, ведущих непосредственно к концевым узлам. Оптимальный выбор для игрока, делающего ход в таком узле, можно определить путем сравнения его выигрышей в соответствующих концевых узлах. Использование вариантов выбора в конце игры для прогнозирования последствий более ранних действий позволяет рассчитать выбор в узлах, предшествующих узлам окончательного принятия решений. Затем то же самое можно сделать с предыдущими узлами и т. д. Передвигаясь таким образом по дереву игры в обратном направлении, вы можете решить всю игру.
Данный метод определения поведения в игре с последовательными ходами (смотреть вперед и рассуждать в обратном порядке) известен как метод обратных рассуждений. Как подразумевает само его название, сперва следует подумать, что произойдет во всех концевых узлах, а затем передвигаться по дереву в обратном направлении вплоть до начального узла, анализируя соответствующие действия. Поскольку такие рассуждения требуют передвижения в обратном направлении по одному шагу за один раз, этот метод обозначают также термином «обратная индукция». Мы предпочитаем термин «обратные рассуждения», ввиду того что он проще и получает все более широкое распространение, однако в других книгах по теории игр используется старый термин «обратная индукция». Вам следует просто запомнить, что они эквивалентны.
Когда все участники игры для выбора оптимальных стратегий применяют метод обратных рассуждений, такая совокупность стратегий в данной игре называется равновесием обратных рассуждений, а исход игры, обусловленный использованием этих стратегий, — исходом равновесия обратных рассуждений. В более сложных учебниках по теории игр эта концепция обозначается как совершенное равновесие подыгры; возможно, ваш преподаватель предпочитает именно этот термин. Мы приводим формальное объяснение и анализ совершенного равновесия подыгры в , но склоняемся к употреблению более простого и интуитивно понятного термина «равновесие обратных рассуждений». Теория игр предсказывает такой исход в качестве равновесия в игре с последовательными ходами, в которой все игроки становятся рациональными вычислителями в погоне за максимальным выигрышем. Далее в данной главе мы проанализируем, как этот прогноз подтверждается на практике. А пока вам следует знать, что во всех конечных играх с последовательными ходами, представленных в этой книге, есть по крайней мере одно равновесие обратных рассуждений. В действительности в большинстве игр присутствует в точности одно такое равновесие. И только в исключительных случаях, когда игрок получает одинаковые выигрыши в результате двух или более наборов ходов, а значит, не может отдать явное предпочтение ни одному из них, их может быть больше.
В игре «курение» равновесие обратных рассуждений наблюдается в случае, когда нынешняя Кармен выбирает стратегию «нет», а будущая Кармен — стратегию «продолжить». Когда нынешняя Кармен совершает оптимальное действие, пристрастившаяся к курению будущая Кармен вообще не появляется на свет, а значит, и не получает реальной возможности сделать ход. Однако призрачное присутствие будущей Кармен и стратегия, которую бы она предпочла, если бы нынешняя Кармен выбрала вариант «попробовать» и предоставила бы ей шанс сделать ход, — важный элемент игры, на самом деле являющийся ключевым в определении оптимального хода нынешней Кармен.
Итак, мы описали концепции дерева игры и анализа методом обратных рассуждений с помощью очень простых примеров, в которых решение было очевидным на основании словесных аргументов. А теперь перейдем к использованию этих концепций в более сложных ситуациях, когда выполнение вербального анализа усложняется, в связи с чем роль визуального анализа с помощью дерева игры возрастает.
3. Увеличение количества игроков
Действие методов, представленных в в самой простой ситуации с двумя игроками и двумя ходами, можно легко расширить, при этом деревья становятся более сложными, в них увеличивается количество ветвей, узлов и уровней, но основные концепции и метод обратных рассуждений не меняются. В данном разделе мы рассмотрим игру с тремя участниками, у каждого из которых есть два варианта выбора. С небольшими вариациями эта игра будет появляться во многих следующих главах.
Три игрока, Эмили, Нина и Талия, живут на одной маленькой улице. Каждую девушку попросили внести свой вклад в создание декоративного сада на месте пересечения улицы с автомагистралью. Окончательная площадь и пышность сада зависят от того, сколько участницы игры готовы в него вложить. Кроме того, хотя все три участницы были бы счастливы иметь такой сад (а его размер еще больше усилил бы это ощущение), ни одна из них не спешит с инвестициями из-за их размера.
Предположим, что если две или три участницы игры внесут свой вклад в создание сада, то этих ресурсов хватит для его закладки и последующего ухода за растениями, а сам сад будет весьма привлекательным и милым. Тем не менее, если всего одна из девушек или никто из них этого не сделают, сад будет скудным и неухоженным и не принесет радости людям. Таким образом, с точки зрения каждой участницы, существуют четыре разных исхода.
• Одна участница игры не инвестирует в сад, в отличие от двух остальных (что приводит к созданию привлекательного сада и позволяет ей сэкономить на вкладе).
• Одна участница игры инвестирует в сад, и остальные, одна или обе, — тоже (что приводит к созданию привлекательного сада, но не позволяет ей сэкономить на вкладе).
• Одна участница игры не инвестирует в сад, и только одна из двух оставшихся участниц вносит свой вклад (что приводит к созданию скудного сада, но позволяет ей сэкономить на вкладе).
• Одна участница игры инвестирует в сад, в отличие от двух остальных (что приводит к созданию скудного сада и не позволяет ей сэкономить на вкладе).
Очевидно, что первый из исходов — лучший, тогда как последний — худший. Мы хотим, чтобы более высокие показатели выигрышей соответствовали более благоприятным исходам, поэтому присваиваем первому исходу в списке выигрыш 4, а последнему — выигрыш 1. (Иногда выигрыши соответствуют порядковому номеру исхода в списке исходов. Следовательно, при наличии четырех исходов первый был бы лучшим, а четвертый — худшим, а меньшие числа обозначали бы более предпочтительные исходы. Читая книгу по теории игр, обратите особое внимание на то, какую систему обозначений выбрал автор; если вы пишете о теории игр, вам следует точно указать используемую систему обозначений.)
В двух средних исходах присутствует некоторая неоднозначность. Предположим, каждый игрок ценит привлекательный сад более высоко, чем собственный вклад в его создание. В таком случае исход, указанный в списке вторым, обеспечит выигрыш 3, а исход под номером три — выигрыш 2.
Допустим, участницы игры ходят поочередно. Эмили получает право первого хода и решает, инвестировать ли ей в сад. В свою очередь Нина, глядя на выбор Эмили, решает, стоит ли и ей так поступить. И наконец, Талия, оценив выбор Эмили и Нины, делает аналогичный выбор.
На рис. 3.6 изображено дерево этой игры. Чтобы облегчить ее описание, мы обозначили узлы действия специальными символами. Эмили делает ход в начальном узле a, а ветви, соответствующие двум имеющимся у нее вариантам выбора («внести вклад» и «не вносить вклад»), ведут к узлам b и c. В каждом из них должна сделать ход Нина и выбрать один из представленных вариантов. Ее выбор приводит к узлам d, e, f и g, в каждом из которых наступает очередь Талии ходить. Имеющиеся у Талии варианты выбора приводят к восьми концевым узлам, где мы показываем выигрыш в таком порядке: (Эмили, Нина, Талия). Например, если Эмили решает инвестировать в создание сада, Нина нет, а Талия да, то красивый декоративный сад будет разбит и две участницы, внесшие вклад в его создание, получат выигрыш 3 каждая, а участница, которая решила сэкономить, — свой максимальный выигрыш 4. В данном случае список выигрышей выглядит так: (3, 4, 3).
Рис. 3.6. Игра «уличный сад»
Для того чтобы применить к этой игре метод обратных рассуждений, начнем с узлов действия, расположенных непосредственно перед концевыми узлами, а именно с узлов d, e, f и g. Талия делает ход в каждом из этих узлов. В узле d она сталкивается с ситуацией, когда и Эмили, и Нина вносят вклад в создание сада, то есть сад уже наверняка будет красивым, поэтому, выбрав вариант «не вносить вклад», Талия получает свой максимальный выигрыш 4, тогда как в противном случае — следующий по размеру выигрыш 3. Стало быть, предпочтительный для Талии вариант выбора в данном узле — «не вносить вклад». Мы отображаем это путем выделения соответствующей ветви жирной линией и добавления к ней стрелки; любого из этих способов было бы достаточно для иллюстрации выбора Талии. В узле e Эмили выбрала вариант «внести вклад», а Нина — «не вносить», поэтому вклад Талии крайне важен для создания красивого сада. Талия получит выигрыш 3, если выберет «внести вклад», и 2 в результате отказа. Ее предпочтительный вариант выбора в узле e — «внести вклад». Аналогичным образом можно проверить выбор Талии в двух оставшихся узлах.
Теперь давайте вернемся немного назад и проанализируем предыдущий этап — а именно узлы b и c, в которых наступает очередь Нины выбирать. В узле b Эмили решила инвестировать в создание сада, поэтому Нина рассуждает так: «Если я выберу вариант “внести вклад”, это приведет игру в узел d, а там, насколько мне известно, Талия выберет “не вносить вклад”, и мой выигрыш составит 3. (Сад будет красивым, но я понесу убытки.) Если я выберу “не вносить вклад”, игра переместится в узел e, где, как мне известно, Талия выберет “внести вклад”, а мой выигрыш будет 4. (Сад будет красивым, а я сэкономлю на расходах.) Следовательно, я выбираю “не вносить вклад”». Аналогичные рассуждения показывают, что в узле c Нина предпочтет вариант «внести вклад».
И наконец, рассмотрим выбор Эмили в начальном узле a. Она может предвидеть последующий выбор как Нины, так и Талии и знает, что если выберет вариант «внести вклад», то Нина выберет «не вносить вклад», а Талия — «внести вклад». Если две участницы игры инвестируют в создание сада, он будет красивым, но Эмили понесет издержки, а значит, ее выигрыш составит 3. Если Эмили предпочтет «не вносить вклад», то в двух следующих друг за другом узлах будет выбран вариант «внести вклад», и при наличии красивого сада и отсутствии издержек ее выигрыш составит 4. Таким образом, оптимальный выбор Эмили в узле a — «не вносить вклад».
Теперь подвести итоги анализа игры «уличный сад» методом обратных рассуждений не составит труда. Эмили выберет вариант «не вносить вклад», затем Нина — «внести вклад» и наконец Талия — тоже «внести вклад». Такая последовательность выбора образует конкретный путь игры на данном дереве, который проходит по нижней ветви, исходящей из начального узла, а затем по верхним ветвям в каждом из двух идущих друг за другом следующих узлов, с и f. На этот путь игры легко отследить как непрерывную последовательность стрелок, пролегающую от начального до пятого концевого узла, если вести отсчет от верхней части дерева. Выигрыши, которые получат участницы игры, показаны в концевом узле.
Анализ методом обратных рассуждений прост и привлекателен. Мы бы хотели подчеркнуть его некоторые особенности. Во-первых, обратите внимание, что на равновесном пути игры с последовательными ходами отсутствует большинство ветвей и узлов. Однако вычисление лучших действий, которые следовало бы предпринять, если бы игра все же их достигла, — важная часть процесса поиска окончательного равновесия. Выбор на ранних этапах игры ее участницы делают под влиянием своих ожиданий в отношении того, что произойдет, если они выберут действие, отличающееся от оптимального, а также что бы произошло, если бы любая из оставшихся участниц игры предпочла нечто иное, чем то, что является для нее лучшим. Эти ожидания, основанные на прогнозируемых вариантах выбора в узлах, расположенных вне равновесного пути игры (то есть в узлах, которые соответствуют ветвям, отсеченным в процессе анализа методом обратных рассуждений), позволяют участницам игры совершать оптимальные действия в каждом узле. Например, предпочтительный выбор Эмили «не вносить вклад», сделанный в первом узле, обусловлен пониманием того, что если она выберет вариант «внести вклад», то Нина выберет «не вносить вклад», после чего Талия решит «внести вклад»; эта последовательность обеспечит Эмили выигрыш 3 вместо выигрыша 4, который она могла бы получить, указав вариант «не вносить вклад» на первом ходе.
Равновесие обратных рассуждений обеспечивает полное описание всего процесса анализа посредством формулировки оптимальной стратегии для каждого игрока. Мы уже отмечали, что стратегия — это исчерпывающий план действий. Эмили делает первый ход, имея два варианта выбора, а значит, ее стратегия достаточно проста и фактически сводится к одному ходу. Но Нина, которая ходит второй, действует уже в каком-то из двух узлов: в одном — если Эмили выбрала вариант «внести вклад», и в другом — если Эмили предпочла «не вносить вклад». В исчерпывающем плане Нины должны быть указаны действия в каждом из этих случаев. Один такой план, или стратегия, может быть следующим: «Выбрать “внести вклад”, если Эмили выбрала “внести вклад”, и “не вносить вклад”, если Эмили его не вносит». Благодаря анализу методом обратных рассуждений мы знаем, что Нина не выберет эту стратегию, но на данном этапе нам необходимо описать все доступные стратегии, из которых Нина сможет выбирать согласно правилам игры. Мы можем сократить их описание, используя обозначение «В» вместо «внести вклад» и «Н» вместо «не вносить вклад». В результате вышеупомянутую стратегию можно представить так: «В, если Эмили выберет В, а значит, игра перейдет в узел b; Н, если Эмили выберет Н и игра перейдет в узел с», или еще проще: «В в b, Н в c», или даже «ВН», если обстоятельства, при которых выбирается каждое из указанных действий, очевидны или разъяснены ранее. Теперь легко увидеть, что поскольку у Нины по два варианта выбора в каждом из двух узлов, в которых она может действовать, в ее распоряжении находятся четыре плана действий, или стратегии: «В в b, В в c»; «В в b, Н в c»; «Н в b, В в c» и «Н в b, Н в c», или «ВВ», «ВН», «НВ» и «НН». Анализ методом обратных рассуждений, а также стрелки в узлах b и c на показывают, что оптимальная стратегия Нины — «НВ».
В случае Талии ситуация усложняется. Когда наступит ее черед, история игры может представлять собой любой из четырех возможных вариантов. Очередь действовать переходит к Талии в одном из четырех узлов дерева: один после выбора Эмили В и Нины В (узел d); второй после В Эмили и Н Нины (узел e); третий после Н Эмили и В Нины (узел f) и четвертый после Н и Эмили, и Нины (узел g). Каждая из стратегий (или исчерпывающих планов действий) Талии должна определять одно из двух действий по каждому из этих четырех сценариев или одно из двух действий в каждом из возможных узлов действия. При наличии четырех узлов, в которых необходимо указать действие, и двух действий, из которых следует выбрать одно в каждом узле, существует 2 × 2 × 2 × 2, или 16, вероятных комбинаций действий. Следовательно, в распоряжении Талии 16 доступных стратегий. Одну из них можно было бы записать так:
«В в d , Н в e , Н в f , В в g », или для краткости «ВННВ»
Здесь мы зафиксировали последовательность четырех сценариев (историй ходов Эмили и Нины) в порядке расположения узлов d, e, f и g. Далее с помощью такой же сокращенной формы записи можно составить полный список всех 16 находящихся в распоряжении Талии стратегий:
ВВВВ, ВВВН, ВВНВ, ВВНН, ВНВВ, ВНВН, ВННВ, ВННН, НВВВ, НВВН, НВНВ, НВНН, ННВВ, ННВН, НННВ, НННН.
Анализ методом обратных рассуждений дерева игры на , а также стрелки в узлах d, e, f и g показывают, что оптимальная стратегия Талии — НВВН.
Теперь выводы нашего анализа методом обратных рассуждений можно представить в виде описания стратегического выбора, сделанного каждой участницей игры: Эмили выберет Н из двух имеющихся у нее стратегий, Нина — НВ из четырех доступных стратегий, а Талия — НВВН из шестнадцати стратегий. Когда каждая из участниц анализирует следующие ветви и узлы дерева игры, чтобы составить прогноз конечных результатов текущих действий, она вычисляет оптимальные стратегии других участниц игры. Эта конфигурация стратегий (Н в случае Эмили, НВ — Нины и НВВН — Талии) представляет собой равновесие в данной игре, полученное методом обратных рассуждений.
Мы можем объединить оптимальные стратегии участниц игры, чтобы найти фактический путь игры, который приведет к равновесию обратных рассуждений. Эмили начнет с выбора Н. Нина, придерживаясь своей стратегии НВ, выберет в ответ на действие Эмили Н действие В. (Помните: стратегия НВ Нины означает «выбрать Н, если Эмили выбрала В, и В, если Эмили предпочла Н».) Согласно принятой нами договоренности, фактическое действие Талии после Н Эмили и В Нины (из узла f) обозначается третьей буквой в нашем четырехбуквенном описании ее стратегий. Поскольку оптимальная стратегия Талии — НВВН, ее действие по пути игры — В. Таким образом, фактический путь игры состоит из действия Н, выбранного Эмили, и действия В, сделанного Ниной и Талией.
В итоге мы имеем три разные концепции:
1. Список доступных стратегий для каждого игрока, который, особенно для игроков, вступающих в игру на более поздних этапах, может быть очень длинным, поскольку необходимо перечислить их действия в ситуациях, соответствующих всем возможным предыдущим ходам других игроков.
2. Оптимальная стратегия, или исчерпывающий план действий, для каждого игрока. Эта стратегия должна описывать лучший выбор игрока в каждом узле, в котором, согласно правилам игры, игрок делает ход, даже если многие из этих узлов так и не будут достигнуты на фактическом пути игры. По сути, такое описание — это прогноз игроков, сделавших предыдущие ходы, относительно того, что бы произошло, если бы они предприняли другие действия, а значит, оно представляет собой важную часть определения их наилучших действий в предыдущих узлах. Совокупность оптимальных стратегий всех игроков образует равновесие обратных рассуждений.
3. Фактический путь игры в равновесии обратных рассуждений, найденный посредством объединения оптимальных стратегий всех игроков.
4. Преимущества порядка
В равновесии обратных рассуждений в игре «уличный сад» Эмили получает наилучший исход (выигрыш 4) благодаря возможности сделать первый ход. Решив не вносить вклад в создание сада, Эмили перекладывает бремя ответственности на двух других участниц игры, каждая из которых может получить следующий лучший исход только при условии, что обе выберут вариант «внести вклад». Большинство людей, не имеющих опыта ведения стратегических игр, придерживаются мнения, будто преимущество первого хода должно присутствовать во всех играх. Однако это не так. Во многих играх второй ход более выигрышный. Представьте себе стратегическое взаимодействие между двумя компаниями, продающими аналогичные товары по каталогам, скажем, Land’s End и L.L. Bean. Если бы одна из них выпустила каталог первой, вторая еще до выпуска своего каталога обрела бы шанс узнать, какие цены установила первая компания, и смогла бы предложить на свои товары более низкие цены, получив в результате огромное конкурентное преимущество.
Преимущество первого хода зависит от способности игрока взять на себя обязательство в связи с выгодной позицией и вынудить других игроков приспосабливаться к нему; преимущество второго хода обусловлено гибкостью адаптации игрока, делающего ход вторым, к выбору других игроков. Что важнее в той или иной игре, обязательство или гибкость, определяется ее конкретной конфигурацией стратегий и выигрышей; общего правила здесь нет. На протяжении всей книги мы будем встречать примеры преимуществ обоих типов. Основная мысль (противоречащая общепринятому мнению) состоит в том, что преимущество не всегда получает игрок, который ходит первым. И она настолько важна, что мы сочли необходимым подчеркнуть ее с самого начала.
Когда в игре есть преимущество первого или второго хода, каждый игрок может попытаться манипулировать порядком игры, чтобы обеспечить себе выгодную позицию. Тактические приемы такой манипуляции — это стратегические ходы, которые мы рассмотрим в .
5. Увеличение количества ходов
В мы говорили о том, что увеличение количества игроков усложняет анализ игр с последовательными ходами. В данном разделе мы рассмотрим еще один тип сложности, возникающий в результате добавления в игру дополнительных ходов. Самый простой способ сделать это в игре с двумя участниками — разрешить им чередовать ходы более одного раза. В итоге дерево игры разрастается таким же образом, как и дерево игры со многими участниками, но последующие ходы делают те же игроки, что и на более ранних этапах игры.
Многие широко распространенные игры, такие как крестики-нолики, шашки и шахматы, и есть стратегические игры с двумя участниками и чередующимися последовательными ходами. Использование дерева игры и анализа методом обратных рассуждений теоретически позволяет их «решить», то есть определить равновесный исход игры методом обратных рассуждений, а также равновесные стратегии, обеспечивающие такой исход. К сожалению, по мере того как игра усложняется, а стратегии становятся все запутаннее, поиск оптимальной стратегии тоже затрудняется. В таких случаях на помощь приходят стандартные компьютерные программы вроде упомянутой в Gambit.
А. Крестики-нолики
Начнем с игры в крестики-нолики, самой простой из вышеупомянутых, и рассмотрим ее более легкий вариант, в котором каждый из двух игроков (Х и 0) пытается первым заполнить двумя своими символами любой столбец, ряд или диагональ в игре на поле два на два. У первого игрока четыре возможных действия или позиции, в которых он может поставить крестик. Второй игрок имеет три возможных действия в каждом из четырех узлов принятия решений. Когда первый игрок получает право сделать второй ход, у него есть два варианта действия в каждом из 12 (4 × 3) узлов принятия решений. Как показано на рис. 3.7, даже у этой мини-игры в крестики-нолики очень сложное дерево игры. Хотя на самом деле оно не такое уж сложное, поскольку игра гарантированно закончится, после того как первый игрок сделает второй ход. Тем не менее на этом дереве 24 концевых узла, и их необходимо проанализировать.
Рис. 3.7. Сложное дерево простой игры в крестики-нолики на поле два на два
Это дерево служит здесь иллюстрацией того, насколько сложным может быть дерево даже в случае простых (или упрощенных) игр. Как оказалось, применение метода обратных рассуждений к анализу мини-игры в крестики-нолики позволяет быстро найти равновесие. Из такого анализа следует, что любой выбор первого игрока на втором ходе приводит к одному и тому же исходу игры. Здесь нет оптимального действия; любой ход так же хорош, как и остальные. Стало быть, когда второй игрок делает первый ход, он тоже видит, что любой возможный ход даст тот же результат, поэтому может с одинаковым успехом выбрать любой из трех вариантов в каждом из четырех узлов принятия решений. И наконец, то же самое верно и для первого игрока, делающего первый ход: любой вариант выбора равноценен остальным вариантам, а значит, он гарантированно победит в игре.
Хотя у этой версии игры в крестики-нолики весьма занимательное дерево, ее решение не представляет особого интереса. Первый игрок всегда выигрывает, поэтому выбор, сделанный обоими игроками, никак не влияет на конечный результат. Многим из нас больше знакома версия «три на три» игры в крестики-нолики. Для того чтобы проиллюстрировать ее деревом игры, нам пришлось бы показать, что первый игрок имеет девять возможных действий в начальном узле, у второго игрока восемь вариантов действий в каждом из девяти узлов принятия решения. На втором ходе у первого игрока семь возможных действий в каждом из 8 × 9 = 72 узлов, тогда как у второго игрока на втором ходе — шесть возможных действий в каждом из 7 × 8 × 9 = 504 узлов. Эта закономерность продолжается до тех пор, пока дерево не прекратит стремительно разрастаться, поскольку определенные комбинации ходов приводят к победе первого игрока, после чего игра заканчивается. Однако минимум до пятого хода победа невозможна. Для того чтобы нарисовать полное дерево этой игры, понадобится огромный лист бумаги или очень мелкий почерк.
Однако большинство из вас знают, как в худшем случае добиться хотя бы ничьей в игре в крестики-нолики на поле три на три. Так что есть простое решение этой игры, которое можно найти посредством обратных рассуждений, и истинный стратег способен существенно снизить сложность игры в ходе его поисков. Оказывается, как и в версии игры «два на два», многие возможные пути на дереве игры со стратегической точки зрения идентичны. В частности, девять начальных ходов могут быть только трех типов: вы ставите крестик на угловую позицию (четыре возможных варианта), на боковую позицию (также четыре возможных варианта) и на центральную позицию (один вариант). Использование этого метода для упрощения дерева игры поможет снизить уровень сложности задачи и приведет вас к описанию оптимальной равновесной стратегии, полученной методом обратных рассуждений. К примеру, мы могли бы показать, что игрок, который ходит вторым, может гарантированно добиться как минимум ничьей, сделав надлежащий первый ход и постоянно блокируя в дальнейшем попытки первого игрока выставить три символа в ряд.
Б. Шахматы
Хотя сравнительно простые игры, такие как крестики-нолики, решаемы методом обратных рассуждений, выше мы показали, насколько быстро повышается сложность дерева игры даже в играх с двумя участниками. Поэтому при анализе более сложных игр вроде шахмат находить полное решение становится гораздо труднее.
В шахматах в распоряжении игроков (условно называемых «белые» и «черные») имеются наборы из 16 фигур разной формы, которые передвигаются по шахматной доске восемь на восемь клеток (рис. 3.8) в соответствии с заданными правилами. Белые ходят первыми, черные — вторыми, и так далее по очереди. Все ходы видны другому игроку, и ничего не оставлено на волю случая, как в карточных играх, где карты перетасовываются и сдаются. Кроме того, шахматная партия должна заканчиваться за конечное число ходов. Согласно правилам, при троекратном повторении одной и той же позиции в течение игры объявляется ничья. Ввиду наличия конечного количества способов разместить 32 фигуры (или меньше, если некоторые фигуры побиты) на 64 клетках шахматной доски, партия не может продолжаться бесконечно долго без возникновения подобной ситуации. Поэтому в принципе шахматы поддаются полному анализу методом обратных рассуждений.
Рис. 3.8. Шахматная доска
Однако этот анализ так и не проведен. Шахматы не «решены» так, как в свое время крестики-нолики, а причина в том, что, несмотря на простоту правил, шахматы — чрезвычайно сложная игра. Из начальной позиции набора фигур, показанных на рис. 3.8, белые могут сделать любой из 20 ходов, а черные — ответить любым из 20 ходов. Следовательно, из первого узла исходят 20 ветвей, каждая ведет ко второму узлу, из которого исходят еще 20 ветвей. Всего после двух ходов образуется 400 ветвей, и каждая ведет к узлу, из которого исходят очередные ветви. Общее же количество возможных ходов в шахматах составляет, по примерным оценкам, 10120, то есть единицу со 120 нулями. Суперкомпьютеру, в тысячу раз превышающему ваш ПК по быстродействию и выполняющему один триллион операций в секунду, понадобилось бы более 10100 лет, чтобы проверить все ходы. Астрономы отводят нам менее 1010 лет до того момента, когда Солнце превратится в красный гигант и поглотит Землю.
Получается, что хотя для игры в шахматы теоретически можно найти всеобъемлющее решение методом обратных рассуждений, ее полное дерево может оказаться слишком сложным для того, чтобы реализовать такое решение на практике. Что делать игроку в данной ситуации? Знакомство с историей попыток запрограммировать компьютер на игру в шахматы поможет нам многое об этом узнать.
Когда стало ясно, что компьютеры способны выполнять сложные вычисления в науке и бизнесе, многие математики и программисты решили, что вскоре компьютерная шахматная программа победит именитых гроссмейстеров. Но это произошло не так быстро, хотя компьютерные технологии развивались стремительными темпами, тогда как человеческое мышление несколько поотстало. В конце концов в декабре 1992 года немецкая компьютерная программа под названием Fritz2 выиграла у чемпиона мира Гарри Каспарова несколько блицпартий. Согласно обычным правилам, каждому игроку предоставляется 2,5 часа на выполнение 40 ходов, и люди дольше удерживали превосходство. Команда специалистов, финансируемая компанией IBM, вложила немало усилий и ресурсов в разработку специализированного компьютера (получившего название Deep Blue) для игры в шахматы и соответствующего программного обеспечения. В феврале 1996 года Deep Blue выступил в роли противника Гарри Каспарова в матче из шести партий и произвел сенсацию, выиграв первую партию, но Каспаров быстро выявил его слабые места, улучшил контрстратегии и мастерски выиграл остальные партии. На протяжении следующих 15 месяцев команда IBM совершенствовала аппаратное и программное обеспечение компьютера, после чего в мае 1997 года модифицированный Deep Blue выиграл у Каспарова очередной матч из шести партий.
Таким образом, развитие компьютерных технологий характеризовалось сочетанием периодов медленного поэтапного улучшения и ряда стремительных рывков, в то время как люди, сохранив определенное превосходство, не смогли перестроиться настолько быстро, чтобы удержать передовые позиции. При ближайшем рассмотрении оказалось, что люди и компьютеры используют абсолютно разные подходы к анализу очень сложного дерева игры в шахматы.
При обдумывании хода в шахматах крайне трудно (для обоих: и людей, и компьютеров) заранее предвидеть исход игры. Но как насчет того, чтобы просчитать часть ходов, скажем 5−10, вперед и проанализировать игру в обратном порядке из этой позиции? Игра необязательно должна закончиться в рамках этого ограниченного периода; иными словами, узлы, которых вы достигнете через 5−10 ходов, не будут концевыми. Однако в соответствии с правилами игры выигрыши указываются только для концевых узлов. Следовательно, необходим некий косвенный способ присвоения правдоподобных выигрышей неконцевым узлам, поскольку вы не можете проанализировать все дерево игры методом обратных рассуждений с самого конца. Правило, согласно которому присваиваются промежуточные выигрыши, называется функцией промежуточной оценки.
В шахматах и люди, и компьютерные программы используют такой частичный упреждающий анализ в сочетании с функцией промежуточной оценки. Классический метод присваивает определенные значения каждой фигуре, а также позиционным и комбинационным преимуществам, которые могут возникнуть в процессе игры. Количественная оценка значений для различных позиций производится на основе опыта игры, накопленного всем шахматным сообществом в ходе прошлых партий, начинавшихся с соответствующих позиций или комбинаций; этот опыт называется знанием. Сумма всех числовых значений, закрепленных за шахматными фигурами и их комбинациями на той или иной позиции, и есть ее промежуточная оценка. Целесообразность хода определяется по оценке позиции, на которую предположительно выйдет игра после точного упреждающего вычисления конкретного количества (например, пяти или шести) ходов.
Дальше всего оценка промежуточных позиций продвинулась в отношении дебютов, то есть первой дюжины ходов игры. Каждый отдельно взятый дебют может привести к любому из огромного множества дальнейших ходов и позиций, однако опыт позволяет игрокам делать вывод о том, какой дебют с определенной степенью вероятности более выгоден для того или иного игрока. Эта информация записана в объемных книгах о шахматных дебютах; все шахматисты высокого класса и компьютерные программы помнят и используют эти знания.
На последних стадиях игры, когда на доске остается всего несколько фигур, сам процесс обратных рассуждений зачастую достаточно прост, чтобы быть выполнимым, и достаточно полон, чтобы дать исчерпывающий ответ. Труднее всего проанализировать миттельшпиль (середину игры), когда позиции развились до того уровня сложности, который не упростится за несколько ходов. Для поиска удачного хода из такой позиции хорошо проработанная функция промежуточной оценки может быть более значимой, чем способность рассчитать игру еще на несколько ходов вперед.
Именно на стадии миттельшпиля на первый план выходит искусство игры в шахматы. У лучших шахматистов развивается интуиция, которая позволяет им распознавать хорошие возможности и избегать скрытых ловушек на уровне, с которым компьютерным программам сложно конкурировать. Программисты обнаружили, что в большинстве случаев компьютеры трудно обучить тем навыкам распознавания образов, которые люди развивают и используют инстинктивно, — например, когда они узнают лица и связывают их с именами. Искусство ведения игры на стадии миттельшпиля в шахматах — это распознавание и оценка комбинаций столь же загадочным способом. Именно в этом состояло самое большое преимущество Каспарова перед Fritz2 или Deep Blue. Это также объясняет, почему компьютерные программы показывают более высокие результаты в игре с людьми в блицпартиях или партиях с ограниченным временем обдумывания ходов: человеку просто не хватает времени, чтобы применить свое искусство ведения игры на стадии миттельшпиля.
Иными словами, лучшие шахматисты обладают филигранным знанием шахмат, основанным на опыте или способности распознавать образы, что предоставляет в их распоряжение более эффективную функцию промежуточной оценки. Компьютеры доминируют в области вычислений методом грубой силы. Таким образом, хотя в настоящее время и люди, и компьютеры используют сочетание упреждающей и промежуточной оценки, они применяют их в разных пропорциях: шахматисты просчитывают наперед не так много ходов, но располагают более развитой функцией промежуточной оценки на основании знаний; компьютеры имеют менее развитые функции оценки, но могут просчитывать наперед гораздо больше ходов благодаря огромной вычислительной мощности.
В последнее время компьютеры начали накапливать больше знаний. В процессе модификации Deep Blue в 1996–1997 годах специалисты IBM заручились поддержкой экспертов по шахматам для улучшения функции промежуточной оценки в своих программах. Консультанты много раз играли в шахматы с компьютером, отмечали его слабые места и подсказывали, как изменить функцию оценки, чтобы устранить дефекты. Deep Blue явно пошел на пользу вклад экспертов и их тонкое мышление, ставшее результатом многолетнего опыта и знания сложных взаимосвязей между фигурами на шахматной доске.
Если люди, постепенно формулируя свои глубинные знания, передают их компьютерам, то на что рассчитывать шахматистам, не получающим от ПК аналогичной помощи? В момент первой встречи с Deep Blue в 1997 году Каспаров был поражен человеческим или даже сверхчеловеческим качеством игры компьютера. Он даже увидел в одном из его ходов «руку Бога». А ведь ситуация может усугубиться еще сильнее: способность компьютеров просчитывать ходы методом грубой силы стремительно повышается, причем одновременно, хотя и медленнее, они обретают тонкость мышления, свойственную человеку.
Абстрактная теория шахмат гласит, что это конечная игра, которая может быть решена методом обратных рассуждений. Шахматы зачастую требуют искусства ведения игры, опирающегося на опыт, интуицию и тонкие суждения. Плохо ли это с точки зрения использования метода обратных рассуждений в процессе анализа игр с последовательными ходами? Мы считаем, что нет. Теория действительно не позволяет найти полное решение игры в шахматы, но дает возможность достаточно далеко продвинуться в этом направлении. Упреждающий анализ нескольких ходов — важный аспект подхода, подразумевающий сочетание просчета ходов методом грубой силы и основанной на знаниях оценки промежуточных позиций. По мере увеличения вычислительной мощности компьютеров будет возрастать и роль просчитывания ходов методом грубой силы, а значит, и область применения теории обратных рассуждений.
Данные исследований игры в шашки, о чем мы расскажем ниже, говорят о том, что решение игры в шахматы все же может быть найдено.
В. Шашки
Невероятное количество компьютерных и человеко-часов ушло на поиск решения игры в шахматы. С не меньшим упорством исследователи работали и над решением несколько более простой игры — в шашки, и в 2007 году объявили, что оно найдено.
Шашки — еще одна игра с двумя участниками, в которую играют на доске восемь на восемь клеток. Каждый игрок имеет по 12 круглых фигур, или шашек, разного цвета (рис. 3.9), и игроки по очереди передвигают их по диагонали, перепрыгивая (и захватывая) шашки противника, когда это возможно. Как и в шахматах, игра заканчивается и игрок А выигрывает, если у игрока Б не остается шашек или ему некуда ходить. Кроме того, партия может завершиться вничью, если оба игрока согласятся, что ни один из них не может победить.
Рис. 3.9. Шашки
Хотя сложность шашек меркнет на фоне шахмат (количество вероятных позиций в шашках приблизительно равно квадратному корню из количества позиций в шахматах), существует 5 × 1020 возможных позиций, так что о построении дерева игры не может быть и речи. Если исходить из здравого смысла и результатов чемпионатов мира по шашкам за многие годы, то хорошая игра должна приводить к ничьей, но это не было доказано. Однако спустя какое-то время программисту из Канады все же удалось получить такое доказательство — компьютерную программу Chinook, которая способна обеспечить гарантированную ничью.
Chinook появилась в 1989 году, а в 1992-м впервые сразилась с чемпионом мира по шашкам Марионом Тинсли (проиграв со счетом 4:2 при 33 ничьих), а затем еще раз в 1994 году (когда во время серии ничьих у Тинсли пошатнулось здоровье). В период с 1997 по 2001 год работа над программой была приостановлена, поскольку ее создатели ждали усовершенствования компьютерных технологий. И наконец весной 2007 года Chinook продемонстрировала беспроигрышный алгоритм игры в шашки, использующий комбинацию анализа методом обратных рассуждений с конца игры и прямого анализа игры с исходной позиции наряду с эквивалентом функции промежуточной оценки для отслеживания лучших ходов в базе данных, включающей все возможные позиции на доске.
Создатели Chinook называют полную игру в шашки «слабо решенной»; они знают, что могут обеспечить ничью, и у них есть стратегия ее достижения с исходной позиции. Для всех 39 × 1012 возможных позиций с наличием 10 или менее шашек на доске они описывают игру как «строго решенную». В этом случае они знают, что могут не только сыграть вничью, но и достичь ее из любой позиции, сформировавшейся после того, как на доске останется не более 10 шашек. Этот алгоритм сначала решил эндшпиль с 10 шашками, а затем вернулся к началу игры, чтобы найти те ее пути, на которых оба игрока делают оптимальный выбор. Механизм поиска, включающий комплексную систему оценки каждой промежуточной позиции, неизбежно приводил к тем позициям с 10 шашками, которые гарантировали ничью.
Следовательно, наша надежда на будущее анализа методом обратных рассуждений небеспочвенна. Мы знаем, что в действительно простых играх можем найти равновесие посредством вербальных рассуждений без необходимости рисовать дерево игры в явной форме. В играх среднего уровня сложности процесс вербальных размышлений затрудняется, но можно нарисовать дерево игры и использовать его в ходе анализа методом обратных рассуждений. Иногда при анализе дерева игры умеренной сложности имеет смысл прибегнуть к помощи компьютера. В более сложных играх, таких как шашки и шахматы, мы можем нарисовать только часть дерева игры, поэтому должны применять сочетание двух методов: 1) просчет ходов, строящийся на логике обратных рассуждений; 2) эмпирическая оценка промежуточных позиций на основе опыта. Вычислительные возможности существующих алгоритмов подтверждают тот факт, что даже некоторые игры этой категории поддаются решению при наличии соответствующего времени и ресурсов.
К счастью, большинство стратегических игр, с которыми мы сталкиваемся в области экономики, политики, спорта, бизнеса и в повседневной жизни, гораздо проще по сравнению с шахматами или даже шашками. В них может быть несколько игроков, которые ходят по несколько раз, и даже большое количество игроков и большое количество ходов. Однако у нас есть шанс нарисовать приемлемое дерево для игр, последовательных по своей сути. Логика обратных рассуждений остается в силе; и часто так бывает, что стоит вам освоить этот метод, и вы легко выполняете необходимый логический анализ и решаете игру даже без построения дерева игры в явной форме. Кроме того, именно на этом промежуточном уровне сложности (между простыми примерами, которые мы решили в данной главе, и нерешенными играми вроде шахмат) могут пригодиться такие компьютерные программы, как Gambit; это открывает перспективу применения теории к решению многих игр на практике.
6. Фактические данные, касающиеся метода обратных рассуждений
Насколько хорошо фактические участники игр с последовательными ходами выполняют вычисления в рамках анализа методом обратных рассуждений? Таких систематизированных данных крайне мало, но аудиторные и научно-исследовательские эксперименты с некоторыми играми привели к результатам, на первый взгляд противоречащим прогнозам теории. Ряд экспериментов имеют весьма интересные последствия для стратегического анализа игр с последовательными ходами.
Например, в ходе многих экспериментов разыгрывалась состоящая из одного раунда переговорная игра, где двух игроков, А и Б, выбирали из группы студентов или добровольцев. Затем экспериментатор давал им один доллар или другую оговоренную сумму, которую следовало разделить между двумя игроками по следующей схеме: игрок А предлагает, скажем, вариант «75 центов мне и 25 центов игроку Б». Если Б принимает это предложение, то доллар делится именно так, если отклоняет, то никто ничего не получает.
В данном случае анализ методом обратных рассуждений говорит о том, что игроку Б следует принять любую сумму, какой бы маленькой она ни была, поскольку альтернатива еще хуже (то есть 0), и исходя из этого игрок А вообще должен предложить «99 центов мне и 1 цент Б». Однако подобного исхода почти никогда не бывает. Большинство игроков, выступающих в роли игрока А, предлагают более справедливое, близкое к равному разделение суммы. На самом деле 50:50 — самый распространенный вариант. Мало того, большинство участников, будучи в роли игрока Б, отклоняют предложения, оставляющие им менее 25 % от общей суммы, и уходят ни с чем, а некоторые отвергают даже 40 %.
Многие специалисты по теории игр не согласны, что эти выводы подрывают теорию, аргументируя свою точку зрения примерно так: «Эти суммы настолько малы, что разум игроков воспринимает происходящее как нечто тривиальное. Игрок Б теряет 25 или 40 центов, что практически равно нулю, но при этом, возможно, испытывает определенное удовлетворение от того, что отказался от столь унизительного предложения. Если бы на кону стояла тысяча долларов и 25 % составляли бы приличную сумму, то любой игрок Б принял бы такое предложение». Но этот аргумент нельзя считать бесспорным. Эксперименты с гораздо более высокими ставками демонстрируют аналогичные результаты. В Индонезии, например, оперировали суммами, не очень большими в долларах, но составлявшими трехмесячный заработок участников экспериментов. И тем не менее их результаты не показали явной склонности игроков А делать предложения о менее равноценном дележе общей суммы, хотя по мере ее увеличения игроки Б были готовы принимать несколько меньшую долю. Аналогичные эксперименты, проведенные в Словацкой Республике, доказали, что серьезное изменение выигрышей не влияет на поведение неопытных игроков.
Как правило, у участников подобных экспериментов нет ни базовых знаний в области теории игр, ни специальных вычислительных навыков. Но это чрезвычайно простая игра, и наверняка даже самый неопытный игрок может ее проанализировать посредством обратных рассуждений, а ответы на прямые вопросы, поставленные после эксперимента, обычно говорят о том, что большинство его участников действительно делают это. Такие результаты свидетельствуют не столько о несостоятельности метода обратных рассуждений, сколько об ошибке теоретиков, полагающих, что каждого игрока интересует исключительно собственная прибыль, и не учитывающих моральный аспект вопроса. В большинстве стран общество прививает своим членам обостренное чувство справедливости, которое заставляет игроков Б отклонять любое явно несправедливое предложение. Учитывая это, игроки А предлагают практически равное разделение общей суммы.
Эти выводы подтверждают данные, полученные в рамках изучения новой науки под названием нейроэкономика. Алан Сэнфи и его коллеги сделали томограмму головного мозга игроков в момент принятия решений в ультимативной игре и обнаружили возбуждение активности в области головного мозга, отвечающей за негативные эмоции, в тот момент, когда игроки Б отклоняли «несправедливые» (менее чем 50:50) предложения о дележе общей суммы. Создается впечатление, что глубинные инстинкты и чувство гнева и отвращения причастны к таким отказам. Кроме того, исследователи обнаружили, что «несправедливые» предложения (менее чем 50:50) отклонялись реже, когда игроки Б знали, что их делает компьютер, по сравнению со случаями, когда они исходили от человека.
Примечательно, что игроки А демонстрируют склонность к щедрости даже при отсутствии угрозы возмездия. В радикальном варианте игры под названием диктаторская игра, где игрок А решает, как делить общую сумму, а Б вообще лишен выбора, многие игроки А все же отдают вполне приличную долю игрокам Б. Это позволяет предположить, что у игроков есть некое врожденное предпочтение к относительно равноценному распределению общей суммы. Однако в игре в диктатора предложения игроков А заметно менее щедрые, чем в ультимативной игре; это доказывает, что реальный страх возмездия также весьма сильный мотиватор. Кроме того, по всей видимости, немалую роль играет и мнение о нас окружающих. Примечательно, что когда схема эксперимента меняется таким образом, чтобы даже экспериментатор не мог определить, кто предложил (или принял) разделение, готовность делиться заметно снижается.
Еще одна экспериментальная игра со столь же парадоксальными результатами проходит по следующей схеме: выбираются два игрока, А и Б. Экспериментатор кладет на стол монету в 10 центов. Игрок А может ее взять или пропустить ход. Если игрок А берет монету, игра закончена; при этом А получает 10 центов, а Б — ничего. Если игрок А пропускает ход, экспериментатор кладет на стол еще одну монету в 10 центов, и теперь игроку Б предстоит выбирать, взять ли ему обе монеты или пропустить ход. Игроки действуют по очереди, а стопка монет растет до тех пор, пока не достигнет определенной предельной суммы (например, одного доллара), заранее известной обоим игрокам.
Дерево этой игры показано на рис. 3.10. Из-за его внешнего вида игры такого типа часто называют игра «стоножка». Возможно, вам даже не понадобится строить дерево игры, чтобы проанализировать ее методом обратных рассуждений. Очевидно, что игрок Б возьмет один доллар на последнем этапе, поэтому игроку А следует взять 90 центов на предпоследнем этапе и т. д. Следовательно, игрок А должен взять монету в 10 центов в самом начале и закончить игру.
Рис. 3.10. Игра «стоножка»
Однако во время экспериментов такие игры длятся, как правило, несколько раундов. Примечательно, что благодаря иррациональному поведению игроки как группа получают больше денег, чем в случае, если бы они придерживались логики обратных рассуждений. Иногда более весомых успехов добивается игрок А, а иногда — игрок Б, а порой им даже удается разрешить конфликт или задачу с переговорами. В ходе аудиторного эксперимента, который проводил один из нас (Диксит), одна такая игра дошла до самого конца. Игрок Б забрал свой доллар и совершенно добровольно отдал 50 центов игроку А. Диксит спросил: «Вы сговорились? Вы с Б друзья?» На что игрок А ответил: «Нет, мы даже не были знакомы раньше. Но теперь он мой друг». Мы столкнемся с аналогичными примерами сотрудничества, на первый взгляд противоречащими логике обратных рассуждений, при анализе повторяющихся игр с дилеммой заключенных в .
Игра «стоножка» указывает на возможную проблему с логикой обратных рассуждений в играх с ненулевой суммой, даже если игроки принимают решения исходя исключительно из денежных соображений. Обратите внимание, что, пропуская ход в первом раунде, игрок А уже показывает, что не опирается на метод обратных рассуждений. Так чего следует ожидать от него игроку Б в третьем раунде? Пропустив ход однажды, игрок А может снова это сделать, а значит, игроку Б было бы целесообразно пропустить ход во втором раунде. В конечном счете кто-то заберет всю стопку монет, но исходное отклонение от логики обратных рассуждений не позволяет предсказать, когда именно это произойдет. А поскольку стопка монет продолжает расти, если я увижу, что вы отклоняетесь от логики обратных рассуждений, у меня также может возникнуть желание отклониться от нее как минимум на какое-то время. Игрок может сознательно пропустить ход в одном из начальных раундов игры, чтобы сигнализировать о готовности пропускать ходы в будущих раундах. Такая проблема не возникает в играх с нулевой суммой, в которых отсутствует стимул к сотрудничеству посредством ожидания.
В поддержку этого наблюдения Стивен Левитт, Джон Лист и Салли Сэдофф провели эксперименты с участием шахматистов мирового класса и обнаружили, что поведение игроков в большей степени соответствует логике обратных рассуждений в играх с последовательными ходами с нулевой суммой, чем в игре «стоножка» с ненулевой суммой. Их игра «стоножка» состоит из шести узлов, а общая сумма выигрыша растет довольно резко от раунда к раунду. Несмотря на значительные выгоды для игроков, способных пропускать ходы, передавая их друг другу, согласно равновесию обратных рассуждений в каждом узле необходимо выбирать вариант «взять». Вопреки теории всего 4 процента игроков сыграли «взять» в первом узле, практически не поддержав равновесие обратных рассуждений даже в этой простой игре на шесть ходов. (Доля игроков, выбравших вариант «взять», увеличивалась в ходе игры.)
Напротив, в игре с последовательными ходами с нулевой суммой, в которой равновесие обратных рассуждений достигается за 20 ходов (вам предстоит решить эту игру в ), шахматисты играли в точном соответствии с ним в 10 раз чаще, чем в игре «стоножка», состоящей из шести ходов.
Левитт и его соавторы также экспериментировали с похожей, но более сложной игрой с нулевой суммой (одну из версий которой вам предлагается решить в ), где шахматисты достигали полного равновесия обратных рассуждений только в 10 процентах случаев (в 20 процентах, когда в игре участвовали гроссмейстеры с самым высоким рейтингом), хотя на последних нескольких ходах согласование ходов с методом обратных рассуждений составляло почти 100 процентов. Поскольку шахматисты мирового класса проводят десятки тысяч часов в попытках выиграть шахматные партии посредством обратных рассуждений, эти результаты указывают на то, что даже в высшей степени опытные игроки зачастую не могут мгновенно включиться в новую игру: им необходимо накопить в ней немного опыта, прежде чем они смогут определить оптимальную стратегию. Изучение теории игр поможет вам без труда находить глубинное сходство между разными на первый взгляд ситуациями, а значит, и быстрее вырабатывать эффективные стратегии в любых новых играх, с которыми вы можете столкнуться.
Исходя из приведенных примеров можно сделать вывод, что кажущееся нарушение стратегической логики во многих случаях объясняется заботой людей не только о денежном выигрыше, но и о моральной стороне вопроса, в данном случае о справедливости. Однако подобное объяснение подходит не для всех наблюдаемых методов ведения игры, противоречащих принципу обратных рассуждений. Люди действительно не умеют заглядывать достаточно далеко вперед и делать надлежащие выводы из таких попыток. Скажем, когда эмитенты кредитных карт предлагают выгодные исходные процентные ставки или полное отсутствие комиссионных за первый год, многие попадаются на эту удочку, не осознавая, что впоследствии им, возможно, придется выложить гораздо больше. Следовательно, теоретико-игровой анализ метода обратных рассуждений и равновесий, полученных посредством этого метода, выполняет рекомендательную функцию в той же степени, что и описательную. Люди, овладевшие теорией обратных рассуждений, склонны принимать более эффективные решения и обычно получают более высокие выигрыши, что бы они ни включали в их расчеты. А специалисты по теории игр могут использовать свои знания, чтобы давать ценные советы тем, кто попал в сложные стратегические ситуации и не имеет навыков определения лучшей стратегии.
7. Стратегии в реалити-шоу Survivor
Примеры, приведенные в предыдущих разделах, намеренно подобраны так, чтобы проиллюстрировать и объяснить базовые концепции, такие как узлы, ветви, ходы и стратегии, а также метод обратных рассуждений. Теперь мы покажем, как их все применить, рассмотрев ситуацию из реальной жизни (или по крайней мере из жизни в реалити-шоу).
Летом 2000 года телеканал CBS показал первое реалити-шоу Survivor, которое моментально обрело популярность и способствовало созданию нового телевизионного жанра — «реалити-ТВ». Если опустить множество сложных деталей и некоторые более ранние этапы шоу, не имеющие отношения к нашей цели, то его концепция состояла в следующем. Группу участников под названием «племя» отправляли на необитаемый остров, где они должны были сами добывать себе пищу и искать крышу над головой. Каждые три дня члены племени путем голосования исключали из своих рядов одного из товарищей. Человек, набравший наибольшее количество голосов против, становился жертвой дня. Однако перед каждым собранием совета племени продержавшиеся до этого момента состязались в игре, требовавшей наличия физических или психических навыков, придуманной продюсерами специально для данного случая. Ее победитель получал иммунитет от предстоящего голосования. Кроме того, никто не имел права голосовать против себя. И наконец, когда оставалось всего два участника шоу, семь выбывших ранее членов племени возвращались в игру в качестве жюри, чтобы выбрать одного из них как ее победителя и обладателя приза в миллион долларов.
Перед каждым участником состязания стояли следующие стратегические задачи: 1) добиться того, чтобы остальные члены племени воспринимали его как человека, вносящего ценный вклад в поиски пищи и выполнение других задач по выживанию, но при этом не показаться сильным конкурентом, а значит, кандидатом на вылет; 2) сформировать союзы с другими соплеменниками, чтобы обеспечить блоки голосов и защитить себя от исключения из племени; 3) предать союзников, когда в игре останется слишком мало участников и каждому придется против кого-то голосовать; 4) сделать это без серьезной потери популярности среди других игроков, которые в конечном счете получат право голоса в жюри.
Мы рассмотрим ситуацию, когда в реалити-шоу осталось всего три участника: Руди, Келли и Рик. Самый старший, Руди, был честным, прямолинейным человеком, который пользовался большим авторитетом среди ранее выбывших участников шоу. По всеобщему мнению, если бы Руди был одним из двух последних игроков, то именно он стал бы победителем в реалити-шоу. Следовательно, и Келли, и Рик были заинтересованы в том, чтобы на последнем голосовании противостоять друг другу, а не Руди. Однако ни один из них не хотел играть решающую роль в голосовании против Руди, потому что, когда в игре остается три участника, голос обладателя иммунитета фактически становится решающим, поскольку два других игрока голосуют друг против друга. Таким образом, члены жюри точно бы знали, кто ответственен за изгнание Руди, и, учитывая его популярность, неодобрительно отнеслись бы к голосованию против него. Человек, сделавший это, снизил бы свои шансы на последнем голосовании. Это было особенно актуально для Рика, так как всем было известно, что он заключил с Руди союз.
Испытание на получение иммунитета было проверкой на выносливость: каждый участник игры должен был стоять на неудобной опоре, наклонившись так, чтобы прикасаться одной рукой к установленному на центральном столбе тотему под названием «идол иммунитета». Игрок, который отрывал от него руку хотя бы на мгновение, проигрывал испытание; победителем становился тот, кто смог продержаться дольше всех.
Через полтора часа после начала испытания Рик понял, что его лучшая стратегия — намеренно его проиграть. Тогда, если Руди получит иммунитет, он сохранит союз и поддержит Рика — Руди был известен как хозяин своего слова. В таком случае Рик проиграл бы в итоге Руди, но для него это было бы ничуть не хуже, чем если бы он выиграл состязание и поддержал Руди. Если иммунитет получит Келли (а это куда более вероятно), то она будет заинтересована голосовать против Руди: у нее есть хотя бы какие-то шансы в борьбе против Рика, но никаких — в противостоянии с Руди. При таком сценарии шансы Рика на победу становились весьма неплохими. С другой стороны, если бы сам Рик получил иммунитет, а затем проголосовал против Руди, его шансы в борьбе против Келли снизились бы в связи с голосованием за изгнание Руди.
В итоге Рик умышленно сошел с опоры и впоследствии совершенно четко объяснил причины своего решения перед камерой. Его расчет оказался верным. Келли выиграла испытание и проголосовала против Руди. А в решающем голосовании жюри с перевесом в один голос отдало звание победителя Рику.
Фактически размышления Рика представляли собой анализ дерева игры методом обратных рассуждений. Он выполнил его интуитивно, без построения дерева, стоя в неудобной позе, ухватившись за идола иммунитета. Но ему понадобилось полтора часа, чтобы прийти к такому выводу.
Это дерево игры изображено на рис. 3.11. Очевидно, что оно гораздо более сложное по сравнению с деревьями, представленными в предыдущих разделах. В нем больше ветвей и ходов, кроме того, есть неопределенные исходы, а вероятность победы или поражения в различных альтернативных ситуациях необходимо оценивать, поскольку точное значение неизвестно. Однако вы увидите, как в процессе анализа дерева игры мы будем делать обоснованные предположения относительно шансов на победу или поражение.
Рис. 3.11. Дерево игры в иммунитет в реалити-шоу Survivor
В начальном узле Рик решает, стоит ли продолжать участвовать в испытании на получение иммунитета. В любом случае возможного победителя с уверенностью предсказать нельзя, что отображено на дереве игры и позволяет сделать выбор «природе», как в ситуации с подбрасыванием монеты на . Если Рик продолжит игру, «природа» выберет победителя из трех участников состязания. Поскольку фактические значения вероятности нам неизвестны, мы возьмем конкретные значения для наглядности и укажем важные исходные предположения. Первое состоит в том, что Келли обладает высокой выносливостью, а Руди, будучи самым старшим, вряд ли победит. Поэтому мы присваиваем следующие значения вероятности победы в случае, если Рик решит продолжить игру: Келли — 0,5 (50 %), Рик — 0,45 и Руди — всего 0,05. Если Рик сойдет с дистанции, «природа» случайным образом выберет победителя из двух оставшихся игроков. Здесь мы основываемся на предположении, что Келли выиграет с вероятностью 0,9, а Руди — 0,1.
Остальные ветви дерева исходят из узлов, соответствующих трем возможным победителям испытания. Если выиграет Руди, он, как и обещал, поддержит Рика, и жюри проголосует за Рика. Если иммунитет получит Рик, ему придется решать, кого поддержать — Келли или Руди. Если Руди, то жюри за него и проголосует. Если Келли, то неизвестно, кого предпочтет жюри. Мы предполагаем, что Рик, выступив против Руди, утратит расположение некоторых членов жюри и, несмотря на большую благосклонность со стороны жюри по сравнению с Келли, получит голоса его членов с вероятностью всего 0,4. Точно так же, если иммунитет достанется Келли, она может поддержать либо Руди и потерять голоса членов жюри, либо Рика. Если Келли выберет Рика, его вероятность получить голоса членов жюри повысится — 0,6, поскольку в этом случае жюри ему больше симпатизирует и он не голосовал против Руди.
Как насчет фактических выигрышей игроков? Мы можем с уверенностью предположить, что и Рик, и Келли стремятся максимизировать вероятность того, что в конечном счете кто-то из них выиграет 1 миллион долларов. Руди тоже хочет получить этот приз, но для него крайне важно сдержать данное Рику слово. С учетом этих предпочтений игроков Рик может выполнить анализ дерева игры методом обратных рассуждений, чтобы определить свой первоначальный выбор.
Рик знает, что, выиграв испытание на получение иммунитета (самый верхний путь после его первого хода и хода «природы»), он должен поддержать Келли, чтобы обеспечить себе победу с вероятностью 40 процентов; поддержка Руди на данном этапе означала бы для него нулевую вероятность победы. Рик может также вычислить, что, если Келли получит иммунитет (что происходит по одному разу в верхней и нижней половине дерева), она решит его поддержать по тем же причинам, и тогда вероятность его победы составит 0,6.
Каковы шансы Рика, рассчитанные в начальном узле? Если Рик выбирает в нем вариант «прекратить», у него остается только один путь к победе: Келли получает иммунитет (вероятность 0,9), после этого поддерживает Рика (вероятность 1), и жюри голосует за него (вероятность 0,6). Поскольку победа Рика зависит от совокупности этих трех событий, общая вероятность его победы представляет собой произведение трех вероятностей: 0,9 × 1 × 0,6 = 0,54. Если Рик в начальном узле выбирает вариант «продолжить», это открывает ему два пути к победе. Во-первых, он победит, если выиграет испытание на получение иммунитета (вероятность 0,45), после чего устранит Руди (вероятность 1) и все же получит голоса жюри в противостоянии с Келли (вероятность 0,4); общая вероятность победы при таком развитии событий составляет 0,45 × 0,4 = 0,18. Во-вторых, он станет победителем, если Келли выиграет испытание на получение иммунитета (вероятность 0,5), затем избавится от Руди (вероятность 1), а Рику достанутся голоса жюри (вероятность 0,6); в этом случае общая вероятность составляет 0,5 × 0,6 = 0,3. Общая вероятность победы Рика при выборе варианта «продолжить» представляет собой сумму вероятностей двух путей к победе, а именно 0,18 + 0,3 = 0,48.
Теперь Рик может сравнить вероятность выигрыша миллиона долларов при выборе варианта «прекратить» (0,54) с вероятностью победы в случае выбора варианта «продолжить» (0,48). С учетом предполагаемых значений различных вероятностей на дереве игры у Рика больше шансов на победу, если он откажется от участия в испытании на получение иммунитета. Следовательно, «прекратить» — его оптимальная стратегия. Хотя этот результат основан на присвоении определенных предполагаемых значений вероятностям тех или иных событий, он остается для Рика лучшим при выполнении следующих условий: 1) Келли с большой вероятностью выиграет испытание на получение иммунитета, если Рик откажется от дальнейшего участия в нем; 2) победа Рика в последнем голосовании жюри более вероятна в случае, если Келли, а не Рик, проголосует против Руди.
Этот пример служит нескольким целям. Главное — он показывает, как использование анализа методом обратных рассуждений позволяет решить даже сложное дерево игры со значительной внешней неопределенностью и отсутствием информации о точных значениях вероятностей. Мы надеемся, что это придаст вам уверенности касательно применения данного метода, а также научит превращать несколько расплывчатое вербальное описание в более точную логическую аргументацию. Вы можете возразить, что Рик выполнил такой анализ без построения дерева игры. Но знание системы или общей модели существенно упрощает эту задачу даже в новых незнакомых обстоятельствах. Следовательно, приобретение системных навыков, несомненно, заслуживает потраченных усилий.
Вторая цель данного примера — проиллюстрировать на первый взгляд парадоксальную стратегию «проиграть, чтобы выиграть», еще одно применение которой можно найти в спортивных соревнованиях, проходящих в два этапа, таких как чемпионат мира по футболу. Первый этап проводится в рамках лиги в нескольких группах по четыре команды в каждой. Две лучшие команды в каждой группе участвуют во втором туре чемпионата, где каждая команда встречается с другими командами согласно заранее оговоренной схеме. Скажем, команда, занявшая первое место в группе А, играет с командой, занявшей второе место в группе B, и т. д. В такой ситуации выигрышной стратегией для команды может стать поражение в одном из матчей первого этапа, если оно позволит ей занять второе место в группе, что обеспечит возможность сыграть следующий матч против команды, вероятность победить которую гораздо выше, чем в случае, если бы команда заняла первое место на первом этапе.
Резюме
Участникам игр с последовательными ходами необходимо проанализировать последствия своих текущих ходов, прежде чем выбирать действия. Как правило, анализ чистых игр с последовательными ходами требует построения дерева игры. Такое дерево состоит из узлов и ветвей, отображающих все вероятные действия каждого игрока при каждой возможности сделать ход, а также выигрыши для всех предполагаемых исходов игры. Стратегия каждого игрока представляет собой исчерпывающий план, описывающий его действия в каждом узле принятия решений в зависимости от всех возможных комбинаций действий, предпринятых другими игроками в предыдущих узлах. В играх с последовательными ходами используется концепция равновесия обратных рассуждений, в соответствии с которой игроки определяют свои равновесные стратегии посредством прогнозного анализа последующих узлов и выполненных в них возможных действий, а также путем применения этих прогнозов для вычисления лучшего текущего действия. Этот процесс известен как «обратные рассуждения» или «обратная индукция».
Ряд типов игр предоставляет игрокам различные преимущества, такие, например, как преимущество первого хода. Наличие в игре большого количества участников или ходов приводит к росту дерева игры с последовательными ходами, но не меняет процесса ее решения. Иногда построение полного дерева игры может потребовать больше места или времени, чем это возможно на практике. Во многих случаях такие игры решаются путем простых логических размышлений или посредством определения стратегических сходных элементов различных действий, что позволяет уменьшить размер дерева игры.
При решении более крупных игр вербальные размышления могут привести к равновесию обратных рассуждений, если игра достаточно простая или ее полное дерево поддается построению и анализу. Если игра сложная, вербальные размышления слишком трудны, а полное дерево игры огромно, можно прибегнуть к помощи компьютерной программы. Игру в шашки удалось решить посредством такой программы, хотя полное решение игры в шахматы еще предположительно долго будет оставаться за пределами возможностей компьютеров. В реальных шахматных баталиях в определении ходов игроков присутствуют как элементы искусства (выявление закономерностей и возможностей в зависимости от рисков), так и науки (упреждающее вычисление вероятных исходов игры, вытекающее из результатов определенных ходов).
Проверка теории игр с последовательными ходами на первый взгляд подтверждает тот факт, что реальные игры демонстрируют иррациональность игроков или неспособность теории адекватно предсказывать их поведение. Встречный аргумент подчеркивает сложность фактических предпочтений в отношении различных возможных исходов игры, а также пользу стратегической теории для определения оптимальных действий в случаях, когда фактические предпочтения известны.
Ключевые термины
Ветвь
Дерево игры
Дерево решений
Концевой узел
Корень (дерева)
Метод обратных рассуждений
Начальный узел
Обратная индукция
Отсечение (ветвей)
Преимущество второго хода
Преимущество первого хода
Путь игры
Равновесие обратных рассуждений
Равновесный путь игры
Узел
Узел действия
Узел принятия решений
Функция промежуточной оценки
Ход
Экстенсивная форма
Упражнения с решениями
S1. Предположим, два игрока, Гензель и Гретель, участвуют в игре с последовательными ходами. Гензель ходит первым, Гретель — второй, причем каждый ходит только раз.
a) Нарисуйте дерево игры, в которой у Гензеля есть два возможных действия («вверх» или «вниз») в каждом узле, а у Гретель — три («вверх», «посредине» или «вниз»). Сколько узлов каждого типа (узлов принятия решений и концевых узлов) присутствует в дереве этой игры?
b) Нарисуйте дерево для игры, в которой у Гензеля и Гретель по три возможных действия («сидеть», стоять» и «прыгать») в каждом узле. Сколько узлов двух типов присутствует в дереве такой игры?
c) Нарисуйте дерево для игры, в которой у Гензеля четыре возможных действия («север», «юг», «восток», «запад») в каждом узле, а у Гретель — два («стоять» или «идти»). Сколько узлов двух типов присутствует в дереве такой игры?
S2. Определите, сколько чистых стратегий (исчерпывающих планов действий) находится в распоряжении каждого игрока в следующих играх. Перечислите все чистые стратегии каждого игрока.
S3. Для каждой из игр, представленных в упражнении S2, вычислите исход, полученный посредством равновесия обратных рассуждений, а также полную равновесную стратегию каждого игрока.
S4. Рассмотрим соперничество между Airbus и Boeing в сфере разработки нового коммерческого реактивного самолета. Предположим, что Boeing лидирует в этом процессе, а в Airbus размышляют, стоит ли вступать в конкурентную борьбу. В случае отказа Airbus получит нулевую прибыль, тогда как Boeing станет монополистом и заработает 1 миллиард долларов. Если Airbus решит вступить в борьбу и создать конкурентоспособный самолет, то Boeing придется решать, уладить ли разногласия с Airbus мирным путем или развязать ценовую войну. Мирная конкуренция обеспечит каждой компании прибыль в 300 миллионов долларов, а ценовая война приведет к потере каждой из них 100 миллионов долларов, поскольку цены на самолеты настолько сильно упадут, что ни одна из них не сможет возместить затрат на разработку самолета.
Нарисуйте дерево этой игры. Найдите равновесия обратных рассуждений и опишите равновесные стратегии компаний.
S5. Рассмотрим игру, в которой два игрока, Фред и Барни, по очереди извлекают спички из кучки. Изначально там находится 21 спичка, и Фред ходит первым. На каждом ходе каждый игрок может убрать одну, две, три или четыре спички. Побеждает тот, кто забрал последнюю спичку.
a) Предположим, осталось шесть спичек и пришла очередь Барни ходить. Какой ход он должен сделать, чтобы обеспечить себе победу? Объясните логику своих рассуждений.
b) Допустим, осталось 12 спичек и настала очередь Барни ходить. Какой ход он должен сделать, чтобы обеспечить себе победу? (Совет: используйте свой ответ в пункте a и примените метод обратных рассуждений.)
c) Теперь начните с исходной точки игры. Если оба игрока выберут оптимальный способ ее ведения, то кто из них победит?
d) Какие оптимальные стратегии (исчерпывающие планы действий) есть в распоряжении каждого игрока?
S6. Проанализируем игру из предыдущего упражнения. Предположим, игроки достигли того момента, когда следующим ходить должен Фред, а спичек осталось всего пять.
a) Нарисуйте дерево этой игры, начиная с пяти спичек.
b) Найдите для нее равновесие обратных рассуждений, начиная с пяти спичек.
c) Можно ли сказать, что в этой игре с пятью спичками существует преимущество первого или второго хода?
d) Объясните, почему вы нашли более одного равновесия обратных рассуждений. Как ваш ответ связан с оптимальными стратегиями, которые вы определили в пункте с предыдущего упражнения?
S7. Элрой и Джуди играют в игру, которую Элрой называет «гонка до 100». Элрой ходит первым, и игроки по очереди выбирают числа от одного до девяти, на каждом ходе прибавляя новое число к промежуточной сумме. Победителем становится тот, кто увеличит промежуточную сумму ровно до 100.
a) Если оба игрока ведут игру оптимальным способом, то кто из них выиграет? Есть ли преимущество первого хода в этой игре? Объясните логику своих рассуждений.
b) Каковы оптимальные стратегии (исчерпывающие планы действий) для каждого игрока?
S8. В римском Колизее только что бросили раба на съедение львам. Три льва посажены на цепь в ряд, причем льву 1 до раба ближе всего. Длина цепи каждого льва такова, что он может дотянуться лишь до двух находящихся рядом с ним игроков.
Игра проходит следующим образом. Сначала лев 1 решает, съесть ли ему раба. Если он съедает, тогда лев 2 решает, съесть ли ему льва 1 (который стал слишком тяжелым, чтобы защищаться). Если лев 1 не съедает раба, тогда у льва 2 не остается выбора: бесполезно пытаться съесть льва 1, поскольку в драке погибнут они оба. Точно так же, если лев 2 съедает льва 1, то лев 3 решает, съесть ли ему льва 2.
Предпочтения каждого льва вполне естественны: лучший исход игры (4) — кого-то съесть и остаться в живых; следующий приемлемый исход (3) — выжить, но остаться голодным; следующий исход (2) — съесть кого-то и быть съеденным; худший исход (1) — остаться голодным и быть съеденным.
a) Нарисуйте дерево этой игры с выигрышами для трех участников.
b) Какое равновесие обратных рассуждений имеет место в этой игре? Обязательно опишите стратегии, а не только выигрыши.
c) Есть ли в этой игре преимущество первого хода? Объясните, почему есть или почему нет.
d) Сколько полных стратегий у каждого льва? Перечислите их.
S9. Три крупных универмага (Big Giant, Titan и Frieda’s) планируют открыть филиал в одном из двух новых торговых центров в районе Бостона. Торговый центр Urban Mall не очень большой и может вместить максимум два универмага в качестве «якорей», но зато он расположен рядом с крупным богатым населенным пунктом. Торговый центр Rural Mall находится дальше, в сельской сравнительно бедной местности и может вместить три якорных магазина. Ни один из трех универмагов не хочет открывать филиалы в обоих торговых центрах, потому что их сегменты покупателей частично пересекаются, а значит, размещение филиалов в обоих торговых центрах будет означать конкуренцию с самим собой. Каждый универмаг склонен работать в торговом центре вместе с одним или несколькими универмагами, а не в одиночку, поскольку такой торговый центр привлекает намного больше покупателей, что увеличивает прибыль каждого магазина. Кроме того, каждый универмаг предпочитает Urban Mall из-за более богатого контингента покупателей. Каждый универмаг должен выбрать между попыткой получить торговую площадь в Urban Mall (зная, что в случае неудачи можно попробовать побороться за место в Rural Mall) и ее получением в Rural Mall сразу же (даже не пробуя попасть в Urban Mall).
В данном случае универмаги так ранжируют пять возможных исходов этой игры: 5 (лучший исход) — в торговом центре Urban Mall вместе с другим универмагом; 4 — в торговом центре Rural Mall вместе с еще одним или двумя универмагами; 3 — один в Urban Mall; 2 — один в Rural Mall; 1 (худший исход) — один в Rural Mall после неудачной борьбы за место в Urban Mall, тогда как другие магазины уже получили лучшие якорные места в Urban Mall.
Поскольку в этих трех магазинах различные системы управления, они с разной скоростью готовят необходимые документы для получения торговой площади в новом торговом центре. В Frieda’s с этим справляются быстрее всех, затем следует Big Giant и наконец Titan, в котором процесс подготовки плана размещения филиала наименее эффективен. После подачи ими заявок на предоставление торговой площади торговый центр решает, какие универмаги выбрать. Учитывая узнаваемость названий Big Giant и Titan среди потенциальных покупателей, торговый центр выберет либо одного из них, либо обоих, прежде чем рассматривать запрос Frieda’s. Следовательно, Frieda’s не получит одну из торговых площадей в Urban Mall, если все три универмага подадут на них заявки; так будет даже в случае, если Frieda’s первым сделает свой ход.
a) Нарисуйте дерево этой игры с размещением универмагов в торговом центре.
b) Проиллюстрируйте процесс отсечения ветвей на дереве в ходе обратных рассуждений и используйте усеченное дерево для поиска равновесия обратных рассуждений. Опишите это равновесие с помощью (полных) стратегий, применяемых всеми универмагами. Какими окажутся выигрыши каждого универмага в случае исхода, полученного в результате равновесия обратных рассуждений?
S10 (дополнительное упражнение). Рассмотрим следующую ультимативную игру с переговорами, которая изучалась в ходе лабораторных экспериментов. Игрок, делающий предложение, ходит первым и предлагает разделить сумму в 10 долларов между собой и вторым игроком. Принцип дележа может быть любым. Например, игрок может оставить себе все 10 долларов, или взять себе 9 долларов и отдать 1 доллар оппоненту, или 8 долларов себе и 2 доллара другому игроку и т. д. (Обратите внимание, что в этом случае у предлагающего игрока одиннадцать возможных вариантов выбора.) Второй игрок, получив предложение о разделении общей суммы, может либо принять, либо отвергнуть его. Если он его примет, оба игрока получат предложенную сумму. Если отвергнет, оба не получат ничего.
a) Постройте дерево этой игры.
b) Сколько полных стратегий находится в распоряжении каждого игрока?
c) В чем состоит равновесие обратных рассуждений в этой игре при условии, что игроков интересует исключительно денежный выигрыш?
d) Предположим, второй игрок, Рейчел, примет любое предложение в 3 (или больше) доллара и отклонит любое предложение в 2 (или меньше) доллара. Допустим, предлагающий игрок, Пит, знает о стратегии Рейчел и хочет получить максимальный денежный выигрыш. Какую стратегию он применит?
e) Истинный выигрыш Рейчел (ее «полезность») может не совпадать с денежным выигрышем. Какие еще аспекты игры могут представлять для нее интерес? С учетом вашего ответа составьте набор выигрышей Рейчел, который бы сделал ее стратегию оптимальной.
f) В ходе лабораторных экспериментов игроки, как правило, не придерживаются равновесия обратных рассуждений. Игроки, делающие предложение, обычно предлагают соперникам сумму от 2 до 5 долларов. А те часто отклоняют предложения 3, 2 и особенно 1 доллар. Объясните, почему, по вашему мнению, происходит именно так.
Упражнения без решений
U1. «В игре с последовательными ходами игрок, делающий ход первым, непременно выиграет». Это утверждение истинно или ложно? Обоснуйте свой ответ посредством нескольких кратких предложений и приведите пример, иллюстрирующий его.
U2. Сколько стратегий (исчерпывающих планов действий) в каждой из представленных ниже игр имеется в распоряжении каждого игрока? Перечислите все чистые стратегии каждого игрока.
U3. Определите для каждой из игр, представленных в упражнении U2, исход, полученный посредством равновесия обратных рассуждений, и полную равновесную стратегию каждого игрока.
U4. В Вашингтоне проходят дебаты по предложениям А и Б. Конгресс предпочитает предложение А, тогда как президент — предложение Б. Эти предложения не взаимоисключающие: оба могут стать законами или быть отклонены. Таким образом, существует четыре возможных исхода, имеющих следующий рейтинг (более высокий показатель означает более предпочтительный исход).
a) Ходы в этой игре выполняются по следующей схеме. Сначала Конгресс решает, принимать ли законопроект и должен ли он включать в себя предложение А, или Б, или оба. Затем президент решает, подписать ли законопроект или наложить на него вето. У Конгресса нет достаточного количества голосов для преодоления вето. Нарисуйте дерево этой игры и найдите равновесие обратных рассуждений.
b) Предположим, правила игры изменились: президент получает право постатейного вето. Таким образом, если Конгресс примет законопроект, содержащий оба предложения, президент может не только выбирать, подписать его или наложить вето, но и накладывать вето лишь на одно из предложений. Постройте новое дерево игры и найдите равновесие обратных рассуждений.
c) Объясните на интуитивном уровне, в чем разница между этими двумя равновесиями.
U5. Два игрока, Эми и Бет, играют в игру, в которой разыгрывается банка с сотней монет номиналом 1 цент. Игроки делают ходы по очереди; Эми ходит первой. Каждый раз, когда наступает очередь одной из участниц ходить, она берет из банки от 1 до 10 центов. Побеждает тот, после чьего хода банка опустеет.
a) Если игроки ведут игру оптимальным способом, то кто из них выиграет? Есть ли в этой игре преимущество первого хода? Объясните логику своих рассуждений.
b) Какие оптимальные стратегии (исчерпывающие планы действий) имеются в распоряжении каждого игрока?
U6. Рассмотрим несколько измененный вариант игры, представленной в упражнении U5. Теперь игрок, опустошивший банку, проигрывает.
a) Присутствует ли преимущество первого хода в этой игре?
b) Какие оптимальные стратегии есть в распоряжении каждого игрока?
U7. Кермит и Фоззи играют в игру с двумя банками, в каждой из которых находится по 100 одноцентовых монет. Игроки делают ходы по очереди; Кермит ходит первым. Всякий раз, когда наступает очередь игрока ходить, он берет из одной из банок от 1 до 10 центов. Побеждает тот, после чьего хода обе банки опустеют. (Обратите внимание, что, когда игрок достает оставшиеся монеты из второй банки, первая банка уже должна быть пустой в результате предыдущего хода кого-то из игроков.)
a) В этой игре имеет место преимущество первого или второго хода? Объясните, кто из игроков может обеспечить себе победу и каким образом. (Совет: упростите игру, начав с меньшего количества монет в каждой банке, и попытайтесь понять, применимы ли сделанные выводы в реальной игре.)
b) Какие оптимальные стратегии есть в распоряжении каждого игрока? (Совет: сначала проанализируйте исходную ситуацию, в которой в обеих банках одинаковое количество монет, затем когда их количество от 1 до 10 центов и наконец когда число монет свыше 10 центов.)
U8. Измените таким образом, чтобы в нем было четыре льва.
a) Постройте дерево игры с выигрышами для этих четырех участников.
b) Какое равновесие обратных рассуждений имеет в ней место? Обязательно опишите стратегии, а не только выигрыши.
c) Дополнительный лев — это хорошо или плохо для раба? Обоснуйте свой ответ.
U9. Для того чтобы предоставить маме один день отдыха, отец планирует устроить своим детям, Барту и Кэсси, воскресную экскурсию. Барт предпочитает поход в парк развлечений (Р), а Кэсси — в музей науки (Н). Каждый ребенок получит 3 единицы полезности за более предпочтительное занятие и только 2 единицы — за менее предпочтительное. Отец — 2 единицы полезности за любое из занятий.
Чтобы определиться с планами на воскресенье, отец намерен сначала спросить Барта о его предпочтениях, а затем Кэсси, после того как она узнает, что выбрал Барт. Каждый ребенок может выбрать либо парк развлечений (Р), либо музей науки (Н). Если оба остановятся на одном и том же, то именно туда все и пойдут. Если возникнут разногласия, тогда отец примет окончательное решение. У него как у отца есть дополнительный вариант действий: он может предложить парк развлечений, музей науки или поход в горы, причем за поход получит 3 единицы полезности, а Барт и Кэсси по 1.
Поскольку отец хочет, чтобы его дети не конфликтовали, он получит 2 дополнительные единицы полезности, если дети выберут одно и то же занятие (не имеет значения, какое именно).
a) Постройте дерево с выигрышами для этой игры с тремя участниками.
b) Какое равновесие обратных рассуждений имеет в ней место? Обязательно опишите стратегии, а не только выигрыши.
c) Сколько разных полных стратегий находится в распоряжении Барта? Обоснуйте свой ответ.
d) Сколько разных полных стратегий у Кэсси? Обоснуйте ответ.
U10 (дополнительное, более трудное упражнение). Рассмотрим дерево игры Survivor, представленное на . Мы могли не угадать точные значения, которые Рик присвоил вероятностям различных исходов, поэтому давайте обобщим это дерево, проанализировав другие возможные значения. В частности, предположим, что вероятность победы в испытании на получение иммунитета в случае, если Рик выберет вариант «продолжить», составляет x для Рика, y для Келли и 1 — x — y для Руди; точно так же вероятность победы в случае отказа Рика от дальнейшей борьбы равна z для Келли и 1 — z для Руди. Далее допустим, что шанс Рика на то, что его выберет жюри, составляет p, если он выиграет испытание на получение иммунитета и проголосует за изгнание Руди с острова, и q, если Келли выиграет испытание и проголосует за изгнание Руди с острова. Предположим также, что, если Руди выиграет испытание на получение иммунитета, он поддержит Рика с вероятностью 1 и станет победителем в игре с вероятностью 1, если войдет в число двух финалистов. Обратите внимание, что в примере, отображенном на , были такие значения: x = 0,45, y = 0,5, z = 0,9, р = 0,4 и q = 0,6. (В общем случае переменные p и q необязательно должны в сумме составлять 1, хотя именно так получилось на .)
a) Найдите алгебраическую формулу, выраженную через x, y, z, p, q, для определения вероятности того, что Рик выиграет миллион долларов, если выберет вариант «продолжить». (Обратите внимание: формула может включать в себя не все переменные.)
b) Найдите аналогичную алгебраическую формулу для определения вероятности того, что Рик выиграет миллион долларов, если выберет вариант «прекратить». (Опять же, формула может не включать в себя все переменные.)
c) Используйте эти результаты для поиска алгебраического неравенства, указывающего, при каких обстоятельствах Рику следует выбрать вариант «прекратить».
d) Предположим, значения всех переменных те же, что и на , кроме z. Насколько высоким или низким может быть значение z, чтобы Рик по-прежнему предпочел вариант «прекратить»? Объясните на интуитивном уровне, почему при некоторых значениях z Рику лучше выбрать вариант «продолжить».
e) Допустим, значения всех переменных те же, что и на , за исключением p и q. Предположим также, что, поскольку жюри с большей вероятностью выберет того, кто не станет голосовать против Руди, значения p и q должны удовлетворять условию p > 0,5 > q. При каких значениях коэффициента p/q Рику следует выбрать вариант «прекратить»? Объясните на интуитивном уровне, почему при некоторых значениях p и q для Рика предпочтительнее вариант «продолжить».
Глава 4. Игры с одновременными ходами: дискретные стратегии
* * *
Игрой с одновременными ходами, как пояснялось в , считается игра, в которой игроки делают ходы, не зная о выборе соперников. Очевидно, что такая ситуация складывается в случае, когда игроки действуют одновременно, а также когда они выбирают действия обособленно, не располагая информацией о действиях других игроков, даже если этот выбор делается в разное время. (Именно поэтому в играх с одновременными ходами имеет место несовершенная информация в том смысле, о котором мы говорили в .) Эта глава посвящена играм, в которых присутствует только одновременное взаимодействие между игроками. Мы рассмотрим различные типы игр с одновременными ходами, опишем концепцию их решения под названием «равновесие Нэша» и проанализируем игры без, с одним и несколькими равновесиями.
К категории игр с одновременными ходами можно отнести многие из знакомых вам стратегических ситуаций. Различные производители телевизоров, стереосистем или автомобилей принимают решения о дизайне и свойствах продукта, не зная о контраргументах конкурентов. Избиратели на выборах одновременно отдают свои голоса, не зная о предпочтениях других избирателей. В футболе взаимодействие между вратарем и нападающим противника во время пенальти требует одновременного решения обоих: вратарь не может себе позволить ждать удара по мячу, чтобы определить его траекторию, поскольку тогда уже будет слишком поздно.
Очевидно, что при выборе действия участник игры с одновременными ходами не располагает информацией о решениях других игроков. Кроме того, он не может предвидеть их реакцию на его выбор, так как они тоже действуют вслепую по отношению к нему. Поэтому каждый игрок должен анализировать предполагаемые шаги соперников, а те, в свою очередь, проводить аналогичный встречный анализ. Такая цикличность несколько усложняет анализ игр с одновременными ходами по сравнению с анализом игр с последовательными ходами, но выполнить его не так уж трудно. В этой главе мы сформулируем для этих игр простую концепцию равновесия, обладающую значительной пояснительной и прогностической способностью.
1. Описание игр с одновременными ходами и дискретными стратегиями
В и мы неоднократно подчеркивали, что стратегия — это исчерпывающий план действий. Однако в чистых играх с одновременными ходами у каждого участника есть максимум одна возможность действовать (хотя такое действие может состоять из множества компонентов), поскольку если бы их было несколько, это был бы уже элемент игры с последовательными ходами. Стало быть, в играх с одновременными ходами нет никаких реальных различий между стратегией и действием, поэтому в данном контексте эти термины часто используются как синонимы. Существует только одна сложность. Стратегия может представлять собой вероятностный выбор из первоначально оговоренных базовых действий. Например, в спорте игрок или команда могут умышленно выбирать действия в случайном порядке, чтобы соперник был вынужден угадывать. Такие вероятностные стратегии называются смешанными и рассматриваются в . Сейчас же мы ограничимся анализом базовых, первоначально оговоренных действий, обозначаемых термином чистые стратегии.
Во многих играх у каждого игрока есть конечное количество дискретных чистых стратегий, например дриблинг, пас и бросок в баскетболе, тогда как в ряде других игр чистая стратегия игрока может представлять собой любое число из непрерывного диапазона значений, скажем цену, назначаемую компанией на свой продукт. Это различие никак не влияет на общую концепцию равновесия в играх с одновременными ходами, но связанные с такими играми идеи легче формулировать с помощью дискретных стратегий; решение игр с непрерывными стратегиями требует несколько более продвинутых инструментов. Поэтому в данной главе мы ограничимся анализом более простых чистых дискретных стратегий, а стратегии с непрерывными переменными рассмотрим в .
Игры с одновременными ходами и дискретными стратегиями чаще всего описывают с помощью таблицы игры (синонимы: матрица игры или таблица выигрышей), которая называется нормальной или стратегической формой игры. Таблица игры позволяет проиллюстрировать игру с любым количеством участников, однако ее размерность должна соответствовать их числу. В случае игры с двумя участниками таблица имеет два измерения, а заголовки строк и столбцов в ней — это стратегии, находящиеся в распоряжении первого и второго игроков. Следовательно, размер таблицы зависит от количества доступных игрокам стратегий. В ячейках указываются выигрыши, которые получат игроки при подобающей конфигурации стратегий. Игры с тремя участниками требуют трехмерной таблицы; ее мы рассмотрим далее в этой главе.
Концепция таблицы выигрышей для простой игры приведена на рис. 4.1. Представленная на нем игра не имеет специальной интерпретации, поэтому мы можем сформулировать концепции, не отвлекаясь на ее «историю». Имена участников игры — Строка и Столбец. В распоряжении Строки находится четыре варианта выбора (стратегий или действий), обозначенных как «вверху», «высоко», «низко», «внизу», а Столбца — три варианта: «слева», «посредине» и «справа». Каждый выбор Строки и Столбца определяет возможный исход игры. Выигрыши, связанные с каждым исходом игры, показаны в ячейке, соответствующей данной строке и данному столбцу. Принято считать, что из двух чисел, отображающих выигрыши, первое число отвечает выигрышу Строки, а второе — выигрышу Столбца. Например, если Строка выберет вариант «высоко», а Столбец — «справа», выигрыши составят 6 в случае Строки и 4 в случае Столбца. Для дополнительного удобства мы выделяем все, что касается Строки (имя игрока, его стратегии и выигрыши), черным цветом, а Столбца — серым.
Рис. 4.1. Представление игры с одновременными ходами в виде таблицы
Далее рассмотрим второй пример игры с более содержательной историей. На рис. 4.2 представлена упрощенная версия одного розыгрыша в американском футболе. Нападающие пытаются продвинуть мяч вперед, чтобы повысить шансы забить филд-гол. У них есть четыре возможные стратегии: пробежка и три паса разной длины (короткий, средний и длинный). Чтобы сдерживать атаку, защитники могут использовать одну из трех стратегий: защита в случае пробежки и в случае паса и блиц против квотербека. Нападающие пытаются набрать как можно больше ярдов, тогда как защитники — помешать им это сделать. Предположим, у нас достаточно информации об основных сильных сторонах тех и других, для того чтобы оценить вероятность завершения различных розыгрышей и определить среднее количество набранных ярдов, которого можно было бы ожидать при каждой комбинации стратегий. Например, когда команда нападения выбирает стратегию «средний пас», а команда защиты отвечает стратегией «защита в случае паса», по нашим оценкам, выигрыш нападения составляет 4,5 набранных ярда, или +4,5. «Выигрыш» защиты — 4,5 потерянных ярда, или −4,5. В других ячейках также показаны наши оценки количества ярдов, набранных или потерянных каждой командой.
Рис. 4.2. Один розыгрыш в американском футболе
Обратите внимание, что сумма выигрышей в каждой ячейке таблицы равна 0: когда нападающие набирают 5 ярдов, защитники теряют 5 ярдов, и наоборот: когда нападающие теряют 2 ярда, защитники набирают 2 ярда. Такая схема достаточно широко распространена в спорте, где интересы двух сторон прямо противоположны друг другу. Как отмечалось в , мы называем это игрой с нулевой (или иногда с постоянной) суммой. Вы должны помнить, что, согласно определению, игра с нулевой суммой представляет собой игру, в которой сумма выигрышей во всех ячейках постоянная величина, будь то 0, 6 или 1000. (В описывается игра, в которой сумма выигрышей двух игроков составляет 100.) Основная особенность игры с нулевой суммой состоит в том, что проигрыш одного игрока равен выигрышу другого.
2. Равновесие Нэша
Для анализа игр с одновременными ходами необходимо рассмотреть, как игроки выбирают действия. Вернемся к игре, представленной на . Обратите внимание на тот ее исход, при котором Строка выбирает вариант «низко», а Столбец — «посредине», с выигрышами 5 для Строки и 4 для Столбца. Каждый игрок отдает предпочтение действию, которое обеспечит ему более высокий выигрыш, и при данном исходе делает такой выбор с учетом выбора соперника. Если Строка выбирает вариант «низко», может ли Столбец получить более высокий выигрыш, выбрав что-то другое, а не «посредине»? Нет, поскольку вариант «слева» обеспечивает ему выигрыш 2, а вариант «справа» — выигрыш 3 и оба не превышают выигрыш 4 в случае варианта «посредине». Стало быть, стратегия «посредине» — наилучший ответ Столбца на стратегию «низко», реализуемую Строкой. С другой стороны, если Столбец остановится на варианте «посредине», получит ли Строка более высокий выигрыш, предпочтя варианту «низко» какой-нибудь иной? И снова нет, потому что выигрыши от выбора варианта «вверху» (2), «высоко» (3) или «внизу» (4) не будут больше выигрыша Строки в случае выбора варианта «низко» (5). Следовательно, «низко» — наилучший ответ Строки на стратегию «посредине», применяемую Столбцом.
Эти два варианта выбора, «низко» для Строки и «посредине» для Столбца, представляют собой наилучший ответ игрока, сделавшего соответствующий выбор, на действие другого игрока. После такого выбора оба игрока не захотели бы по собственной инициативе переключаться на что-либо другое. Согласно определению некооперативной игры, игроки делают выбор независимо друг от друга; следовательно, такие односторонние изменения — все, что может предпринять каждый игрок. Но поскольку ни один из них к ним не склонен, было бы естественно называть данное положение вещей равновесием. В этом и состоит суть концепции равновесия Нэша.
Согласно несколько более формальной формулировке, равновесие Нэша в игре представляет собой перечень стратегий (по одной на каждого участника), при котором ни один игрок не может увеличить выигрыш, выбрав другую стратегию из имеющихся в его распоряжении, если другие игроки придерживаются стратегий, оговоренных в этом перечне.
А. Дальнейшее разъяснение концепции равновесия Нэша
Для того чтобы лучше понять концепцию равновесия Нэша, давайте еще раз проанализируем игру на . Возьмем какую-либо другую ячейку вместо ячеек «низко», «посредине», например ячейку, в которой Строка выбирает вариант «высоко», а Столбец — «слева». Может ли это сочетание стратегий быть равновесием Нэша? Нет, потому что, если Столбец применит стратегию «слева», Строка при выборе стратегии «внизу» вместо «высоко», которая обеспечивает выигрыш 4, получит более высокий выигрыш 5. Точно так же сочетание стратегий «внизу», «слева» не будет равновесием Нэша, поскольку Столбец может извлечь больше выгоды, перейдя на стратегию «справа» и тем самым увеличив свой выигрыш с 6 до 7.
Определение равновесия Нэша не требует, чтобы равновесные варианты выбора обязательно были лучше всех имеющихся вариантов. На рис. 4.3 отображена та же ситуация, что и на , за одним исключением: выигрыш Строки от стратегий «внизу», «посредине» изменился на 5, то есть стал таким же, как и для стратегий «низко», «посредине». По-прежнему верно то, что при выборе Столбцом варианта «посредине» Строка не может добиться большего, чем в случае выбора варианта «низко». Следовательно, ни у одного игрока нет оснований для изменения действия в результате исхода «низко», «посредине», что позволяет квалифицировать данный исход как равновесие Нэша.
Рис. 4.3. Вариант игры, представленной на рис. 4.1 , с равными выигрышами
Однако важно учесть, что равновесие Нэша не всегда оптимально для обоих игроков. На пара стратегий «внизу», «справа» обеспечивает выигрыши 9, 7, которые лучше для обоих игроков, чем выигрыши 5, 4 при равновесии Нэша. Тем не менее, играя независимо друг от друга, игроки не смогут придерживаться именно этих стратегий. Если Столбец предпочтет вариант «справа», Строка может захотеть заменить вариант «внизу» на «низко» и выиграть 12 вместо 9. Получение выигрышей 9, 7 потребует кооперативного действия, которое сделало бы такой «обман» невозможным. Мы рассмотрим данный тип поведения чуть ниже (и более подробно в ), а пока просто хотим указать на тот факт, что равновесие Нэша может не соответствовать общим интересам игроков.
Чтобы закрепить понимание концепции равновесия Нэша, давайте еще раз посмотрим на , отображающий игру в американский футбол. Если защита выберет стратегию «защита в случае паса», то лучший вариант для нападающих — «короткий пас» (выигрыш 5,6 против 5, 4,5 или 3). И наоборот, если команда нападения предпочтет вариант «короткий пас», то лучший вариант для защиты — «защита в случае паса», которая позволит команде нападения набрать всего 5,6 ярда, тогда как при выборе вариантов «защита в случае пробежки» и «блиц» команда защиты уступила бы 6 и 10,5 ярда соответственно. (Не забывайте, что записи в каждой ячейке таблицы игры с нулевой суммой — это выигрыши игрока под именем Строка, поэтому самый лучший вариант выбора для Столбца — тот, который обеспечивает самый низкий, а не самый высокий показатель.) В данной игре сочетание стратегий «короткий пас», «защита в случае паса» — это равновесие Нэша, а полученный выигрыш команды нападения составляет 5,6 ярда.
Как вычислить равновесие Нэша в играх? Для этого можно проверить каждую ячейку на наличие стратегий, удовлетворяющих равновесию Нэша. Такой систематический анализ надежен, но утомителен, за исключением случаев, когда он выполняется в контексте простых игр или с помощью хорошей компьютерной программы. К счастью, существуют и другие методы, применимые к особым типам игр, которые позволяют не только быстро отыскать равновесие Нэша, но и лучше понять процесс размышлений, посредством которого формируются убеждения, а затем и выбор. Мы проанализируем эти методы в следующих разделах.
Б. Равновесие Нэша как система убеждений и выбор вариантов
Прежде чем приступать к дальнейшему изучению и применению концепции равновесия Нэша, попробуем прояснить то, что, возможно, тревожит некоторых из вас. Мы сказали, что в равновесии Нэша каждый игрок выбирает свой лучший ответ на выбор другого игрока. Но выбор делается одновременно. Тогда как игрок может реагировать на то, что еще не произошло, или по крайней мере не зная, что именно произошло?
Люди постоянно играют в игры с одновременными ходами и делают свой выбор. Для этого им необходимо найти замену фактическим знаниям или наблюдениям за действиями других игроков. Игроки могут делать слепые догадки и рассчитывать на то, что они окажутся ниспосланными свыше, но, к счастью, существуют более эффективные способы выяснить, что предпринимают другие. Один из них — опыт и наблюдение: если игроки постоянно играют в данную игру или аналогичные игры с подобными игроками, у них может сформироваться неплохое представление об их предпочтениях. В этом случае не самые лучшие варианты выбора вряд ли продержатся долго. Еще один способ — логический процесс мышления через размышления других игроков. Вы ставите себя на их место и размышляете о том, о чем они думают; разумеется, они тоже ставят себя на ваше место и размышляют о том, что думаете вы. На первый взгляд такая логика кажется циклической, однако есть несколько способов вмешаться в этот цикл, и мы покажем их на конкретных примерах в следующих разделах. Равновесие Нэша можно считать кульминацией такого процесса размышлений, в ходе которого каждый игрок правильно определил выбор других игроков.
Посредством наблюдения, или логической дедукции, или какого-либо иного подхода вы как участник игры формируете некоторое представление о выборе участников игр с одновременными ходами. Найти слова для описания этого процесса или его результатов не так уж легко. Речь идет не о предвидении и не о прогнозировании, поскольку действия других игроков выполняются одновременно с вашими и не относятся к будущему. Специалисты по теории игр чаще всего используют термин убеждение. Он не идеален для обозначения происходящего, поскольку вызывает смысловые ассоциации с уверенностью или определенностью в большей степени, чем следовало бы (в мы допустим возможность того, что убеждения могут быть сопряжены с некоторой неопределенностью), однако ввиду отсутствия более подходящего обозначения нам придется им довольствоваться.
Концепция убеждения соотносится также с описанием неопределенности, представленным в , где мы ввели понятие стратегической неопределенности. Даже в случаях, когда все правила игры (стратегии, имеющиеся в распоряжении игроков, и выигрыши каждого игрока как функция стратегий всех игроков) известны и не подвержены влиянию внешних факторов неопределенности, таких как погода, каждый игрок может испытывать неопределенность относительно действий, предпринимаемых одновременно с ним другими игроками. Точно так же, если прошлые действия не поддаются наблюдению, каждый игрок может испытывать неопределенность по поводу действий других игроков в прошлом. Как же игрокам делать выбор в условиях такой стратегической неопределенности? Они должны составить субъективное мнение или оценку действий других игроков, что, собственно, и позволяет осуществить концепция убеждения.
А теперь представьте себе равновесие Нэша в таком контексте. Мы определили его как конфигурацию стратегий, при которой стратегия каждого игрока представляет собой лучший ответ на стратегии других игроков. Если игрок не располагает информацией о фактическом выборе остальных участников игры, но имеет о нем определенные убеждения, в равновесии Нэша они должны быть правильными: фактические действия других игроков должны соответствовать вашим убеждениям. Следовательно, мы можем дать альтернативное и эквивалентное определение: равновесие Нэша — это такая совокупность стратегий (по одной на каждого игрока), при которой 1) у каждого игрока есть правильные убеждения о стратегиях других игроков; 2) стратегия каждого игрока — лучшая для него самого с учетом его убеждений относительно стратегий других игроков.
Данный подход к оценке равновесия Нэша имеет два преимущества. Во-первых, концепция лучшего ответа больше не содержит логического противоречия. Каждый игрок выбирает свой лучший ответ не на не поддающиеся наблюдению действия других игроков, а на собственные уже сформировавшиеся убеждения в отношении их действий. Во-вторых, как сказано в , где мы допускаем смешанные стратегии, случайность в стратегии одного игрока можно интерпретировать как неопределенность убеждений других игроков в отношении его действий. В этой главе мы будем параллельно использовать обе интерпретации равновесия Нэша.
На первый взгляд может показаться, что формирование правильных убеждений и вычисление лучших ответов — слишком сложная задача для обычного человека. Мы обсудим некоторые критические замечания такого рода, а также эмпирические и экспериментальные данные о равновесии Нэша в в контексте чистых стратегий и в в контексте смешанных стратегий. А пока просто напомним, что практика — критерий истины. Мы сформулируем и проиллюстрируем концепцию Нэша на примере ее применения и надеемся, что так вы лучше поймете ее достоинства и недостатки, чем в ходе абстрактного обсуждения этой темы.
3. Доминирование
Существует категория игр, в которых одна стратегия неизменно оказывается лучше или хуже другой. В таких случаях применяется один способ, позволяющий упростить поиск равновесия Нэша и его интерпретацию.
Эту концепцию отлично иллюстрирует известная игра под названием «дилемма заключенных». Рассмотрим сюжет, регулярно используемый в телесериале Law and Order («Закон и порядок»). Предположим, мужа и жену арестовали по подозрению в преступном сговоре в целях убийства молодой женщины. Детективы Грин и Лупо размещают их в разных камерах предварительного заключения и допрашивают по отдельности. Реальных улик, связывающих эту пару с убийством, очень мало, хотя есть доказательства того, что они причастны к похищению жертвы. Детективы объясняют каждому подозреваемому, что им обоим грозит тюремное заключение за похищение сроком до 3 лет, даже если ни один из них не признается. Кроме того, мужу и жене по отдельности внушают, что детективам «известны» подробности произошедшего и что один из них участвовал в совершении преступления по принуждению второго. При этом подразумевается, что тюремный срок одного признавшегося будет существенно сокращен, если все подробно изложить на бумаге. (Во многих фильмах такого рода в этот момент на стол обычно кладут стандартный блокнот с отрывными страницами из желтой линованной бумаги и карандаш.) И наконец, супругов убеждают, что, если они оба признают свою вину, можно будет говорить о снижении их тюремных сроков, но не настолько, как в случае, если бы один из них сознался, а другой отрицал свою вину.
В такой ситуации муж и жена — два участника игры с одновременными ходами, в которой каждый игрок должен сделать выбор: сознаваться в убийстве или нет. Оба знают, что в случае отказа признать свою вину каждому из них светит 3 года тюрьмы за причастность к похищению. Подозреваемые также знают, что если один из них сознается, то получит всего 1 год благодаря сотрудничеству с полицией, тогда как другой отправится в тюрьму минимум на 25 лет. Если сознаются оба, у них будет возможность договориться о сокращении тюремного срока до 10 лет для каждого.
Варианты выбора и исходы этой игры представлены в таблице игры на рис. 4.4. Стратегии «признать вину» и «отрицать вину» можно также обозначить как «отказ от сотрудничества» и «сотрудничество», поскольку это отображает роли двух игроков в отношениях между ними. Таким образом, стратегия «отказ от сотрудничества» означает нарушение любой молчаливой договоренности с супругом (супругой), а стратегия «сотрудничество» — совершение действия, которое поможет супругу (супруге), а не сотрудничество с полицейскими.
Рис. 4.4. Дилемма заключенных
Здесь выигрыши — это длительность тюремного заключения в случае каждого исхода игры, поэтому более низкие значения лучше для каждого игрока. Этим данный пример отличается от большинства анализируемых нами игр, в которых более высокий выигрыш — это хорошо, а не плохо. Так что хотим вас предупредить, что больше — не всегда лучше. Когда значения выигрышей отражают рейтинг исходов игры, лучшая альтернатива часто обозначается 1, а последовательно увеличивающиеся числа соответствуют следующим худшим альтернативам. Кроме того, в таблице игры с нулевой суммой, в которой показаны только выигрыши одного игрока, построенные по принципу «чем больше, тем лучше», меньшие числа для другого игрока будут лучше. В представленной здесь дилемме заключенных меньшие числа лучше для обоих игроков. Следовательно, если вам когда-либо придется составлять таблицу выигрышей, где большие числа — это плохо, вы должны четко предупредить об этом читателя, но и сами, если будете читать составленные кем-то примеры, не забывайте о данном нюансе.
Теперь рассмотрим игру с дилеммой заключенных на с точки зрения мужа. Он должен подумать, что предпочтет жена. Предположим, он убежден, что она сознается. Тогда его лучший выбор — тоже сознаться, поскольку так он получит 10 лет тюрьмы вместо 25 лет в случае отрицания вины. А если муж полагает, что жена не признается? Опять же, его лучший выбор — сознаться, так как это гарантирует ему всего год заключения вместо трех, которые бы ему обеспечило отрицание вины. Таким образом, в данной игре стратегия «признать вину» для мужа лучше стратегии «отрицать вину» независимо от его убеждений в отношении выбора жены. Будем говорить, что с точки зрения мужа «признать вину» — это доминирующая стратегия, а «отрицать вину» — доминируемая стратегия. Точно так же мы могли бы сказать, что стратегия «признать вину» доминирует над стратегией «отрицать вину» или что стратегия «отрицать вину» доминируется стратегией «признать вину».
Если то или иное действие явно лучшее для игрока независимо от действий других игроков, есть веские основания полагать, что рациональный игрок выберет именно его. Если то или иное действие явно худшее для игрока независимо от действий других игроков, есть не менее серьезные основания считать, что рациональный игрок будет его избегать. Следовательно, доминирование (когда оно существует) образует убедительную основу для теории решений игр с одновременными ходами.
А. Наличие доминирующих стратегий у обоих игроков
В представленной выше дилемме заключенных доминирование должно привести мужа к выбору стратегии «признать вину». Аналогичная логика применима и к выбору жены. Ее стратегия «признать вину» также доминирует над стратегией «отрицать вину», поэтому жена тоже решит сознаться. Следовательно, сочетание стратегий («признать вину», «признать вину») и есть прогнозируемый исход данной игры. Обратите внимание, что это равновесие Нэша. (На самом деле это единственное равновесие Нэша в данной игре.) Каждый игрок выбирает свою оптимальную стратегию.
В нашей игре лучший выбор каждого игрока не зависит от правильности его убеждений в отношении другого игрока (в этом и есть смысл доминирования), однако каждый игрок приписывает другому такую же рациональность, которую демонстрирует сам, поэтому оба должны быть в состоянии сформировать правильные убеждения. А фактическое действие каждого игрока будет наилучшим ответом на фактическое действие другого игрока. Обратите внимание, что факт доминирования стратегии «признать вину» над стратегией «отрицать вину» в случае обоих игроков совершенно не зависит от того, действительно ли они виновны, как во многих эпизодах телесериала «Закон и порядок», или обвинение против них сфабриковано, как в фильме L.A. Confidential («Секреты Лос-Анджелеса»). Все зависит исключительно от схемы выигрышей, определяемой продолжительностью сроков заключения.
Любая игра со схемой выигрышей как на обозначается общим названием «дилемма заключенных». А если конкретнее, то дилемме заключенных свойственны три ключевые особенности. Во-первых, в распоряжении каждого игрока есть две стратегии: сотрудничать с соперником (в нашем примере — отрицать любую причастностью к преступлению) или нет (признать вину в совершении преступления). Во-вторых, каждый игрок имеет доминирующую стратегию (признать вину или отказаться от сотрудничества). И наконец, равновесие в доминирующих стратегиях хуже для обоих игроков, чем неравновесная ситуация, при которой каждый игрок использует доминируемую стратегию (сотрудничать с соперниками).
Игры такого типа особенно важны при изучении теории игр по двум причинам. Первая — структура выигрышей, присущая дилемме заключенных, присутствует во многих стратегических ситуациях, касающихся экономической, социальной, политической и даже биологической конкуренции. Столь широкий диапазон применения дилеммы заключенных повышает важность ее изучения и понимания со стратегической точки зрения. Этой теме посвящена вся и некоторые разделы других глав.
Вторая — несколько необычный характер равновесного исхода, достигаемого в играх с дилеммой заключенных. Оба игрока выбирают свои доминирующие стратегии, однако полученный равновесный исход обеспечивает им выигрыши ниже, чем они могли бы получить, предпочтя доминируемые стратегии. Следовательно, в дилемме заключенных равновесный исход, по сути, плохой исход для игроков. Существует иной исход, который оба бы предпочли равновесному, но проблема в том, как гарантировать, что никто из игроков не прибегнет к обману. На данной особенности дилеммы заключенных сфокусировались специалисты по теории игр и поставили вполне резонный вопрос: что могут сделать участники игры «дилемма заключенных», чтобы достичь ее лучшего исхода? Мы пока оставим его открытым и продолжим обсуждение игр с одновременными ходами, а затем вернемся к нему и проанализируем более подробно в .
Б. Наличие доминирующей стратегии у одного игрока
Если у рационального игрока есть доминирующая стратегия, он обязательно ее использует, и другой игрок может в этом не сомневаться. В дилемме заключенных это касается обоих игроков, тогда как в ряде других игр — только одного из участников. Если вы играете в игру, не имея доминирующей стратегии в отличие от соперника, можете исходить из предположения, что он применит ее, а значит, у вас есть возможность выбрать свое равновесное действие (наилучший ответ) с учетом данного факта.
Проиллюстрируем этот случай на примере игры между Конгрессом, отвечающим за фискальную политику (налоги и правительственные расходы), и Федеральной резервной системой (ФРС), осуществляющей монетарную политику. В упрощенной версии, в которой представлены только самые важные аспекты такой игры, фискальная политика Конгресса может сводиться либо к сбалансированному бюджету, либо к дефициту бюджета, а ФРС может устанавливать либо высокие, либо низкие процентные ставки. В реальной жизни эту игру нельзя однозначно отнести к числу игр с одновременными ходами, поскольку даже если выбор в ней делается последовательно, не всегда бывает понятно, кто ходил первым. Мы рассмотрим здесь вариант игры с одновременными ходами, а в проанализируем, как будут отличаться исходы при изменении правил игры.
Почти все хотят снижения налогов. При этом немало претендентов на государственное финансирование: оборона, образование, здравоохранение и т. д. Кроме того, существуют различные политически влиятельные группы (в том числе фермеры и отрасли промышленности, страдающие от иностранной конкуренции), нуждающиеся в правительственных субсидиях. Поэтому Конгресс находится под постоянным давлением в плане как снижения налогов, так и увеличения расходов. Однако такой подход становится причиной образования дефицита бюджета, что, в свою очередь, может повлечь за собой рост инфляции. Главная задача ФРС — предотвратить инфляцию. Но ФРС тоже пребывает под политическим прессингом со стороны многих заинтересованных групп, ратующих за снижение процентных ставок, особенно домовладельцев, которым выгодны более низкие ставки по ипотечным кредитам. Снижение процентных ставок приводит к повышению спроса на автомобили, жилье и капиталовложения компаний, но этот спрос может обусловить и рост инфляции. Как правило, ФРС охотно понижает процентные ставки, но только до тех пор, пока нет угрозы инфляции. А она уменьшается, если правительство поддерживает сбалансированность бюджета. С учетом всех этих условий мы построили для этой игры матрицу выигрышей, представленную на рис. 4.5.
Рис. 4.5. Игра с фискальной и монетарной политикой
Для Конгресса лучший (выигрыш 4) — исход с дефицитом бюджета и низкими процентными ставками, что удовлетворяет всех непосредственных участников политического процесса. Правда, это чревато проблемами в будущем, но в политике временные интервалы непродолжительны. По той же причине худший для Конгресса (выигрыш 1) — исход со сбалансированным бюджетом и высокими процентными ставками. Из двух других исходов Конгресс предпочитает исход со сбалансированным бюджетом и низкими процентными ставками (выигрыш 3): он отвечает интересам домовладельцев как представителей важного среднего класса, а низкие процентные ставки предполагают меньше расходов на обслуживание государственного долга, поэтому в сбалансированном бюджете остается место для многих других статей расходов или снижения налогов.
Для ФРС худший (выигрыш 1) — исход с бюджетным дефицитом и низкими процентными ставками, поскольку это сочетание самое инфляционное; лучший (выигрыш 4) — исход со сбалансированным бюджетом и низкими процентными ставками, потому что это сочетание может выдержать высокий уровень экономической активности без большого риска инфляции. Сопоставив два оставшихся исхода с высокими процентными ставками, ФРС выбирает исход со сбалансированным бюджетом, так как он снижает риск инфляции.
Теперь давайте поищем в этой игре доминирующие стратегии. ФРС добьется более высоких результатов за счет низких процентных ставок, если считает, что Конгресс выберет сбалансированный бюджет (в таком случае выигрыш ФРС составит 4, а не 3). С другой стороны, ФРС выгоднее поднять процентные ставки исходя из убеждения, что Конгресс предпочтет дефицит бюджета (тогда выигрыш ФРС составит 2, а не 1). Таким образом, у ФРС нет доминирующей стратегии, а вот у Конгресса она есть. Если он убежден, что ФРС введет низкие процентные ставки, ему выгоднее выбрать бюджетный дефицит, а не сбалансированный бюджет (при этом выигрыш Конгресса составит 4 вместо 3), как, собственно, и в случае высоких процентных ставок (выигрыш Конгресса составит 2 вместо 1). Следовательно, выбор бюджетного дефицита — доминирующая стратегия Конгресса.
Итак, выбор Конгресса очевиден. Какими бы ни были его убеждения в отношении действий ФРС, он предпочтет дефицит бюджета. ФРС же может учесть этот выбор при принятии своего решения. Федеральная резервная система должна отталкиваться от убеждения, что Конгресс применит свою доминирующую стратегию (дефицит бюджета), и исходя из этого выбрать свою лучшую стратегию, то есть высокие процентные ставки.
При таком исходе игры каждая сторона получает выигрыш 2. Однако внимательное изучение показывает, что, как и в дилемме заключенных, существует еще один исход (а именно сбалансированный бюджет и низкие процентные ставки), способный обеспечить обоим игрокам более высокие выигрыши (3 для Конгресса и 4 для ФРС). Почему же он недостижим в качестве равновесия? Проблема в том, что у Конгресса возникнет искушение отклониться от заявленной стратегии и незаметно создать дефицит бюджета. ФРС, в свою очередь, зная о подобном соблазне и во избежание худшего исхода (выигрыш 1), тоже отклонится от своей стратегии и повысит ставки. В и мы расскажем, как обе стороны могут преодолеть эту трудность, чтобы достичь обоюдовыгодного исхода. Но следует отметить, что в большинстве стран в разные времена эти два политических органа действительно оказывались в тупиковой ситуации, когда фискальная политика была слишком мягкой, а монетарная требовала ужесточения, чтобы сдерживать инфляцию.
В. Последовательное исключение доминируемых стратегий
До сих пор в рассмотренных нами играх в распоряжении каждого игрока было по две чистые стратегии. Если одна стратегия в таких играх доминирующая, а другая — доминируемая, то выбор первой равнозначен исключению второй. В более масштабных играх некоторые стратегии игрока могут быть доминируемыми, даже если при этом ни одна стратегия не доминирует над остальными. Если игроки оказываются в игре данного типа, у них есть шанс добиться равновесия посредством исключения доминируемых стратегий из рассмотрения в качестве возможных вариантов выбора. Такое исключение уменьшает размер игры, а в «новой» игре у того же игрока или у его соперника может быть другая доминируемая стратегия, которую тоже можно удалить. В «новой» игре у одного из участников может даже появиться доминирующая стратегия. Последовательное, или итеративное, исключение доминируемых стратегий сводится к их удалению и сокращению размера игры до тех пор, пока дальнейшее сокращение не станет невозможным. Когда этот процесс завершается уникальным исходом, говорят, что игра разрешима по доминированию. Такой исход представляет собой равновесие Нэша, а стратегии, которые его обеспечивают, — равновесные стратегии каждого игрока.
Давайте возьмем в качестве примера этого процесса игру, представленную на . Рассмотрим первые стратегии Строки. Если какая-то стратегия неизменно обеспечивает этому игроку худшие выигрыши, то она является доминируемой и ее можно исключить из рассмотрения в поисках равновесного выбора Строки. В данном примере единственная доминируемая стратегия Строки — «высоко», над которой доминирует стратегия «внизу»: если Столбец выберет стратегию «слева», Строка получит выигрыш 5 за счет стратегии «внизу» и 4 — за счет стратегии «высоко»; если Столбец предпочтет стратегию «справа», Строка получит выигрыш 9, применив стратегию «внизу», и только 6 в случае «высоко». Следовательно, мы можем исключить стратегию «высоко» из рассмотрения. Теперь проанализируем варианты выбора Столбца на предмет исключения. Стратегия Столбца «слева» доминируется стратегией «справа» (что подтверждают аналогичные рассуждения: 1 < 2, 2 < 3 и 6 < 7). Обратите внимание, что мы не могли сделать такой вывод раньше, до удаления стратегии Строки «высоко»: в игре против стратегии Строки «высоко» Столбец получил бы выигрыш 5 за счет стратегии «слева» и только 4 за счет стратегии «справа». Стало быть, первый этап исключения стратегии Строки «высоко» позволяет перейти ко второму этапу, сводящемуся к удалению стратегии Столбца «слева». Таким образом, в контексте оставшегося набора стратегий («вверху», «низко» и «внизу» у Строки и «посредине» и «справа» у Столбца) стратегии Строки «вверху» и «внизу» доминируемы стратегией «низко». Когда у Строки остается только стратегия «низко», Столбец выберет свой наилучший ответ — а именно стратегию «посредине».
Следовательно, эта игра разрешима по доминированию, а ее исход — «низко»/«посредине» с выигрышами 5, 4. Мы определили его как равновесие Нэша, когда впервые иллюстрировали данную концепцию с помощью этой игры. Теперь более подробно рассмотрели процесс размышлений игроков, приводящий к формированию правильных убеждений. Рациональный игрок Строка не выберет стратегию «высоко». Рациональный игрок Столбец поймет это и, взвесив эффективность своих стратегий против оставшихся у Строки, не выберет «слева». Строка, в свою очередь, предвидя это, не выберет ни «вверху», ни «внизу». И наконец, Столбец, проанализировав все это, применит «посредине».
Другие игры могут быть не разрешимы по доминированию, а последовательное исключение доминируемых стратегий может не обеспечить уникальный исход игры. Но даже в таких случаях исключение доминируемых стратегий позволяет уменьшить размер игры и облегчить ее решение с помощью одного или более методов, описанных в следующих разделах. Стало быть, исключение доминируемых стратегий может стать полезным шагом на пути к решению большой игры с одновременными ходами, даже если не предоставляет возможности решить ее полностью.
До сих пор в процессе анализа итеративного исключения доминируемых стратегий все сравнения выигрышей носили однозначный характер. Но что если выигрыши окажутся равными? Рассмотрим вариант предыдущей игры, показанной на . В этой ее версии стратегии «высоко» (у Строки) и «слева» (у Столбца) также исключаются. На следующем этапе «низко» по-прежнему доминирует над «вверху», а вот доминирование «низко» над «внизу» стало менее очевидным. Эти две стратегии обеспечивают Строке равные выигрыши в борьбе против стратегии Столбца «посредине», хотя стратегия «низко» все же гарантирует Строке более высокий выигрыш по сравнению со стратегией «внизу» при их использовании против стратегии Столбца «справа». Будем говорить, что с точки зрения Строки в данный момент стратегия «низко» слабо доминирует над стратегией «внизу». Напротив, стратегия «низко» строго доминирует над стратегией «вверху», поскольку обеспечивает более высокие выигрыши, чем стратегия «вверху», разыгранная против обеих стратегий Столбца («посредине» и «справа»), анализируемых на данном этапе.
А теперь хотим предупредить вас вот о чем: последовательное исключение слабо доминируемых стратегий может привести к потере некоторых равновесий Нэша. Рассмотрим игру, представленную на рис. 4.6, где мы вводим Ровену как игрока вместо Строки и Колина вместо Столбца. В случае Ровены стратегия «вверх» слабо доминируема стратегией «вниз»; если Колин сыграет «налево», то Ровена получит лучший выигрыш, применив стратегию «вниз», а не «вверх», а если Колин сыграет «направо», то Ровена получит один и тот же выигрыш от обеих своих стратегий. Точно так же для Колина стратегия «направо» слабо доминирует над стратегией «налево». В таком случае разрешимость по доминированию говорит нам, что сочетание стратегий «вниз»/«направо» — равновесие Нэша. Это действительно так, но «вниз»/«налево» и «вверх»/«направо» — тоже равновесия Нэша. Рассмотрим сочетание «вниз»/«налево». Когда Ровена выбирает «вниз», Колин не может улучшить свой выигрыш, переключившись на стратегию «направо», а когда Колин выбирает «налево», лучший ответ Ровены — сыграть «вниз». Аналогичные рассуждения позволяют убедиться, что «вверх»/«направо» — также равновесие Нэша.
Рис. 4.6. Исключение слабо доминируемых стратегий
В связи с этим при использовании слабого доминирования для исключения некоторых стратегий целесообразно проверить, не пропустили ли вы какие-либо равновесия, с помощью других методов (таких как метод, представленный в следующем разделе). Решение по итеративному доминированию можно считать вероятным равновесием Нэша в этой игре с одновременными ходами, однако следует учитывать также важность множественности равновесий и другие равновесия сами по себе. Мы рассмотрим эти вопросы в следующих главах, проанализировав множественность равновесий в и взаимосвязи между играми с последовательными и одновременными ходами в .
4. Анализ наилучших ответов
Во многих играх с одновременными ходами нет ни доминирующих, ни доминируемых стратегий. Другие игры могут иметь одну или несколько доминируемых стратегий, но их итеративное исключение не обеспечивает единственного исхода игры. В таких случаях необходимо выполнить следующий шаг в процессе поиска решения игры. Мы по-прежнему ищем равновесие Нэша, в котором каждый игрок предпринимает свое лучшее действие с учетом действий другого игрока (игроков), но теперь должны прибегнуть к более тонкому стратегическому мышлению, чем то, которого требует простое исключение доминируемых стратегий.
Здесь мы сформулируем еще один систематический метод поиска равновесий Нэша, который нам очень пригодится при выполнении последующего анализа. Для начала введем требование о правильности убеждений. Мы будем по очереди принимать точку зрения каждого игрока и задавать такой вопрос: какой лучший ответ данного игрока на каждый вариант выбора, который может сделать другой игрок (игроки)? Таким образом мы найдем лучшие ответы каждого игрока на все стратегии, доступные другим игрокам. В математических терминах это означает, что мы найдем стратегию лучшего ответа каждого игрока в зависимости от (или как функцию от) стратегий, находящихся в распоряжении других игроков.
Вернемся к игре, в которую играли Строка и Столбец, и представим ее на рис. 4.7. Сначала проанализируем ответы Строки. Если Столбец применит стратегию «слева», наилучший ответ Строки — «внизу», обеспечивающий выигрыш 5. Мы показываем его, выделив соответствующий выигрыш кружком в таблице игры. Если Столбец предпочтет стратегию «посредине», лучший ответ Строки — «низко» (тоже выигрыш 5). А если Столбец выберет стратегию «справа», оптимальный выбор Строки — снова «низко» (выигрыш 12). Опять же, мы показываем лучшие варианты выбора Строки, обведя кружками соответствующие выигрыши. Аналогичным образом представлены лучшие ответы Столбца, выигрыши по которым выделены кружками: 3 (стратегия «посредине» как лучший ответ на стратегию Строки «вверху»), 5 («слева» как лучший ответ на «высоко»), 4 («посредине» как лучший ответ на «низко») и 7 («справа» как лучший ответ на «внизу»). Мы видим, что в одной ячейке — а именно «низко»/«посредине» — оба выигрыша выделены кружками. Следовательно, стратегии «низко» у Строки и «посредине» у Столбца одновременно будут лучшими ответами друг на друга. Мы нашли равновесие Нэша в этой игре еще раз.
Рис. 4.7. Анализ наилучших ответов
Анализ наилучших ответов — это исчерпывающий способ обнаружения в игре всех возможных равновесий Нэша. Вам следует углубить понимание этого метода, применив его ко всем играм, описанным в данной главе. Примеры с доминированием представляют особый интерес. Если у Строки есть доминирующая стратегия, именно она будет наилучшим ответом на все стратегии Столбца; следовательно, все наилучшие ответы Строки расположены по горизонтали в одной и той же строке. Точно так же, если у Столбца есть доминирующая стратегия, то все его наилучшие ответы выстроятся по вертикали в одном и том же столбце. Вы можете сами проверить, как такой анализ позволяет определить равновесия Нэша в дилемме заключенных с участием мужа и жены, показанной на , и в игре между Конгрессом и Федеральной резервной системой, отображенной на .
В некоторых играх анализ наилучших ответов не позволяет найти равновесие Нэша, подобно тому как разрешимость по доминированию не всегда обеспечивает требуемый результат. Однако в данном случае мы можем сказать кое-что более конкретное, чем при неудачной попытке использовать доминирование. Когда анализ наилучших ответов в игре с дискретными стратегиями не обнаруживает равновесия Нэша, это означает, что в этой игре нет равновесия в чистых стратегиях. Мы рассмотрим игры такого типа в данной главы, а в расширим область применения анализа наилучших ответов на игры, в которых стратегии представляют собой непрерывные переменные, например цены или расходы на рекламу. Кроме того, мы построим кривые наилучших ответов, что позволит нам находить равновесия Нэша, и увидим, что в подобных играх равновесие может отсутствовать с меньшей вероятностью в силу непрерывности выбора стратегий.
5. Три игрока
До сих пор мы анализировали только игры между двумя участниками. Однако все рассмотренные методы анализа применимы и для поиска равновесий Нэша в чистых стратегиях в любой игре с одновременными ходами с участием любого количества игроков. Когда в игре больше двух участников, каждому из которых доступно сравнительно небольшое количество чистых стратегий, анализ можно выполнить с помощью таблицы игры, подобно тому как мы это делали в первых четырех разделах данной главы.
В мы рассматривали игру с тремя участницами, каждая из которых имела по две чистые стратегии. Эмили, Нине и Талии предстояло решить, вносить ли вклад в создание декоративного сада на их маленькой улице. Мы предположили, что в случае вклада всех трех участниц игры сад будет не лучше, чем при вкладе двоих девушек, а вот если вклад сделает только одна участница, сад получится настолько скудным, что уж лучше его и не высаживать вовсе. Теперь допустим, что три участницы делают выбор одновременно, а разнообразие возможных исходов и выигрышей несколько богаче. В частности, размер и пышность сада будут зависеть от точного количества инвесторов: вклад трех участниц позволит разбить самый большой и красивый сад, двух — средний сад и одной — маленький.
Предположим, Эмили анализирует вероятные исходы игры «уличный сад». Ей предстоит оценить шесть возможных вариантов. Эмили может выбирать, вносить или не вносить вклад, если и Нина, и Талия внесут свой вклад или если ни одна из них этого не сделает либо сделает только одна. С точки зрения Эмили, лучший возможный исход с рейтингом 6 — воспользоваться добротой соседок и сделать так, чтобы Нина и Талия инвестировали в создание сада, а она сама — нет. Тогда Эмили могла бы наслаждаться средним садом, не вкладывая в него заработанные тяжелым трудом деньги. Если Нина и Талия вложат средства в сад и Эмили тоже, она сможет любоваться большим прекрасным садом, но ценой собственного вклада, поэтому она присваивает этому исходу рейтинг 5.
На другом конце диапазона находятся исходы, возникающие в случае отказа Нины и Талии инвестировать в сад. При таком раскладе Эмили снова предпочтет не вносить вклад, поскольку иначе все расходы на создание общественного сада, которым будут наслаждаться все, лягут на ее плечи; уж лучше она посадит цветы у себя во дворе. Таким образом, если другие участницы игры отказываются вкладывать средства в создание сада, Эмили присваивает рейтинг 1 исходу, при котором она вносит вклад, и рейтинг 2 исходу, при котором она этого не делает.
Между крайними случаями находятся ситуации, в которых кто-то один — либо Нина, либо Талия — вносит вклад, но не сразу обе. Когда одна из них это делает, Эмили знает, что сможет наслаждаться маленьким садом, не принимая участия в его создании. Кроме того, она считает, что цена ее вклада перевешивает то, что он позволит увеличить размер сада. Поэтому Эмили присваивает рейтинг 4 исходу, при котором она не вносит вклад, но получает возможность наслаждаться маленьким садом, и рейтинг 3 исходу, при котором вносит вклад, обеспечивая создание среднего сада. Поскольку Нина и Талия придерживаются аналогичных взглядов на затраты и преимущества, каждая из них составляет такой же рейтинг вероятных исходов игры, в котором самый худший — когда каждая участница инвестирует в создание сада, а две оставшиеся этого не делают, и т. д.
Если все трое решают, вносить ли вклад в создание сада, не зная о действиях соседок, перед нами — игра с одновременными ходами с тремя игроками. Для того чтобы найти в ней равновесие Нэша, необходимо составить таблицу игры. В случае игры с тремя участниками таблица должна быть трехмерной, а стратегии третьего игрока должны соответствовать третьему измерению. Самый простой способ его прибавить к двумерной таблице игры — добавить страницы. Первая страница таблицы отображает выигрыши для первой стратегии третьего игрока, вторая страница — выигрыши для второй стратегии третьего игрока и т. д.
Мы показываем трехмерную таблицу игры «уличный сад» на рис. 4.8. В ней две строки отведены для двух стратегий Эмили, два столбца — для двух стратегий Нины и две страницы — для двух стратегий Талии. Мы разместили эти страницы рядом, чтобы вы могли видеть все одновременно. В каждой ячейке выигрыши перечислены в следующем порядке: сначала выигрыш игрока строки, затем выигрыш игрока столбца, далее выигрыш игрока страницы, то есть в данном примере: Эмили, Нина, Талия.
Рис. 4.8. Игра «уличный сад»
Прежде всего мы должны определить, есть ли доминирующие стратегии у каждой из участниц. В таблицах игр из одной страницы это было достаточно просто: мы просто сравнивали исходы, связанные с одной из стратегий игрока, с исходами другой его стратегии. На практике в случае игрока строки такое сравнение требовало простой проверки данных в столбцах одной страницы таблицы и наоборот в случае игрока столбца. Сейчас же мы должны проверить данные на обеих страницах таблицы, чтобы определить, есть ли доминирующая стратегия у какой-либо из участниц игры.
В случае Эмили мы сравниваем две строки обеих страниц таблицы и видим, что если Талия внесет вклад, то доминирующая стратегия Эмили — не вносить вклад. Следовательно, для Эмили лучше не вносить вклад в создание сада независимо от решений остальных участниц игры. Точно так же мы видим, что доминирующая стратегия Нины (на обеих страницах таблицы) — не вносить вклад. А вот при поиске доминирующей стратегии у Талии нужно быть предельно внимательными. Мы должны сравнить исходы, которые поддерживают постоянство поведения Эмили и Нины, проанализировав выигрыши Талии в случае выбора стратегии «внести вклад» в сравнении с выигрышами от выбора стратегии «не вносить вклад». Иными словами, мы должны сравнить ячейки двух страниц таблицы: верхнюю левую ячейку первой страницы (слева) с верхней левой ячейкой второй страницы (справа) и т. д. Как и для первых двух участниц игры, этот процесс показывает, что доминирующая стратегия Талии — тоже не вносить вклад.
Итак, у каждой участницы игры есть доминирующая стратегия, которая должна быть ее равновесной чистой стратегией. Равновесие Нэша в этой игре состоит в том, что все ее участницы предпочитают не вкладывать средства в создание сада и получить второй по величине выигрыш. При этом сад так и не будет посажен, а участницы игры не понесут лишних расходов.
Обратите внимание, что эта игра — еще один пример дилеммы заключенных. Существует единственное равновесие Нэша, при котором все игроки получают выигрыш 2. Однако у «уличного сада» есть еще один исход (при котором все три соседки инвестируют в сад), обеспечивающий всем трем участницам более высокие выигрыши 5. Хотя каждой из них было бы выгодно поучаствовать в создании сада, ни у кого из них нет индивидуального стимула для этого. В итоге такие сады либо вообще не сажают, либо делают это за счет налоговых поступлений, поскольку городская администрация может взыскать с жителей города такой налог. В мы рассмотрим другие дилеммы коллективного действия и изучим некоторые методы их решения.
Равновесие Нэша в игре «уличный сад» можно также найти посредством анализа наилучших ответов, как показано на рис. 4.9. Так как доминирующая стратегия каждой участницы игры — «не вносить вклад», все наилучшие ответы Эмили находятся в ее строке «не вносить вклад», Нины — в ее колонке «не вносить вклад», а Талии — на ее странице «не вносить вклад». Ячейка в правом нижнем углу содержит три наилучших ответа, а значит, это и есть равновесие Нэша.
Рис. 4.9. Анализ наилучших ответов в игре «уличный сад»
6. Множество равновесий в чистых стратегиях
В каждой из игр, рассмотренных в предыдущих разделах, было единственное равновесие Нэша в чистых стратегиях. Однако в целом в играх необязательно должно быть единственное равновесие Нэша. Мы проиллюстрируем этот результат посредством класса игр, имеющих много областей применения, который можно обозначить как координационные игры. У их участников есть общие интересы (хотя и не всегда полностью совпадающие), но поскольку игроки действуют независимо друг от друга (в силу характера некооперативных игр), координация действий, необходимых для достижения общего предпочтительного исхода, проблематична.
А. Встретятся ли Гарри и Салли? Чистая координация
Для того чтобы проиллюстрировать эту идею, давайте представим себе двух студентов-старшекурсников, встретившихся в университетской библиотеке. Они понравились друг другу и хотели бы продолжить общение, но им нужно идти в разные аудитории на лекции. Гарри и Салли договариваются вместе выпить кофе после занятий, которые заканчиваются в 16:30. Во время лекций оба осознают, что из-за волнения забыли договориться о месте встречи. Существует два возможных варианта: Starbucks и Local Latte. К сожалению, эти кафе расположены на противоположных концах большого кампуса, поэтому оказаться в обоих примерно в одно и то же время невозможно. Кроме того, Гарри и Салли не обменялись телефонными номерами, из-за чего не могут отправить друг другу сообщения. Что же нужно сделать каждому из них?
На рис. 4.10 эта ситуация представлена в виде игры с матрицей выигрышей. У каждого игрока два варианта выбора: Starbucks и Local Latte. Выигрыш для каждого равен 1, если они встретятся, и 0, если нет. Анализ наилучших ответов позволяет быстро определить, что в игре два равновесия Нэша: одно — при котором Салли и Гарри выберут Starbucks, и второе — при котором они выберут Local Latte. Для обоих важно достичь одного из этих равновесий, причем какого — не играет роли, поскольку оба равновесия обеспечивают одинаковые выигрыши. Главное, чтобы они скоординированно выбрали одно и то же действие, неважно какое. Именно поэтому такую игру называют игрой с чистой координацией.
Рис. 4.10. Чистая координация
Но смогут ли Гарри и Салли успешно скоординировать свои действия? Или в конечном счете они окажутся в разных кафе и каждый будет думать, что другой его подвел? Увы, такой риск существует. Гарри может решить, что Салли отправится в Starbucks, потому что она что-то говорила о занятиях, которые проходят на той стороне кампуса, где расположен Starbucks. Но у Салли может быть противоположное убеждение относительно того, что сделает Гарри. При наличии множества равновесий Нэша игрокам при выборе одного из них необходим какой-то способ скоординировать свои убеждения или ожидания в отношении действий друг друга.
Эта ситуация аналогична тому, что произошло с героями истории «Какая шина?», рассказанной в , где мы обозначили метод координации термином «фокальная точка». В данном контексте одно из двух кафе может быть широко известно как место встречи студентов. Однако недостаточно, чтобы Гарри просто об этом знал. Он должен знать, что Салли знает, и что она знает, что он знает, и т. д. Иными словами, их ожидания должны сходиться в фокальной точке. В противном случае Гарри может сомневаться в том, куда пойдет Салли, поскольку он не знает, что она думает о том, куда пойдет он. Подобные сомнения могут возникнуть на третьем, или четвертом, или еще более высоком уровне размышлений о размышлениях.
Когда один из нас (Диксит) задал этот вопрос своим студентам, большинство первокурсников выбрали Starbucks, а старшекурсники — местное кафе в студенческом центре университетского городка. Такой расклад закономерен: первокурсники, которые прожили в кампусе совсем немного времени, фокусируют свои ожидания на всем известной национальной сети кафе, тогда как старшекурсники знают местное кафе, ставшее для них самым лучшим местом встречи, и считают, что их друзья придерживаются аналогичного мнения.
Если бы одно кафе было оформлено в оранжевых тонах, а другое — в багровых, то в Принстоне первое кафе служило бы в качестве фокальной точки, поскольку оранжевый — это цвет Принстонского университета, тогда как в Гарварде по той же причине фокальной точкой было бы кафе с багровым декором. Если один человек — студент Принстона, а другой — Гарварда, они могут вообще не встретиться: либо потому, что каждый из них считает свой цвет более приоритетным, либо по той причине, что каждый думает, что другой не проявит гибкость и не пойдет на компромисс. В более общем случае способность участников координационных игр найти фокальную точку зависит от наличия такой общеизвестной точки контакта, будь то историческая, культурная или языковая.
Б. Встретятся ли Гарри и Салли? И где? Игра в доверие
Теперь давайте немного изменим выигрыши в игре. Поведение студентов старших курсов позволяет предположить, что нашей паре может быть не совсем безразлично, какое именно кафе выбирать. В одном заведении может быть лучше кофе, в другом — атмосфера. Или они могут предпочесть менее популярное место встречи студентов, чтобы избежать возможного столкновения с бывшими парнями или девушками. Предположим, Гарри и Салли остановятся на Local Latte; следовательно, выигрыш каждого из них составит 2, если они встретятся в этом кафе, и 1, если они встретятся в Starbucks. Новая матрица выигрышей показана на рис. 4.11.
Рис. 4.11. Игра в доверие
Здесь снова присутствуют два равновесия Нэша. Однако в данной версии игры каждый предпочитает равновесие, при котором оба выбирают Local Latte. К сожалению, тот факт, что обоим участникам нравится такой исход игры, его не гарантирует. Прежде всего (как и всегда в нашем анализе) выигрыши должны быть элементом общего знания, оба игрока должны знать всю матрицу выигрышей, оба должны знать, что оба знают, и т. д. Знание игры во всех подробностях было бы возможным, если бы Гарри и Салли обсудили ситуацию и сошлись во мнениях по поводу преимуществ двух кафе, но просто забыли договориться о том, что встретятся в Local Latte. Но даже в этом случае Гарри мог бы подумать, что у Салли есть какая-то иная причина для выбора Starbucks, или он может подумать, что она подумает, что он подумает, и т. д. Без истинной сходимости ожиданий в отношении действий участники игры могут выбрать худшее равновесие или, что еще печальнее, вообще не скоординировать свои действия, и тогда каждый получит нулевой выигрыш.
Повторим еще раз: участники игры, представленной на , могут получить предпочтительный равновесный исход, только если каждый из них достаточно убежден в том, что другой выберет надлежащее действие. По этой причине игры такого типа называются играми в доверие.
Во многих подобных реальных жизненных ситуациях обрести доверие довольно легко при наличии даже минимальной коммуникации между игроками. Их интересы полностью совпадают: если один скажет «Я пойду в Local Latte», у другого нет оснований сомневаться в истинности этого утверждения, поэтому он пойдет туда же, чтобы получить предпочтительный для обоих исход. Именно поэтому нам пришлось придумать историю с двумя студентами, которые посещают разные занятия и не имеют возможности общаться друг с другом. Если интересы игроков вступают в конфликт, правдивая коммуникация становится более проблематичной. Мы углубимся в эту проблему, когда будем рассматривать стратегическое манипулирование информацией в играх в .
В более многочисленных группах коммуникацию можно обеспечить посредством планирования встреч или размещения объявлений. Но эти способы эффективны только в случае, когда все знают, что остальные обращают на них внимание, поскольку для успешной координации действий необходимо, чтобы требуемый исход был фокальной точкой. Ожидания игроков должны сходиться в этой точке: все должны знать, что каждый знает, что … каждый делает этот выбор. Именно эту функцию выполняют многие общественные институты и договоренности. Собрания, во время которых присутствующие рассаживаются по кругу и смотрят в его центр, позволяют каждому видеть, что делают остальные. Рекламные объявления во время Суперкубка, особенно когда их показывают накануне матчей в качестве основной приманки, убеждают каждого зрителя, что многие тоже их смотрят. Это делает такие рекламные объявления особенно привлекательными для компаний, выпускающих продукты, которые становятся более желанными для каждого отдельного покупателя, если их покупают многие люди; к данной категории относится продукция компьютерной отрасли, телекоммуникаций и интернет-индустрии.
В. Встретятся ли Гарри и Салли? И где? Битва полов
Теперь давайте еще немного усложним игру с выбором кафе. Оба игрока хотят встретиться, но предпочитают разные кафе. Таким образом, Гарри может получить выигрыш 2, а Салли — 1, если они встретятся в Starbucks, и наоборот, если встреча состоится в Local Latte. Матрица выигрышей этой игры показана на рис. 4.12.
Рис. 4.12. Битва полов
Такая игра называется битвой полов. Название происходит от истории, которую специалисты по теории игр придумали для иллюстрации этой структуры выигрышей в сексистских 1950-х годах. В этой истории мужу и жене предстоял выбор между походом на боксерский матч и балет, причем (предположительно, по эволюционно-генетическим причинам) муж должен был выбрать бокс, а жена — балет. Это название прижилось, поэтому мы будем его использовать, хотя наш пример (в котором у любого из игроков вполне могла быть причина предпочесть любое из двух кафе, не имеющая отношения к полу) ясно дает понять, что такая игра необязательно должна иметь сексистский подтекст.
Как будут развиваться события в этой игре? В ней по-прежнему присутствуют два равновесия Нэша. Если Гарри убежден, что Салли выберет Starbucks, ему лучше сделать то же самое, и наоборот. По тем же причинам Local Latte также является равновесием Нэша. Для того чтобы достичь любого из этих равновесий и избежать исходов, при которых игроки отправятся в разные кафе, им необходима фокальная точка, или сходимость ожиданий, точно так же как в игре с чистыми стратегиями и игре в доверие. Однако в битве полов риск неудачи с координацией действий выше. Игроки с самого начала находятся в достаточно симметричных ситуациях, однако каждое из двух равновесий Нэша обеспечивает им асимметричные выигрыши, а их предпочтения в отношении двух возможных исходов вступают в противоречие: Гарри ратует за встречу в Starbucks, а Салли — в Local Latte. Они должны найти способ нарушить эту симметрию.
В стремлении достичь предпочтительного для себя равновесия каждый игрок может прибегнуть к жестким действиям и стратегии, ведущей к лучшему равновесию. В мы рассмотрим в деталях такие инструменты ведения игры, как стратегические ходы, которые участники подобных игр могут предпринять для обеспечения предпочтительного исхода. Или каждый игрок попытается угодить другому, что может обусловить досадную ситуацию, когда Гарри отправится в Local Latte, чтобы порадовать Салли, но обнаружит, что она решила доставить удовольствие ему и пошла в Starbucks (очень похоже на то, как герои рассказа О’Генри «Дары волхвов» выбирали подарки друг другу на Рождество). В качестве альтернативы в случае повторяющейся игры успешная координация действий может стать предметом переговоров и поддерживаться как равновесие. Например, Гарри и Салли могут договориться встречаться то в одном, то в другом кафе. В мы проанализируем такое неявное сотрудничество в повторяющихся играх в контексте дилеммы заключенных.
Г. Встретятся ли Джеймс и Дин? Игра в труса
Наш последний пример в этом разделе касается координационной игры несколько иного типа. В ней игроки стремятся предотвратить (или не выбирать) одни и те же действия. Кроме того, последствия неудачной попытки координации в подобных играх куда более разрушительны, чем в других играх.
Эта история взята из игры, в которую якобы играли американские подростки в 1950-х годах. Двое подростков садятся в полночь в свои автомобили на противоположных концах улицы какого-нибудь американского городка и мчатся навстречу друг другу. Тот, кто свернет в сторону, чтобы избежать столкновения, становится «трусом», а тот, кто продолжает ехать прямо, считается победителем. Если оба подростка придерживаются прямого курса, происходит столкновение, в котором оба автомобиля получают повреждения, а оба водителя — травмы.
Выигрыши «труса» зависят от того, насколько негативным для себя игрок считает «плохой» исход (в данном случае это травмы водителя и повреждения автомобиля) по сравнению с перспективой прослыть трусом. Если слова задевают меньше, чем хруст металла, то таблица разумных выигрышей в варианте игры в труса 1950-х годов выглядит так, как на рис. 4.13. Каждый игрок больше всего хочет стать победителем, а не трусом, и оба одинаково не хотят столкновения автомобилей. Между этими двумя крайностями для вас предпочтительна ситуация, чтобы ваш соперник оказался трусом в игре с вами (сохранить лицо), чем самому стать трусом.
Рис. 4.13. Игра в труса
У этой истории есть четыре важных свойства, которые определяют игру в труса. Во-первых, у каждого игрока есть одна «жесткая» и одна «слабая» стратегия. Во-вторых, в игре присутствуют два равновесия Нэша в чистых стратегиях (иными словами, исходы игры, при которых один из игроков становится трусом или придерживается слабой стратегии). В-третьих, каждый игрок выбирает именно то равновесие, при котором другой игрок предпочитает стать трусом или применяет слабую стратегию. В-четвертых, когда оба придерживаются жесткой стратегии, оба получают очень плохие выигрыши. В играх такого типа реальная игра сводится к проверке ее участниками способов достижения предпочтительного для себя равновесия.
Мы вернулись к ситуации, подобной рассмотренной при обсуждении игры «битва полов». Большинство происходящих в реальной жизни игр в труса предполагают еще более ожесточенные битвы, чем битва полов: преимущества от победы повышаются, так же как и цена поражения, поэтому все проблемы, связанные с конфликтом интересов и асимметрией между игроками, усугубляются. Каждый игрок стремится повлиять на исход такой игры. Может сложиться ситуация, когда один игрок попытается создать впечатление жесткости, которое видели бы все, чтобы запугать соперников. Еще один вариант — найти какой-либо другой способ убедить соперника в том, что вы не сдадитесь, взяв на себя явное и непреложное обязательство ехать прямо. (В мы поговорим о том, как делать ходы с обязательствами.) Кроме того, оба игрока могут захотеть предотвратить неблагоприятный исход (столкновение), если это вообще возможно.
Как и в битве полов, если игра повторяется, молчаливая координация — лучший путь к решению игры. Иначе говоря, если бы подростки играли в труса в полночь каждого воскресенья, при выборе равновесных стратегий они знали бы, что у игры есть и прошлое, и будущее. В подобной ситуации они могли бы выбрать такой логически правильный путь, как чередование равновесий, и по очереди бы становились победителями раз в две недели. (Однако если кто-то узнает об этой сделке, пострадает репутация обоих игроков.)
Существует еще один, последний, момент, касающийся координационных игр, о котором следует упомянуть. Концепция равновесия Нэша требует от каждого игрока наличия правильных убеждений в отношении выбора стратегии другим игроком. При поиске равновесий Нэша в чистых стратегиях эта концепция предписывает, чтобы каждый игрок был уверен в выборе другого игрока. Но наш анализ координационных игр показывает, что в размышлениях о выборе других игроков в таких играх присутствует элемент стратегической неопределенности. Как мы можем включить ее в анализ? В мы вводим понятие смешанной стратегии, в которой фактический выбор делается случайным образом из доступных действий. Такой подход распространяет концепцию равновесия Нэша на ситуации, когда игроки могут быть не уверены в действиях друг друга.
7. Отсутствие равновесия в чистых стратегиях
В каждой из рассмотренных выше игр было минимум одно равновесие Нэша в чистых стратегиях. В некоторых играх, таких как в , было больше одного равновесия, тогда как в предыдущих разделах представлены игры ровно с одним. К сожалению, не все игры, анализируемые нами в процессе изучения стратегии и теории игр, будут иметь легко поддающиеся определению исходы, при которых игроки всегда выбирают одно конкретное действие в качестве равновесной стратегии. В данном разделе мы проанализируем игры, в которых отсутствует равновесие Нэша в чистых стратегиях и ни один из игроков не выбирает неизменно одну и ту же стратегию в качестве своего равновесного действия.
Простой пример такой игры — розыгрыш одного очка в теннисном матче. Представьте себе матч между двумя лучшими теннисистками всех времен — Мартиной Навратиловой и Крис Эверт. Навратилова у сетки только что отправила мяч в сторону Эверт на задней линии, а Эверт вот-вот сделает обводящий удар. Она может попытаться послать мяч либо по линии (ПЛ, сильный прямой удар), либо по диагонали (ПД, более мягкий удар из одного угла корта в другой). Навратилова точно так же должна подготовиться, чтобы прикрыть какую-то одну сторону. Каждая участница игры знает, что не должна давать сопернице никаких подсказок в отношении запланированного действия, понимая, что эта информация будет использована против нее. Навратилова попыталась бы прикрыть ту сторону, в которую Эверт планирует послать мяч, а Эверт сделала бы удар в ту сторону, которую Навратилова не собирается прикрывать. Обе теннисистки должны выполнить соответствующее действие за долю секунды, и обе умеют хорошо скрывать свои намерения до последнего момента. Следовательно, их действия фактически одновременны, поэтому мы можем проанализировать этот розыгрыш очка как игру с одновременными ходами с двумя участниками.
Выигрыши в игре с розыгрышем очков в теннисе соответствуют относительному количеству случаев, когда игрок выигрывает очко в той или иной комбинации обводящего удара и прикрывающей игры. Учитывая, что обводящий удар по линии сильнее удара по диагонали и что Эверт с большей вероятностью выиграет, если Навратилова попытается прикрыть не ту сторону корта, мы можем сформировать приемлемую систему выигрышей. Предположим, Эверт добьется успеха в 80 % обводящих ударов по линии, если Навратилова прикроет корт на случай удара по диагонали, и только в 50 % обводящих ударов по линии, если Навратилова прикроет корт на случай удара по линии. Точно так же Эверт добьется успеха в 90 % ударов по диагонали, если Навратилова прикроет корт на случай удара по линии. Эта доля результативных ударов выше, чем при попытке Навратиловой прикрыть корт на случай удара по диагонали — тогда Эверт выиграет очки только в 20 % случаев.
Очевидно, что доля побед Навратиловой в игре равна разности между 100 % и долей побед Эверт. Следовательно, это игра с нулевой суммой (хотя формально сумма выигрышей двух участниц составляет 100), поэтому мы можем представить всю необходимую информацию в таблице выигрышей, отобразив в каждой ячейке только выигрыш Эверт. На рис. 4.14 показана таблица выигрышей и доля побед Эверт в розыгрышах очков против Навратиловой в каждой из четырех возможных комбинаций их выбора стратегий.
Рис. 4.14. Отсутствие равновесия в чистых стратегиях
Правила решения игр с одновременными ходами говорят нам о том, что сначала следует попытаться найти доминирующие или доминируемые стратегии, а затем использовать анализ наилучшего ответа для поиска равновесия Нэша. Это полезное упражнение позволяет убедиться, что в данной игре нет доминирующих стратегий. Выполнив анализ наилучших ответов, мы приходим к выводу, что лучший ответ Эверт на стратегию ПЛ — стратегия ПД, а на стратегию ПД — стратегия ПЛ. Напротив, наилучший ответ Навратиловой на стратегию ПЛ — стратегия ПЛ, а на стратегию ПД — стратегия ПД. Ни в одной ячейке таблицы выигрышей равновесия Нэша нет, поскольку каждая теннисистка упорно пытается изменить свою стратегию. Например, начав с верхней левой ячейки таблицы, мы обнаружим, что Эверт предпочитает перейти от стратегии ПЛ к стратегии ПД, увеличив свой выигрыш с 50 до 90 процентов. Однако в левой нижней ячейке таблицы мы видим, что Навратилова считает разумным переключиться со стратегии ПЛ на ПД, увеличив свой выигрыш с 10 до 80 процентов. Как вы можете убедиться сами, аналогичным образом Эверт стремится изменить стратегии в нижней левой ячейке, а Навратилова — в верхней правой. В каждой ячейке таблицы одна участница неизменно старается изменить игру, поэтому мы можем бесконечно перемещаться в таблице по кругу в поисках равновесия.
Отсутствие равновесия Нэша в этой и других подобных играх содержит один значимый сигнал: в играх такого типа важно не то, что игроки должны сделать, а то, чего они не должны делать. В частности, каждая участница игры не должна постоянно или систематически выбирать один и тот же удар, оказываясь в такой ситуации. Если любая из теннисисток будет придерживаться определенной линии поведения, другая может воспользоваться этим. (Например, если бы Эверт постоянно делала обводящий удар по диагонали, Навратилова бы знала, что ей каждый раз необходимо прикрывать соответствующую сторону корта, и тем самым снизила бы шансы Эверт на успешное выполнение удара по диагонали.) Самое разумное, что могут сделать участницы игры, — действовать несколько бессистемно, рассчитывая на то, что элемент неожиданности поможет победить соперницу. Асимметричный подход подразумевает выбор каждой стратегии в определенном количестве случаев. (Эверт следует использовать свой более слабый удар достаточно часто, чтобы Навратилова не могла предугадать, какой удар будет направлен в ее сторону. Однако она не должна использовать удары двух типов по установленной схеме, поскольку это также приведет к потере элемента неожиданности.) Подход, при котором игроки выбирают действия случайным образом, известный как смешивание стратегий, подробно рассматривается в . Игра, представленная на , может не иметь равновесия в чистых стратегиях, но ее все же можно решить посредством поиска равновесия в смешанных стратегиях, что мы и сделаем в .
Резюме
Участники игр с одновременными ходами выбирают стратегии, не зная о выборе других игроков. Такие игры можно изобразить в виде таблицы игры, в ячейках которой отображены выигрыши каждого игрока, а ее размерность равна количеству игроков. Игры с нулевой суммой с двумя участниками можно представить в сокращенном виде, отобразив в каждой ячейке таблицы игры только выигрыши одного игрока.
Равновесие Нэша — концепция, используемая для решения игр с одновременными ходами. Такое равновесие состоит из совокупности стратегий (по одной на каждого игрока), где каждый игрок выбрал свой лучший ответ на выбор другого игрока. Кроме того, равновесие Нэша можно трактовать как набор стратегий, при котором у каждого игрока есть правильные убеждения относительно стратегий других игроков, а определенные стратегии являются лучшими для каждого игрока с учетом этих убеждений. Равновесия Нэша можно найти посредством поиска доминирующих стратегий, последовательного исключения доминируемых стратегий или анализа наилучших ответов.
Существует масса классов игр с одновременными ходами. Игра «дилемма заключенных» встречается во многих контекстах. В координационных играх, таких как игра в доверие, игра в труса и битва полов, — множество равновесий, и решение этих игр требует от их участников координации действий. Если в игре отсутствует равновесие в чистых стратегиях, мы должны искать его в смешанных стратегиях, анализ которых представлен в .
Ключевые термины
Анализ наилучших ответов
Битва полов
Дилемма заключенных
Доминируемая стратегия
Доминирующая стратегия
Игра в доверие
Игра в труса
Игра с чистой координацией
Итеративное исключение доминируемых стратегий
Координационная игра
Матрица игры
Наилучший ответ
Нормальная форма
Последовательное исключение доминируемых стратегий
Равновесие Нэша
Разрешимость по доминированию
Смешанная стратегия
Стратегическая форма
Сходимость ожиданий
Таблица выигрыша
Таблица игры
Убеждение
Фокальная точка
Чистая стратегия
Упражнения с решениями
S1. Найдите все равновесия Нэша в чистых стратегиях для представленных ниже игр. Сначала проверьте таблицу игры на наличие доминирующих стратегий. Если таковых нет, решите игру посредством итеративного исключения доминируемых стратегий. Объясните логику своих рассуждений.
a)
b)
c)
d)
S2. Для каждой из четырех игр, представленных в упражнении S1, определите, это игра с нулевой или с ненулевой суммой. Объясните логику своих рассуждений.
S3. Метод минимакса — еще один значимый способ решения игр с нулевой суммой, разработанный задолго до того, как Нэш сформулировал концепцию равновесия в играх с ненулевой суммой. Для того чтобы его применить, необходимо исходить из предположения, что независимо от того, какую стратегию выберет игрок, его соперник сделает такой выбор, который обеспечит этому игроку худший выигрыш от данной стратегии. В случае каждой игры с нулевой суммой, найденной в упражнении S2, используйте метод минимакса для поиска равновесных стратегий игры, выполнив следующие действия:
a) Для каждой стратегии, соответствующей строке таблицы, запишите минимальный выигрыш Ровены (худшее, что может с ней сделать Колин в данном случае). Для каждой стратегии, отображенной в столбце таблицы, запишите минимальный выигрыш Колина (худшее, что может с ним сделать Ровена в данном случае).
b) Для каждого игрока определите стратегию (или стратегии), которая обеспечивает ему лучший из этих худших выигрышей. Это и есть стратегия минимакса каждого игрока.
(Поскольку в данном случае речь идет об игре с нулевой суммой, наилучшие ответы игроков действительно подразумевают сведение выигрышей друг друга к минимуму, а значит, эти стратегии минимакса и есть равновесиями Нэша. Джон фон Нейман доказал существование минимаксного равновесия в играх с нулевой суммой в 1928 году, за двадцать лет до того, как Нэш обобщил эту теорию.)
S4. Найдите все равновесия Нэша в чистых стратегиях в следующих играх с ненулевой суммой. Опишите шаги, которые вы при этом предприняли.
a)
b)
c)
d)
S5. Проанализируйте следующую таблицу игры:
a) Есть ли доминирующая стратегия у Ровены либо у Колина? Объясните, почему есть или нет.
b) Используйте метод итеративного исключения доминируемых стратегий, чтобы как можно больше уменьшить игру. Опишите порядок выполнения такого исключения стратегий и представьте урезанную форму игры.
c) Разрешима ли эта игра по доминированию? Объясните, почему да или нет.
d) Найдите в ней равновесие (или равновесия) Нэша.
S6. «Если у игрока есть доминирующая стратегия в игре с одновременными ходами, значит, он наверняка получит самый лучший исход». Это утверждение истинно или ложно? Обоснуйте свой вывод и приведите пример игры, иллюстрирующий ваш ответ.
S7. Пожилой даме нужна помощь, чтобы перейти улицу. Для этого достаточно одного человека; не имеет смысла привлекать больше людей. Мы с вами находимся поблизости и можем помочь, причем одновременно должны решить, стоит ли это делать. Каждый из нас получит удовольствие с выигрышем 3 единицы, если все разрешится благополучно (независимо от того, кто ее переведет). Однако именно тому, кто непосредственно поможет даме, это обойдется в 1 единицу — такова ценность нашего времени, потраченного на оказание помощи. Если никто из игроков не оказывает помощь, выигрыш каждого будет равен нулю. Сформулируйте эту ситуацию в виде игры. Составьте таблицу выигрышей и найдите равновесия Нэша в чистых стратегиях.
S8. В университете решают, что построить — новую лабораторию или новый театр в кампусе. Факультет естественных наук предпочел бы новую лабораторию, а гуманитарных ратует за театр. Однако финансирование проекта (вне зависимости от того, каким он будет) возможно только в случае единодушной поддержки всего преподавательского состава университета. При возникновении разногласий ни один проект не получит дальнейшего продвижения и оба факультета останутся без нового здания и с наихудшим выигрышем. Собрания двух отдельных групп преподавателей, на которых решается вопрос о поддержке проекта, проходят одновременно, а выигрыши представлены в следующей таблице:
a) Каковы равновесия Нэша в чистых стратегиях в этой игре?
b) Какая из игр, представленных в данной главе, больше всего напоминает эту игру? Объясните логику своих рассуждений.
S9. Предположим, два участника игрового шоу, Алекс и Боб, каждый по отдельности выбирают двери с номерами 1, 2, 3. Оба игрока получают призы, если их выбор совпадает, как показано в следующей таблице:
a) Каковы равновесия Нэша в этой игре? Какое из них (при его наличии) скорее всего приведет к (фокальному) исходу игры? Обоснуйте свой вывод.
b) Рассмотрите несколько измененную игру, в которой варианты выбора — снова просто числа, но две ячейки таблицы с выигрышами 15, 15 теперь содержат выигрыши 25, 25. Какой ожидаемый (средний) выигрыш каждого игрока, если каждый из них подбросит монету, чтобы решить, выбрать вариант 2 или 3? Лучше ли это фокусировки на том, чтобы оба выбрали 1 в качестве фокального равновесия? Как вам следует учитывать риск того, что Алекс может сделать одно, а Боб — другое?
S10. У Марты три сына: Артуро, Бернардо и Карлос. Она находит разбитую лампу посреди гостиной и понимает, что это сделал кто-то из сыновей. На самом деле виновник произошедшего Карлос, но Марта об этом не знает. Она заинтересована скорее в том, чтобы выяснить истину, а не наказать ребенка, поэтому предлагает сыновьям сыграть в следующую игру.
Каждый из них напишет на листе бумаги свое имя, а также слова: «Да, это я разбил лампу» либо «Нет, я не разбивал лампу». Если хотя бы один ребенок признается, что разбил лампу, Марта даст по 2 доллара (обычную сумму карманных денег) каждому, кто скажет, что разбил лампу, и 5 долларов тому, кто будет утверждать, что не делал этого. Если все три сына откажутся сознаваться, ни один из них не получит карманных денег (то есть каждый получит 0 долларов).
a) Составьте таблицу игры. Пусть Артуро соответствует строка таблицы, Бернардо — столбец, а Карлосу — страница.
b) Найдите все равновесия Нэша в этой игре.
c) В этой игре множество равновесий Нэша. Какое из них вы назвали бы фокальной точкой?
S11. Рассмотрите игру, в которой на кону стоит приз в размере 30 долларов. В ней три участника — Ларри, Керли и Мо. Каждый из них может купить (или нет) билет стоимостью 15 или 30 долларов. Игроки делают выбор одновременно и независимо друг от друга. Затем, собрав информацию о решениях игроков по поводу покупки билетов, организатор игры присуждает приз. Если никто не купит билет, приз не присуждается. В противном случае приз вручается тому, кто купил самый дорогой билет, если такой человек всего один, и делится поровну между двумя или тремя игроками, если они купили самые дорогие билеты по одной цене. Представьте эту игру в стратегической форме, включив в нее Ларри в качестве игрока, которому соответствуют строки, Керли — столбцы, а Мо — страницы. Найдите все равновесия Нэша в чистых стратегиях.
S12. Анна и Брюс намерены взять напрокат фильм, но не могут решить, какой именно. Анна хочет комедию, в Брюс — драму. Они решают сделать выбор случайным образом, сыграв в игру «чет или нечет». На счет три каждый из них выбрасывает один или два пальца. Если сумма пальцев представляет собой четное число, побеждает Энн и они берут напрокат комедию, если нечетное, то выигрывает Брюс и они смотрят драму. Каждый игрок получает выигрыш 1 за победу и 0 за проигрыш в игре «чет или нечет».
a) Нарисуйте таблицу игры «чет или нечет».
b) Покажите, что в этой игре нет равновесия Нэша в чистых стратегиях.
S13. В фильме «Игры разума» Джон Нэш и трое его коллег по магистратуре, придя в бар, сталкиваются с дилеммой. В баре находятся четыре брюнетки и одна блондинка. Каждый молодой человек хочет подойти и привлечь внимание одной из девушек. Выигрыш каждого за блондинку составляет 10, за брюнетку — 5, а если кто-то вообще останется без девушки, то 0. Проблема в том, что, если сразу несколько парней подойдут к блондинке, она отвергнет их всех, после чего брюнетки тоже их отвергнут, поскольку не хотят быть вторыми в очереди. Таким образом, каждый игрок получит выигрыш 10 только в случае, если окажется единственным претендентом на внимание блондинки.
a) Сначала упростите ситуацию, заменив четырех парней двумя, и проанализируйте ее. (В баре две брюнетки и одна блондинка, но девушки просто реагируют на действия парней вышеописанным образом и не являются активными участницами игры.) Составьте таблицу выигрышей для этой игры и найдите все равновесия Нэша в чистых стратегиях, присутствующие в ней.
b) Теперь постройте трехмерную таблицу для случая, когда в игре участвуют три молодых человека (а также три брюнетки и одна блондинка, которые не являются активными игроками). Снова найдите в ней равновесия Нэша.
c) Не прибегая к таблице, назовите все равновесия Нэша для изначальной ситуации.
d) (дополнительное упражнение). Используйте результаты, полученные в пунктах а, b и c, чтобы обобщить анализ на ситуацию, когда в игре участвуют n молодых людей. Не пытайтесь строить n-мерную таблицу выигрышей, просто вычислите выигрыш одного игрока в случае, если k других игроков выберут блондинку и (n — k — 1) выберут брюнетку, при k = 0, 1… (n — 1). Может ли исход, указанный в фильме в качестве равновесия Нэша (когда все молодые люди подойдут к брюнеткам), быть действительно равновесием Нэша в данной игре?
Упражнения без решений
U1. Найдите все равновесия Нэша в чистых стратегиях для представленных ниже игр. Сначала проверьте таблицу игры на наличие доминирующих стратегий. Если таковых нет, решите игру посредством итеративного исключения доминируемых стратегий.
a)
b)
c)
b)
U2. Для каждой из четырех игр, представленных в упражнении U1, определите, это игра с нулевой или с ненулевой суммой. Объясните логику своих рассуждений.
U3. Как и в , используйте метод минимакса для поиска равновесий Нэша в играх с нулевой суммой, найденных в упражнении U2.
U4. Найдите все равновесия Нэша в чистых стратегиях в следующих играх. Опишите шаги, которые вы при этом предпринимали.
a)
b)
c)
b)
U5. Используйте метод последовательного исключения доминируемых стратегий для решения следующей игры. Опишите шаги, которые вы для этого предприняли. Покажите, что ваше решение представляет собой равновесие Нэша.
U6. Найдите все равновесия Нэша в чистых стратегиях для следующей игры. Опишите процесс, который вы при этом использовали. Объясните на примере данной игры, почему важно описывать равновесие с применением стратегий, выбранных игроками, а не только выигрышей, полученных в таком равновесии.
U7. Проанализируйте следующую таблицу игры:
a) Проставьте недостающие выигрыши в таблице таким образом, чтобы у Колина была доминирующая стратегия. Укажите, какая стратегия доминирующая, и объясните почему. (Обратите внимание: существует много в равной степени правильных ответов.)
b) Проставьте недостающие выигрыши в таблице таким образом, чтобы ни у одного игрока не было доминирующей стратегии, но при этом у каждого была доминируемая стратегия. Укажите, какие стратегии доминируемые, и объясните почему. (В этом случае тоже существует много в равной степени правильных ответов.)
U8. Битва в море Бисмарка (по названию моря в юго-западной части Тихого океана, отделяющего архипелаг Бисмарка от Папуа — Новой Гвинеи) представляла собой морское сражение между Соединенными Штатами и Японией во время Второй мировой войны. В 1943 году японский адмирал получил приказ провести конвой кораблей в Новую Гвинею. Ему предстояло сделать выбор между дождливым северным маршрутом и более солнечным южным, каждый из которых требовал трех дней плавания. Американцы знали об отплытии конвоя и хотели послать вслед за ним бомбардировщики, но им не было известно, по какому пути отправится конвой. Американцам пришлось послать самолеты-разведчики на поиски конвоя, но их хватало только на изучение одного маршрута за один раз. И американцам, и японцам приходилось принимать решения, не имея никакой информации о планах другой стороны.
Если бы конвой оказался на маршруте, который американцы исследовали первым, они сразу же послали бы туда бомбардировщики, в противном случае они потеряли бы день. Кроме того, плохая погода на северном маршруте тоже затрудняла бомбардировку. Если бы американцы изучили северный маршрут и сразу же обнаружили японцев, они могли бы рассчитывать только на два (из трех) благоприятных дня для бомбардировки; если бы при изучении северного маршрута они обнаружили, что японцы ушли на юг, они тоже могли бы рассчитывать на два дня бомбардировки. Если бы американцы решили сначала исследовать южный маршрут, они могли бы рассчитывать на три полных благоприятных дня для бомбардировки, если бы обнаружили японцев сразу же, и только на один день, если бы увидели, что японцы предпочли северный маршрут.
a) Представьте эту игру в виде таблицы игры.
b) Определите в ней все доминирующие стратегии и вычислите равновесие Нэша.
U9. Двух игроков, Джека и Джилл, поместили в разные комнаты. Затем каждому из них объяснили правила игры. Каждый должен выбрать одну из шести букв: G, K, L, Q, R и W. Если случится так, что оба выберут одну и ту же букву, они получат призы по следующей схеме.
При выборе разных букв каждый игрок получит 0. Всю эту схему доводят до сведения игроков, и обоим говорят, что они оба знают эту схему.
a) Составьте таблицу этой игры. Каковы равновесия Нэша в чистых стратегиях?
b) Может ли одно из равновесий быть фокальной точкой? Какое? Почему?
U10. Три подруги (Джулия, Кристин и Лариса) независимо друг от друга идут покупать платья для выпускного бала. В магазине каждая девушка видит только три платья, которые достойны внимания: черное, бледно-лиловое и желтое. Более того, каждая девушка готова утверждать, что двух ее подруг тоже заинтересовал бы именно этот набор платьев, поскольку у всех троих примерно одинаковые вкусы.
Каждая девушка хотела бы надеть на выпускной бал единственное в своем роде платье, поэтому для нее полезность платья равна 0, если она купит одинаковое платье с кем-то из подруг. Все трое знают, что Джулия однозначно отдаст предпочтение черному перед бледно-лиловым и желтым цветом, поэтому она получила бы полезность 3, если бы была единственной девушкой в черном платье, и полезность 1, если бы только у нее было платье бледно-лилового или желтого цвета. Точно так же все трое знают, что Кристин нравится бледно-лиловый цвет и только во вторую очередь желтый, поэтому ее полезность составила бы 3, если бы только она надела бледно-лиловое платье, 2 — желтое и 1 — черное. И наконец, всем известно, что Лариса обожает желтый, а затем черный, поэтому она получила бы 3, если бы выбрала желтое платье, 2 — черное и 1 — бледно-лиловое.
a) Составьте таблицу для этой игры с участием трех игроков. Пусть Джулии соответствуют строки таблицы, Кристин — столбцы, Ларисе — страницы.
b) Определите все доминируемые стратегии в игре или объясните причину их отсутствия.
c) Каковы равновесия Нэша в чистых стратегиях в этой игре?
U11. Брюс, Колин и Дэвид собираются в доме Дэвида в пятницу вечером, чтобы поиграть в «Монополию». Все трое любят есть суши во время игры. По предыдущему опыту они знают, что двух порций суши вполне достаточно, чтобы утолить голод. Если они закажут меньше двух порций, то останутся голодными и не получат удовольствия от вечера, заказывать больше двух порций тоже не имеет смысла, поскольку они столько не съедят и третья порция испортится. Их любимый ресторан Fishes in the Raw упаковывает суши в такие большие контейнеры, что один человек может купить максимум одну порцию. Ресторан Fishes in the Raw предлагает суши навынос, но, к сожалению, не осуществляет доставку.
Предположим, полезность достаточного количества суши составляет для каждого игрока 20 долларов, а недостаточного — 0 долларов. Каждому игроку, который забирает заказ суши, это обходится в 10 долларов.
К сожалению, друзья забыли договориться о том, кто будет покупать суши в эту пятницу, и у них нет мобильных телефонов, поэтому они должны независимо друг от друга решить, покупать суши (П) или нет (Н).
a) Опишите эту игру в стратегической форме.
b) Найдите все равновесия Нэша в чистых стратегиях.
c) Какое равновесие вы назвали бы фокальной точкой? Объясните логику своих рассуждений.
U12. Роксанна, Сара и Тед очень любят печенье, но в упаковке осталось только одно. Никто не хочет делить его на части, поэтому Сара предлагает сыграть в следующий вариант игры «чет или нечет» (см. ), для того чтобы определить, кто съест печенье. На счет три каждый игрок выбрасывает один или два пальца, затем игроки их суммируют и делят сумму на 3. Если остаток 0, печенье достается Роксанне, если 1, то Саре, а если 2, то Теду. Каждый из игроков получает выигрыш 1, если победит (и съест печенье), и 0 в противном случае.
a) Представьте эту игру с тремя участниками в форме таблицы, где Роксанне соответствуют строки, Саре — столбцы, Теду — страницы.
b) Найдите все равновесия Нэша в чистых стратегиях. Можно ли назвать эту игру справедливым способом поделить печенье? Объясните, почему да или нет.
U13 (дополнительное упражнение). Постройте матрицу выигрышей для игры с двумя участниками, удовлетворяющей следующим требованиям. Во-первых, у каждого игрока должно быть три стратегии. Во-вторых, в игре не должны отсутствовать доминирующие стратегии. В-третьих, игра не должна быть разрешима методом минимакса. В-четвертых, в игре должно быть ровно два равновесия Нэша в чистых стратегиях. Составьте матрицу игры, а затем продемонстрируйте, что все перечисленные выше условия соблюдены.
Глава 5. Игры с одновременными ходами: непрерывные стратегии, анализ и обсуждения
* * *
В обсуждение фокусировалось на играх с одновременными ходами, в которых каждый игрок мог делать выбор из дискретного множества действий. К дискретным стратегическим играм данного типа относятся спортивные соревнования, позволяющие использовать только небольшое количество вариантов игры в заданной ситуации, скажем пенальти в футболе, когда игрок может выбирать, куда послать мяч: высоко или низко, в угол или в центр ворот. Другие примеры включают в себя координационные игры и игры под общим названием «дилемма заключенных», в которых в распоряжении игроков только две или три стратегии. Такие игры можно проанализировать с помощью таблицы игры, по крайней мере в ситуациях с приемлемым количеством участников и доступных действий.
Однако многие игры с одновременными ходами отличаются от тех, которые мы рассматривали до сих пор, тем, что их участникам приходится выбирать стратегии из широкого диапазона возможных вариантов. Игры, в которых производители выбирают цены на свои продукты, благотворители — суммы пожертвований, а подрядчики — размер заявки на участие в проекте, — все это примеры игр, в которых участники имеют практически бесконечное множество вариантов выбора. Сугубо формально цены и другие суммы в долларах все же можно выразить в минимальных единицах, таких как цент, а значит, на самом деле речь идет о конечном и дискретном множестве стратегий ценообразования. Однако на практике эта единица настолько мала, что, если бы мы допустили подобную дискретность, каждому игроку пришлось бы иметь дело с таким большим количеством дискретных стратегий, что это сделало бы таблицу игры нереально огромной. Поэтому гораздо проще и эффективнее рассматривать эти варианты выбора как непрерывно меняющиеся действительные числа. Когда у игроков столь широкий диапазон доступных действий, таблицы игр становятся фактически бесполезны в качестве инструмента анализа, оказываясь слишком громоздкими для практического применения. Для таких игр нужен иной метод решения. В первой части данной главы мы представим аналитические инструменты для решения игр с непрерывными стратегиями.
В этой главе также рассматриваются некоторые более широкие вопросы, связанные с поведением в играх с одновременными ходами и концепцией равновесия Нэша. В частности, эмпирические данные о ведении игр в соответствии с равновесием Нэша, собранные в ходе как лабораторных экспериментов, так и наблюдений за реальными жизненными ситуациями. Кроме того, представлен ряд теоретических критических замечаний в отношении концепции равновесия Нэша, а также приведены аргументы против подобной критики. Еще вы увидите, что прогнозы, составленные на основе теории игр, во многих случаях целесообразно (с некоторыми оговорками) использовать в качестве отправной точки для понимания фактического поведения.
1. Чистые стратегии, представляющие собой непрерывные переменные
В мы сформулировали метод анализа наилучших ответов для поиска всех равновесий Нэша в чистых стратегиях в играх с одновременными ходами. Теперь расширим его на игры, в которых у каждого игрока — непрерывный диапазон вариантов выбора, например при установлении компанией цен на свою продукцию. Чтобы вычислить наилучшие ответы в игре такого типа, мы должны найти для каждого возможного значения цены одной компании значение цены другой компании, которое будет для нее лучшим (максимизирует ее прибыль). Непрерывность множества стратегий позволяет нам использовать алгебраические формулы для того, чтобы продемонстрировать, как стратегии обеспечивают выигрыши, а также показать наилучшие ответы в виде линий на графике, где на осях координат отображена цена (или любая другая непрерывная стратегия) каждого из игроков. При таком способе представления игры равновесие Нэша находится в месте пересечения линий на графике. Мы разовьем эту идею и метод на примере двух историй.
А. Ценовая конкуренция
Наша первая история происходит в маленьком городке под названием Яппи-Хейвен, в котором есть два ресторана: Xavier’s Tapas Bar и Yvonne’s Bistro. Чтобы упростить ситуацию, будем исходить из предположения, что в каждом ресторане используется стандартное меню. Владельцы Xavier’s и Yvonne’s должны установить цены на блюда в своих меню; при этом цель каждого из них, чтобы эти цены обеспечивали максимальную прибыль (выигрыш в этой игре). Мы также полагаем, что рестораны печатают меню порознь, не зная о ценах друг друга, стало быть, это игра с одновременными ходами. Поскольку цены могут принимать любое значение в пределах (почти) бесконечного диапазона, начнем с введения общих или алгебраических обозначений, затем найдем правила наилучших ответов и используем их для решения игры и определения равновесных цен. Обозначим цену ресторана Xavier’s как P x а Yvonne’s как P y .
При определении цены каждый ресторан должен просчитать последствия с точки зрения прибыли. Для того чтобы упростить задачу, мы ставим два ресторана в условия симметричной зависимости, но читатели с развитыми математическими навыками могут выполнить аналогичный анализ, воспользовавшись более общими величинами или даже алгебраическими символами. Допустим, обслуживание одного клиента обходится каждому ресторатору в 8 долларов. Предположим также, что опыт или исследования рынка показывают, что, если цена ресторана Xavier’s P x , а Yvonne’s P y , количество клиентов, Q x и Q y соответственно (в сотнях клиентов в месяц) задается уравнениями
Q x = 44 — 2 P x + P y ,
Q y = 44 — 2 P y + P x .
Основная идея этих уравнений состоит в том, что, если один ресторан повысит цену на 1 доллар (скажем, Yvonne’s повысит P y на один доллар), его объем продаж сократится на 200 в месяц (Q y уменьшится на 2), а объем продаж другого ресторана увеличится на 100 в месяц (Q x увеличится на 1). Можно предположить, что 100 клиентов ресторана Yvonne’s перейдут к Xavier’s, а еще 100 останутся дома.
Обозначим прибыль ресторана Xavier’s за неделю (в сотнях долларов в неделю) символом πх (греческая буква π [ «пи»] — традиционный экономический символ для обозначения прибыли). Эта прибыль рассчитывается как произведение чистого дохода на одного клиента (цена за вычетом затрат на обслуживание, или Р х — 8) и количества обслуженных клиентов:
π x = ( P x — 8) Q x = ( P x — 8) (44 — 2 P x + P y ).
Умножив и перегруппировав члены в правой части предыдущего выражения, можем записать прибыль как функцию повышающихся степеней Р х :
π x = — 8(44 + P y ) + (16 + 44 + P y ) P x — 2( P x ) 2 = — 8(44 + P y ) + (60 + P y ) P x — 2( P x ) 2 .
Xavier’s устанавливает цену Р х , чтобы максимально увеличить свой выигрыш. Делая это для каждого возможного уровня цены ресторана Yvonne’s P y , мы получим правило наилучших ответов ресторана Xavier’s, которое можно отобразить на графике.
В такой форме можно представить многие простые иллюстративные примеры, в которых одно действительное число (такое как цена) выбирается для максимального увеличения другого, зависимого от него действительного числа (например, прибыль или выигрыш). В приложении к этой главе описан простой общий метод выполнения операции максимизации; вы найдете немало случаев его применения. Здесь же мы просто приводим формулу.
Функция, которую мы хотим максимизировать, задается следующим общим уравнением:
Y = A + BX–CX 2 .
Мы использовали обозначение Y для величины, которую нужно максимизировать, и X для величины, которую хотим выбрать, чтобы максимизировать Y. В нашем конкретном примере прибыль πx будет представлена в виде Y, а цена P х в виде X. Точно так же, хотя в любой конкретной задаче члены приведенного выше уравнения А, В и С были бы известны, мы обозначили их общими алгебраическими символами, с тем чтобы наша формула была применима ко множеству аналогичных задач. (Формальный термин, которым обозначаются члены А, В и С, — параметры, или алгебраические константы.) Поскольку большинство случаев практического применения подразумевают наличие неотрицательных значений X, таких как цены, а также максимизацию значения Y, необходимо, чтобы выполнялось условие В > 0 и С > 0. Тогда формула, позволяющая выбрать X для максимизации Y с учетом известных значений А, В и С, будет выглядеть так: Х = В/2С. Обратите внимание, что А в ней отсутствует, хотя это, безусловно, влияет на полученное в результате значение Y.
Сравнив общую функцию в уравнении выше и конкретный пример функции прибыли в игре в ценообразование на предыдущей странице, получим
В = 60 + P y и С = 2.
Следовательно, цена, которую выберет ресторан Xavier’s для максимального увеличения прибыли, будет удовлетворять формуле В/2С и составит
P х = 15 + 0,25 P y .
Это уравнение определяет значение P х , при котором прибыль ресторана Xavier’s будет максимальной при соответствующем значении цены ресторана Yvonne’s P y . Иными словами, это и есть то, что нам нужно: правило наилучшего ответа ресторана Xavier’s.
Правило наилучшего ответа ресторана Yvonne’s можно найти аналогичным способом. Поскольку затраты на обслуживание клиентов и объемы продаж двух ресторанов полностью симметричны, очевидно, что это уравнение будет иметь такой вид:
P у = 15 + 0,25 P х .
Оба правила используются одним и тем же способом для построения графиков наилучших ответов. Например, если Xavier’s назначит цену 16, то Yvonne’s введет это значение в свое правило наилучшего ответа, чтобы найти P у = 15 + 0,25 (16) = 19; точно так же наилучший ответ ресторана Xavier’s на значение цены ресторана Yvonne’s P у = 16 составляет P х = 19, наилучший ответ каждого ресторана на цену другого 4 равен 16, на цену 8 — 17 и т. д.
На рис. 5.1 приведены графики этих двух правил наилучшего ответа. В силу особенностей нашего примера (линейная зависимость между объемом продаж и назначенными ценами, а также постоянные издержки на приготовление каждого блюда) оба графика наилучших ответов представляют собой прямые линии. При других характеристиках спроса и затрат они могут не быть прямыми линиями, но метод их построения тот же, а именно: сначала зафиксировать цену одного ресторана (скажем, P у ), а затем найти значение цены другого ресторана (например, P х ), которая максимизирует прибыль второго ресторана, и наоборот.
Рис. 5.1. Графики наилучших ответов и равновесия в игре «ценообразование в ресторанах»
Точка пересечения двух графиков наилучшего ответа — это равновесие Нэша в игре в ценообразование между двумя ресторанами. Она представляет пару цен (по одной на каждую компанию), которые являются наилучшими ответами друг на друга. Конкретные значения для равновесной стратегии ценообразования каждого ресторана можно вычислить алгебраически, решив два правила наилучших ответов относительно P x и P y . Мы намеренно выбрали такой пример, чтобы уравнения были линейными и легко решаемыми. В данном случае мы просто подставим формулу для P x в формулу для P y и получим следующее уравнение:
P y = 15 + 0,25 P х = 15 + 0,25(15 + 0,25 P y ) = 18,75 + 0,0625 P y .
Последнее уравнение можно упростить до P y = 20. Ввиду симметричности задачи не составит труда найти, что P x = 20. Таким образом, в равновесном состоянии каждый ресторан назначит цену 20 долларов на блюда в своем меню и получит 12 долларов прибыли на каждых 2400 клиентов (2400 = (44 — 2 × 20 + 20) × 100), которых обслуживает за месяц, что обеспечит общий объем прибыли 28 800 долларов в месяц.
Б. Некоторые экономические аспекты олигополии
Мы привели пример с ценообразованием в ресторанах, чтобы показать, как найти равновесие Нэша в игре, где стратегии представляют собой непрерывные переменные, такие как цены. Однако эту ситуацию целесообразно проанализировать более детально и объяснить кое-какие экономические аспекты стратегий ценообразования и прибыли при конкуренции между небольшим количеством компаний (в данном случае двух). На языке экономики такую конкуренцию называют «олигополия», от греческих слов, означающих «малое количество продавцов».
Для начала обратите внимание, что график наилучшего ответа каждой компании наклонен вверх. В частности, если один ресторан поднимает цену на 1 доллар, наилучший ответ другого ресторана — поднять цену на 0,25 доллара, или 25 центов. Когда один ресторан повышает цену, некоторые его клиенты переходят в другой ресторан, а это означает, что его конкурент может получить прибыль за счет новых клиентов посредством частичного повышения цены. Таким образом, ресторан, поднимающий цену, помогает конкуренту увеличить прибыль. В случае равновесия Нэша, при котором каждый ресторан назначает цену независимо от другого и исходя исключительно из собственной прибыли, он не учитывает дополнительное преимущество, которое создает для другого ресторана. Могут ли они объединить усилия и договориться о повышении цен, тем самым увеличив свою прибыль? Да. Предположим, два ресторана установили цены по 24 доллара каждый; стало быть, каждый из них получит 16 долларов прибыли на каждого из 2000 клиентов (2000 = (44 — 2 × 24 + 24) × 100), которых ресторан обслуживает за месяц, следовательно, общий объем прибыли составит 32 000 долларов в месяц.
Эта игра в ценообразование в точности такая же, как и дилемма заключенных, рассмотренная в , но теперь стратегии носят непрерывный характер. В истории из у мужа и жены было искушение предать друг друга и признаться в совершении преступления в полиции, однако, сделав это, оба бы получили более длинные тюремные сроки (худшие исходы игры). Аналогично более прибыльная цена 24 доллара не является равновесием Нэша. Каждый из ресторанов, произведя расчеты, попытается предложить клиентам более низкую цену. Предположим, Yvonne’s начнет с цены 24 доллара. Воспользовавшись формулой наилучших ответов, можно определить, что Xavier’s при этом установит цену 15 + 0,25 × 24 = 21. Далее Yvonne’s отреагирует своим наилучшим ответом: 15 + 0,25 × 21 = 20,25. В случае продолжения этого процесса цены обоих ресторанов сведутся к равновесию Нэша, то есть к 20 долларам.
Но какая цена выгоднее для обоих ресторанов? При наличии симметрии допустим, что оба заведения назначат одну и ту же цену Р. Тогда прибыль каждого ресторана равна:
π x = π y = ( P — 8) (44 — 2 P + P ) = ( P — 8) (44 — P ) = — 352 + 52 P — P 2 .
Оба могут выбрать Р для максимизации формулы. Воспользовавшись уравнением, представленным в , мы видим, что решение: Р = 52/2 = 26. Полученная в результате прибыль каждого ресторана составит 32 400 долларов в месяц.
На языке экономики соглашение о повышении цен до уровня, оптимального для обеих сторон, называется картелем. Высокие цены наносят ущерб потребителям, поэтому органы государственного регулирования США обычно пытаются предотвратить образование картелей и заставить компании конкурировать друг с другом. Явный сговор по поводу цен находится вне закона, но негласный сговор все же может иметь место в повторяющейся дилемме заключенных (мы проанализируем повторяющиеся игры такого рода в ).
Сговор необязательно приводит к повышению цен. В нашем примере, если один ресторан снизит цену, его объем продаж увеличится отчасти потому, что он переманит некоторых клиентов от конкурента, поскольку продукты (блюда) двух ресторанов взаимозаменяемы. В других контекстах две компании могут продавать взаимодополняющие продукты, скажем программное и аппаратное обеспечение. В этом случае, если одна из них снижает цену, объем продаж в обеих компаниях возрастает. При равновесии Нэша, когда две фирмы действуют независимо друг от друга, они не учитывают выгоду, которую принесло бы обеим снижение цен. Следовательно, они поддерживают цены на более высоком уровне, чем если бы координировали свои действия. Сотрудничество между такими компаниями привело бы к снижению цен, что было бы выгодно и клиентам.
Конкуренция не всегда подразумевает использование цен в качестве стратегических переменных. Например, рыболовные флотилии могут конкурировать за более крупный улов. В таком случае имеет место конкуренция по количеству, а не по цене, рассмотренная в данном разделе. Мы опишем конкуренцию по количеству чуть ниже, а также в нескольких упражнениях, размещенных в конце главы.
В. Политическая реклама
Наш второй пример взят из политики. Он требует немного больше математических выкладок, чем мы обычно используем, но мы объясним интуитивные идеи, лежащие в их основе, с помощью слов и графиков.
Рассмотрим выборы с участием двух партий или двух кандидатов. Каждая сторона пытается отнять голоса избирателей у другой стороны посредством рекламы — либо позитивных рекламных объявлений, подчеркивающих достоинства самой партии или кандидата, либо негативной рекламы, сфокусированной на недостатках соперника. Для простоты будем исходить из предположения, что изначально избиратели не владеют никакой информацией и не отдают предпочтения ни одной из партий, поэтому формируют свое мнение исключительно под влиянием рекламы. (Многие сказали бы, что это точное описание американской политики, но более продвинутые исследования в области политологии подтверждают тот факт, что информированные, стратегически мыслящие избиратели все же существуют. Мы проанализируем их поведение более подробно в .) Для того чтобы упростить ситуацию еще больше, допустим, что доля избирателей, голосующих за партию, равна доле партии в общей сумме расходов на рекламу избирательной кампании. Назовем партии или кандидатов Л и П; если Л тратит на рекламу x миллионов долларов, а П — y миллионов долларов, то Л получит долю x / (x + y) голосов, а П — у / (x + y) голосов. Читатели, заинтересовавшиеся этой областью практического применения теории игр, найдут более общее описание соответствующих методов в специальной литературе по политологии.
Сбор средств на оплату такой рекламы требует определенных затрат; к их числу относятся деньги на рассылку писем и телефонные звонки; время и труд кандидатов, партийных лидеров и активистов; будущее политическое вознаграждение для лиц, сделавших крупные пожертвования, а также возможные политические издержки в случае, если такое вознаграждение станет достоянием гласности и повлечет за собой скандал. Для простоты анализа предположим, что все эти затраты пропорциональны прямым затратам на проведение кампании х и у. В частности, допустим, что выигрыш партии Л оценивается как процент голосов за вычетом расходов на рекламу: 100x (x + y) — x. Аналогичным образом выигрыш партии П составляет: 100у / (x + y) — у.
Теперь можем определить наилучшие ответы. Поскольку это нельзя сделать без вычислений, выведем математическую формулу, а затем объясним ее общий смысл на интуитивном уровне. Для заданной стратегии х партии Л партия П выбирает стратегию у, чтобы максимизировать свой выигрыш. Условие первого порядка можно найти, зафиксировав значение х и приравняв производную от 100у / (x + y) — у по у к нулю. В итоге получим уравнение 100x / (x + y)2 — 1 = 0, или
. На рис. 5.2 показан график этой функции, а также аналогичный график функции наилучшего ответа партии Л, а именно
.
Рис. 5.2. Наилучшие ответы и равновесие Нэша в игре «политическая реклама»
Посмотрите на кривую наилучших ответов партии П. По мере роста значения переменной x партии Л значение переменной у партии П сначала немного повышается, а затем снижается. Если другая партия размещает мало рекламных материалов, то реклама первой партии обеспечит высокую отдачу в виде голосов избирателей, поэтому на незначительное увеличение расходов другой партии на рекламу целесообразно ответить еще более существенным увеличением собственных расходов на рекламу в целях усиления конкуренции. Однако если другая партия уже вкладывает в рекламу солидные средства, то реклама первой партии обеспечит мизерную отдачу по отношению к затратам на нее, поэтому лучше ответить на повышение рекламных расходов другой партии сокращением собственных расходов.
Оказывается, кривые наилучших ответов двух партий пересекаются в точках максимума. Опять же, некоторые алгебраические манипуляции с уравнениями этих двух кривых позволяют получить точные величины равновесных значений x и y. Вы можете убедиться, что в данном случае значение каждой из переменных x и y равно 25, или 25 миллионов долларов. (Предполагается, что речь идет о выборах в Конгресс; выборы в Сенат и президентские выборы обходятся в наши дни гораздо дороже.)
Как и в игре в ценообразование, здесь мы имеем дело с дилеммой заключенных. Если обе партии сократят расходы на рекламу в равной пропорции, это никак не повлияет на долю голосов избирателей, но при этом обе партии сэкономят на расходах, а значит, получат более крупный выигрыш. В отличие от картеля производителей взаимозаменяемых продуктов (который поддерживает высокие цены и наносит ущерб потребителям), соглашение между политиками о сокращении объема рекламы, по всей вероятности, принесло бы пользу избирателям и обществу в целом, подобно тому как картель производителей взаимодополняющих продуктов привел бы к снижению цен и выгоде потребителей. Из решения данной дилеммы заключенных извлекли бы пользу все. В действительности Конгресс уже несколько лет пытается это сделать и даже ввел частичные ограничения, однако политическая конкуренция слишком ожесточенная для того, чтобы обеспечить полное или длительное разрешение этой дилеммы.
Но что если партии находятся в несимметричных ситуациях? Тогда может возникнуть асимметрия двух типов. Одна партия (скажем, П) может иметь возможность размещать рекламу по более низкой цене, поскольку у нее есть доступ к средствам массовой информации. Или рекламные расходы партии П могут быть эффективнее, чем у партии Л, — например, доля голосов Л может составлять x / (x + 2y), тогда как доля голосов П — 2y / (x + 2y).
В первом случае партия П использует свой более дешевый доступ к рекламе, выбирая более высокий уровень расходов y для любого заданного значения x партии Л; иными словами, кривая наилучших ответов на смещается вверх. Равновесие Нэша смещается вверх и направо вдоль неизменной кривой наилучших ответов партии Л. Таким образом, в итоге партия П потратит на рекламу больше, а партия Л меньше, чем раньше. Это сродни ситуации, когда побеждающая сторона как будто «играет мускулами», а проигрывающая как будто сдается перед таким натиском.
Во втором случае кривые наилучших ответов обеих партий смещаются в соответствии с более сложной схемой. В итоге обе несут равные расходы на рекламу, но меньше 25, как в симметричной ситуации. В нашем примере, где эффективность рекламных расходов партии П в два раза превышает эффективность расходов партии Л, это приводит к тому, что объем расходов каждой партии составляет 200 / 9 = 22,2 < 25. (Следовательно, именно в симметричной ситуации наблюдается самая острая конкуренция.) Если рекламные расходы партии П более эффективны, верно также и то, что в связи с характером асимметричности кривых наилучших ответов новое равновесие Нэша вместо точек максимума этих двух кривых расположено на нисходящей части кривой наилучших ответов партии Л и восходящей части кривой наилучших ответов партии П. Иными словами, хотя обе партии тратят на рекламу одинаковую сумму, объем рекламных расходов партии П, находящейся в более благоприятных условиях, превышает сумму, вызывающую максимальный ответ партии Л, а объем рекламных расходов более слабой партии Л меньше суммы, способной вызвать максимальный ответ партии П. В конце данной главы приведено дополнительное упражнение (U12 ), которое позволит студентам с более высоким уровнем математических знаний вывести эти результаты.
Г. Общий метод поиска равновесий Нэша
Хотя стратегии (цены или расходы на политическую рекламу) и выигрыши (прибыль и доля голосов избирателей) в предыдущих двух примерах связаны с конкуренцией между компаниями или политическими партиями, данный метод поиска равновесия Нэша в игре с непрерывными стратегиями абсолютно универсален и вы можете использовать его для решения других подобных игр.
Предположим, игроки следуют под номерами 1, 2, 3, …. Обозначим их стратегии как х, у, z, … в этом порядке, а выигрыши — соответствующими заглавными буквами X, Y, Z, …. В общем случае выигрыш каждого игрока является функцией выбора всех игроков; отметим соответствующие функции как F, G, H, … На основании этой информации об игре составим выигрыши и запишем их так:
X = F ( x, y, z , …), Y = G ( x, y, z , …), Z = H ( x, y, z , …).
Если использовать этот общий формат для описания нашего примера с ценовой конкуренцией между двумя игроками (компаниями), то стратегии x и y становятся ценами P x и P y . Выигрыши X и Y — это прибыль πx и πy . Функции F и G — квадратичные функции вида
π x = –8(44 + P y ) + (16 + 44 + P y ) P x — 2( P x ) 2 .
Аналогичная формула есть для πy .
Согласно общему подходу, игрок 1 рассматривает стратегии игроков 2, 3, … как не поддающиеся его контролю и выбирает свою стратегию так, чтобы максимально увеличить собственный выигрыш. Следовательно, для каждого заданного множества значений y, z, … выбор игроком 1 значения х максимизирует X = F (x, y, z, …). При использовании дифференциального исчисления условие такой максимизации состоит в том, что производная от X по х при постоянном значении y, z, … (это частная производная) равна нулю. Для особых функций существуют простые формулы, подобные приведенной выше и использованной для квадратичной функции. И даже если алгебраические формулировки или исчисление слишком сложны, есть немало компьютерных программ, которые составят для вас таблицы или построят графики наилучших ответов. Какой бы метод вы ни применили, вы можете найти уравнение оптимального выбора игроком 1 значения x при заданных значениях y, z, …, описывающее функцию наилучшего ответа игрока 1. Аналогичным способом можно найти функции наилучших ответов всех остальных игроков.
Функции наилучших ответов соответствуют числу стратегий в игре и могут быть решены одновременно при условии, что стратегические переменные рассматриваются как неизвестные величины. Это решение и есть равновесие Нэша, которое мы ищем. В одних играх может быть множество решений, обеспечивающих множество равновесий Нэша, в других решение может отсутствовать, что требует дальнейшего анализа, например включения смешанных стратегий.
2. Критический анализ концепции равновесия Нэша
Хотя равновесие Нэша — важнейшая концепция решения игр с одновременными ходами, оно стало объектом ряда теоретических критических замечаний. В данном разделе мы кратко рассмотрим некоторые из них, а также приведем контраргументы, подкрепляя каждый примером. Отдельные критические замечания противоречат друг другу; есть и подлежащие опровержению при более тщательном анализе игр. Некоторые утверждают, что сама концепция равновесия Нэша неполная, и предлагают дополненные или расширенные концепции с более эффективными свойствами. Мы сформулируем в данном разделе одну из таких альтернатив и укажем еще на несколько в последующих главах. Мы убеждены, что наши объяснения помогут вам заново обрести, хотя и с оговорками, уверенность в целесообразности применения концепции равновесия Нэша. Однако определенные серьезные сомнения остаются неразрешенными, и это говорит о том, что теорию игр пока еще нельзя назвать окончательно сформировавшейся наукой. Но даже этот факт должен воодушевить начинающих специалистов по теории игр, поскольку открывает перед ними широкое поле для новых идей и исследований. Неразвивающаяся наука — мертвая наука.
Давайте начнем с анализа основного фактора привлекательности концепции равновесия Нэша. Большинство игр в этой книге относятся к категории некооперативных, то есть тех, в которых игроки действуют независимо друг от друга. Следовательно, было бы естественно предположить, что если действие игрока нельзя назвать лучшим согласно его системе ценностей (шкале выигрышей) в контексте действий других игроков, то он изменит его. Иными словами, весьма заманчиво предположить, что действие каждого игрока будет представлять собой наилучший ответ на действия остальных игроков. Равновесие Нэша обладает именно таким свойством «одновременных наилучших ответов»; собственно говоря, это и есть его определение. При любом предполагаемом исходе, не являющемся равновесием Нэша, минимум один игрок мог бы добиться более выгодных для себя результатов, переключившись на другое действие.
Такие соображения заставили нобелевского лауреата Роджера Майерсона возразить против критических замечаний в адрес равновесия Нэша, основанных на интуитивной привлекательности использования другой стратегии. В качестве контрдовода Майерсон просто переложил бремя доказывания на критика. «Когда меня спрашивают, почему участники игры должны вести себя так, как предписывает равновесие Нэша, — сказал он, — мой любимый ответ — спросить “Почему бы нет?” и предоставить сомневающемуся возможность предложить свой вариант того, что, по его мнению, должны делать игроки. Если этот вариант не является равновесием Нэша, тогда… мы можем продемонстрировать, что он бы свел к нулю собственную обоснованность, если бы игроки считали его точным описанием поведения друг друга».
А. Решение проблемы риска в равновесии Нэша
Некоторые критики утверждают, что концепция равновесия Нэша не уделяет должного внимания риску. В ряде игр можно найти стратегии, отличающиеся от стратегий равновесия Нэша тем, что они более безопасны, а значит, было бы целесообразнее выбрать именно их. Мы предлагаем два примера игр такого типа. Автор первого — профессор экономики Калифорнийского университета в Беркли Джон Морган; таблица этой игры представлена на рис. 5.3.
Рис. 5.3. Игра со спорным равновесием Нэша
Анализ наилучших ответов позволяет быстро определить, что в этой игре есть единственное равновесие Нэша, а именно сочетание стратегий А, А, обеспечивающее выигрыши 2, 2. Но вы, как и многие другие участники экспериментов, проведенных Морганом, можете подумать, что стратегия С весьма привлекательна по двум причинам. Во-первых, она гарантирует тот же выигрыш, что и при равновесии Нэша, то есть 2, тогда как, выбрав стратегию из равновесия Нэша А, вы получите выигрыш 2, только если другой игрок тоже выберет А. Зачем же идти на такой риск? Более того, если вы считаете, что другой игрок также может прибегнуть к подобному логическому обоснованию целесообразности выбора стратегии С, то вы совершили бы серьезную ошибку, предпочтя стратегию А, поскольку в таком случае вы получите выигрыш 0, тогда как могли бы получить 2, применив стратегию С.
Майерсон ответил на это так: «Не спешите. Если вы действительно считаете, что другой игрок рассуждает подобным образом и выберет стратегию С, то вам следует применить стратегию В, чтобы получить выигрыш 3. А если вы думаете, что другой игрок тоже так думает и выберет стратегию В, тогда вашим наилучшим ответом на стратегию В была бы стратегия А. А если вы полагаете, что другой игрок также это поймет, вы должны выбрать свой наилучший ответ на А, то есть стратегию А. Вот мы и вернулись к равновесию Нэша!» Как видите, критика в адрес равновесия Нэша и аргументы против нее — уже сами по себе нечто вроде интеллектуальной игры, причем довольно интересной.
Второй, еще более впечатляющий пример сформулировал экономист Стэнфордской бизнес-школы Дэвид Крепс. Таблица игры приведена на рис. 5.4. Прежде чем приступить к ее теоретическому анализу, вы должны представить, что действительно играете в нее в качестве игрока А. Какое из двух действий вы выбрали бы?
Рис. 5.4. Катастрофическое равновесие Нэша?
Запомните свой ответ на заданный выше вопрос, и продолжим анализ игры. Начав с поиска доминирующих стратегий, мы увидим, что у игрока А их нет, а у игрока Б есть. Выбор стратегии «налево» гарантирует игроку Б выигрыш 10, что бы ни сделал игрок А, тогда как в случае выбора стратегии «направо» (также при любых действиях игрока А) он получит выигрыш 9,9. Следовательно, игрок Б должен играть «налево». При условии, что игрок Б предпочтет «налево», игроку А лучше выбрать «вниз». Единственное равновесие Нэша в чистых стратегиях в этой игре — «вниз»/«налево», при таком ее исходе каждый участник получит выигрыш 10.
Проблема здесь в том, что многие (хотя и не все) люди, играющие роль игрока А, не выбирают стратегию «вниз». (А что выбрали вы?) Так поступают как те, кто много лет изучает теорию игр, так и те, кто никогда не слышал об этом предмете. Если у игрока А есть какие-либо сомнения по поводу выигрыша игрока Б или его рациональности, то для него гораздо безопаснее выбрать стратегию «вверх», чем равновесную стратегию «вниз». Но что если бы игрок А считал, что выигрыши совпадают с тем, что показано на , а в действительности выигрыши игрока Б были бы совсем другими: выигрыш 9,9 соответствовал бы стратегии «налево», а выигрыш 10 — стратегии «направо»? Что если бы значение 9,9 было приближенным, а на самом деле точный выигрыш составлял бы 10,1? Что если бы у Б была совсем иная система ценностей или на самом деле он не относится к числу рациональных игроков и мог бы выбрать «неправильное» действие просто ради забавы? Очевидно, что наши исходные предположения о совершенной информации и рациональности действительно могут играть важную роль в процессе анализа, используемого нами при изучении стратегии. Колебания относительно игроков могут изменить те равновесия, наличие которых мы предсказали бы при обычных условиях, а также поставить под сомнение корректность концепции равновесия Нэша.
Однако реальная проблема со многими такого рода примерами не в том, что концепция равновесия Нэша неприемлема, а в том, что эти примеры иллюстрируют ее неподобающе упрощенным способом. Если в приведенном выше примере есть какие-то сомнения в выигрышах игрока Б, то этот факт должен стать неотъемлемой частью анализа. Если игрок А не знает выигрышей игрока Б, значит, это игра с асимметричной информацией (мы ее сможем обсудить только в ). Но в данном примере представлена сравнительно простая игра такого типа, и мы можем без особого труда проанализировать ее равновесие.
Предположим, игрок А полагает, что существует вероятность p того, что выигрыши игрока Б при выборе стратегий «налево» и «направо» противоположны выигрышам, представленным на ; следовательно, (1 — p) — это вероятность того, что выигрыши игрока Б соответствуют информации на рисунке. Поскольку игрок А вынужден действовать, не зная фактических выигрышей игрока Б, он должен применить свою стратегию как «наилучшую в среднем». В данном примере расчеты достаточно просты, так как в каждом случае у игрока Б есть доминирующая стратегия; единственная проблема для игрока А — то, что в двух разных случаях у игрока Б разные доминирующие стратегии. С вероятностью (1 — p) доминирующая стратегия игрока Б — «налево» (случай, показанный на рисунке), а с вероятностью p его доминирующая стратегия — «направо» (противоположный случай). Таким образом, если игрок А выберет «вверх», то с вероятностью (1 — p) он будет играть против Б, применившего «налево», а значит, получит выигрыш 9; с вероятностью p игроку А предстоит вступить в игру с игроком Б, выбравшим «справа», и, стало быть, он получит выигрыш 8. Итак, статистическое, или взвешенное по вероятности среднее значение выигрыша игрока А при выборе стратегии «вверх» составляет 9(1 — p) + 8p. Аналогично статистическое, или взвешенное по вероятности, среднее значение выигрыша игрока А при использовании стратегии «вниз» равно 10(1 — p) — 1000p. Следовательно, для игрока А предпочтительнее стратегия «вверх», если
9(1 — p ) + 8 p > 10(1 — p ) — 1000 p , или p > 1 / 1009.
Таким образом, при наличии даже малейшей вероятности того, что выигрыши игрока Б противоположны выигрышам на , игроку А лучше выбрать стратегию «вверх». В данном случае правильно выполненный анализ, основанный на рациональном поведении, не противоречит ни интуитивным догадкам, ни экспериментальным данным.
При выполнении этих вычислений мы исходили из предположения, что, столкнувшись с неопределенностью в отношении выигрышей, игрок А рассчитает их статистическое среднее значение в случае различных действий и выберет действие, обеспечивающее самое высокое среднестатистическое значение выигрыша. Это неявное допущение хотя и соответствует цели данного примера, но сопряжено с определенными проблемами. Например, оно подразумевает, что человек, столкнувшийся с двумя ситуациями, в одной из которых он выиграет или проиграет 10 долларов с вероятностью 50 на 50, а в другой выиграет 10 001 доллар и проиграет 10 000 долларов с той же вероятностью, должен выбрать вторую ситуацию, поскольку она обеспечивает среднестатистический выигрыш в размере 50 центов (1/2 × 10 001 — 1/2 × 10 000), тогда как первая принесет нулевой выигрыш (1/2 × 10 — 1/2 × 10). Однако многие сочли бы, что вторая ситуация гораздо рискованнее, а потому предпочли бы первую. Решить эту проблему достаточно легко. В показано, как создание нелинейной шкалы выигрышей, соответствующих денежным суммам, позволяет человеку, принимающему решение, предусмотреть как риск, так и прибыль. А в продемонстрировано, как можно использовать эту концепцию для того, чтобы понять, как люди реагируют на риск в своей жизни — например, разделяют его с другими или покупают страховку.
Б. Множественность равновесий Нэша
Еще одно критическое замечание в адрес концепции равновесия Нэша строится на наблюдении, что во многих играх присутствует множество равновесий Нэша, а значит, данная концепция неспособна определить исходы игры достаточно точно для того, чтобы давать однозначные прогнозы. Данный аргумент не требует от нас отказа от концепции равновесия Нэша, а скорее подразумевает, что при необходимости получить однозначный прогноз на основании нашей гипотезы мы должны включить некий критерий, который поможет нам решить, какое именно из множества равновесий Нэша выбрать.
В мы изучили много координационных игр со множеством равновесий. Из всех этих равновесий игроки могут выбрать одно в качестве фокальной точки при наличии у них общих социальных, культурных или исторических знаний. Рассмотрим координационную игру, в которую сыграли студенты Стэнфордского университета. За одним игроком закрепили Бостон, за другим — Сан-Франциско. Затем каждому студенту вручили список из девяти американских городов (Атланта, Чикаго, Даллас, Денвер, Хьюстон, Лос-Анджелес, Нью-Йорк, Филадельфия и Сиэтл) и попросили выбрать подмножество городов. Оба делали выбор одновременно и независимо друг от друга и могли получить приз только при условии, что их выбор приведет к формированию двух непересекающихся подмножеств городов. Несмотря на наличие 512 других равновесий Нэша, если оба студента были американцами или гражданами США, довольно долго прожившими в стране, более чем в 80 процентах случаев они выбирали единственное равновесие по географическому принципу. Студент, за которым был закреплен Бостон, указывал все города к востоку от Миссисипи, а студент, которому соответствовал Сан-Франциско, — все города к западу от Миссисипи. Вероятность такой координации существенно снижалась, когда один или оба студента не были гражданами США. Тогда выбор порой делался в алфавитном порядке, но с гораздо меньшим уровнем координации по той же точке раздела.
Характеристики самой игры в сочетании с общим культурным опытом могут способствовать сходимости ожиданий. В качестве еще одного примера множественности равновесий рассмотрим игру, в которой два игрока одновременно и независимо друг от друга записывают, какую долю от 100 долларов каждый из них хотел бы получить. Если сумма указанных ими чисел не превышает 100 долларов, каждый игрок получает то, что записал, если превышает, оба ничего не получают. Равновесие Нэша наблюдается в случае, если при любом значении x один игрок напишет x, а другой — (100 — x). Следовательно, в этой игре есть практически бесконечный диапазон равновесий Нэша. Однако на практике фокальной точкой чаще всего становится вариант 50 на 50. Данная социальная норма равенства или справедливости, кажется, насколько глубоко укоренилась, что стала почти инстинктивной: игроки, выбирающие 50 долларов, утверждают, что это очевидный ответ. Для того чтобы это действительно была фокальная точка, это не только должно быть очевидно для всех, но каждый должен знать, что это очевидно для всех, и все должны знать, что… Иными словами, такая очевидность должна быть общим знанием. Но так бывает далеко не всегда, что подтверждает ситуация, в которой один игрок — женщина из просвещенного, эгалитарного общества, считающая очевидным разделение 50 на 50, а другой — мужчина из патриархального общества, убежденный, что о каком бы дележе ни шла речь, мужчина должен получить в три раза больше женщины. В этом случае оба сделают то, что очевидно для нее и для него, и останутся ни с чем, поскольку очевидное решение для каждого из них не будет очевидным в качестве общего знания для обоих.
Фокальная точка часто возникает в результате случайного стечения обстоятельств, а создание фокальных точек там, где их на самом деле нет, — своего рода искусство, требующее пристального внимания к историческому и культурному контексту игры, а не просто ее математического описания. Это беспокоит многих специалистов по теории игр, которые предпочли бы, чтобы исход игры зависел исключительно от ее абстрактного описания: игроки и их стратегии должны быть определены числами безо всяких внешних ассоциаций. Мы с этим не согласны. На наш взгляд, исторический и культурный контекст так же важен для игры, как и ее сугубо математическое описание, и если он помогает выбрать уникальный исход игры из множества равновесий Нэша, то это, безусловно, плюс.
В мы покажем, что игры с последовательными ходами могут иметь множество равновесий Нэша. Там же введем условие о достоверности, позволяющее выбрать конкретное равновесие; как оказалось, в его качестве выступает, по сути, равновесие обратных рассуждений, о котором рассказывалось в . В более сложных играх с асимметричностью информации или иными трудностями вводятся другие ограничения под названием уточнения, позволяющие идентифицировать и исключить из рассмотрения в некотором роде бессмысленные равновесия Нэша. В мы рассмотрим один процесс подобного уточнения, выбирающий исход под названием совершенное байесовское равновесие. Обоснование такого уточнения зачастую имеет свою специфику в играх определенного типа; оно оговаривает, как игроки должны обновлять свою информацию, наблюдая за действиями других игроков. Каждая такая оговорка чаще всего абсолютно уместна в своем контексте, поэтому во многих играх не так уж трудно исключить большинство равновесий Нэша, а значит, и снизить неоднозначность прогнозирования.
Тогда как в одних играх может быть слишком много равновесий Нэша, в других они могут отсутствовать вообще. Мы приводили пример подобной игры в , а также уточнили, что равновесие Нэша можно восстановить, расширив концепцию стратегии на случайные комбинации стратегий. В мы объясним и проанализируем равновесия Нэша в смешанных стратегиях. На более высоких уровнях теории игр существуют и более сложные примеры игр, в которых равновесия Нэша нет и в смешанных стратегиях. Однако такая дополнительная сложность не имеет отношения к рассматриваемым в данной книге типам анализа и областям применения, поэтому мы не будем затрагивать здесь эту тему.
В. Требования рациональности в равновесии Нэша
Как вы уже знаете, равновесие Нэша можно рассматривать как систему стратегических вариантов выбора каждого игрока, а также его убеждений в отношении выбора других игроков. В случае равновесия 1) выбор каждого игрока должен обеспечивать ему лучший выигрыш с учетом его убеждения в отношении выбора других игроков; 2) убеждение каждого игрока должно быть правильным, то есть его фактический выбор должен быть именно таким, каким он должен быть, по его твердому убеждению. Такова естественная интерпретация требований о взаимной согласованности рационального выбора отдельных игроков. Если у всех игроков есть общее знание того, что они рациональны, то как может один из них иметь рациональные убеждения в отношении выбора других игроков, не соответствующие рациональной реакции на его собственные действия?
Для того чтобы изучить этот вопрос, рассмотрим игру три на три, представленную на рис. 5.5. Анализ наилучших ответов позволяет быстро определить, что в ней всего одно равновесие Нэша, а именно R2, C2, обеспечивающее выигрыш 3, 3. В этом равновесии Строка выбирает вариант R2, исходя из убеждения, что Столбец сыграет C2. Почему Строка в этом убеждена? Потому что она знает Столбца как рационального игрока, но в то же время она должна считать, что Столбец убежден в ее выборе варианта R2 по той причине, что вариант С2 не будет его наилучшим выбором, если бы он полагал, что Строка сыграет либо R1, либо R3. Таким образом, суть этого утверждения состоит в том, что убеждения, полученные в результате рационального процесса формирования, должны быть правильными.
Рис. 5.5. Обоснование выбора посредством цепочки убеждений и ответных действий
Проблема такой аргументации состоит в том, что она ограничена одним циклом рассуждений об убеждениях. Продолжив их, мы можем обосновать и другие комбинации вариантов выбора. Например, можно рационально обосновать выбор Строкой варианта R1. Для этого отметим, что R1 — лучший выбор Строки в случае, если она убеждена, что Столбец сыграет С3. Почему Строка в этом убеждена? Потому что уверена, что Столбец убежден в том, что она выберет R3. Строка обосновывает это убеждение, считая, что Столбец убежден в том, что Строка убеждена в том, что Столбец сыграет С1, будучи убежденным в том, что Строка предпочтет вариант R1, будучи, в свою очередь, убежденной в том, что… Каждое звено этой цепочки убеждений абсолютно рационально.
Таким образом, рациональность сама по себе не объясняет равновесия Нэша. Существуют более сложные доводы такого рода, действительно позволяющие обосновать особый вид равновесия Нэша, при котором игроки могут поставить свои стратегии в зависимость от поддающегося наблюдению инструмента рандомизации (случайного выбора). Однако мы оставим эту тему для более углубленного изучения и сформулируем в следующем разделе более простую концепцию, отражающую то, что логически вытекает из общего знания игроков только об их рациональности.
3. Рационализация
Какие стратегические варианты выбора в играх можно обосновать, исходя исключительно из рациональности? В матрице игры на мы можем объяснить любую пару стратегий, по одной на каждого игрока, посредством применения той же логики, что и в . Иными словами, можем обосновать любую из девяти возможных комбинаций. Следовательно, рациональность в чистом виде не позволяет нам сократить совокупность вероятных исходов игры или вообще спрогнозировать их. Присуще ли это всем играм? Нет. Например, если стратегия доминируемая, ее можно исключить из рассмотрения на основе одной только рациональности. А когда игроки осознают, что их соперники, будучи рациональными, не выберут доминируемые стратегии, исходя из такого общего знания можно выполнить итеративное исключение доминируемых стратегий. Лучшее ли это из доступных действий? Нет. Можно продолжить дальнейшее исключение стратегий, воспользовавшись несколько более сильным свойством, чем доминируемость в чистых стратегиях. Оно определяет стратегии, которые не могут быть наилучшим ответом. Стратегии, оставшиеся после такой процедуры исключения, называются рационализируемыми, а сама концепция — рационализацией.
Зачем вводить эту дополнительную концепцию, и что она нам дает? Что касается первого вопроса, полезно знать, насколько можно сузить совокупность возможных исходов игры на основании одной лишь рациональности игроков, не прибегая к правильности ожиданий относительно фактического выбора игрока. Иногда можно определить, что игрок не выберет то или иное действие или действия, даже если нельзя вычислить, какое именно действие он все же выберет. Ответ на второй вопрос зависит от контекста. Порой рационализация вообще не позволяет сократить совокупность исходов игры. Именно так было в примере три на три, представленном на . Подчас рационализация позволяет это сделать только до определенной степени, но не до равновесия Нэша, если оно в игре всего одно, или не до совокупности равновесий Нэша, если их в игре несколько. Примером такой ситуации может служить расширенный до матрицы четыре на четыре предыдущий пример, который рассматривается в ниже. Иногда сокращение совокупности возможных исходов игры приводит к определению единственного равновесия Нэша, причем в подобных случаях мы имеем его более веское обоснование, опирающееся исключительно на рациональность, без предположений о правильности ожиданий. Ниже в представлен пример игры с конкуренцией по количеству, в котором аргументация на основе концепции рационализации позволяет найти в ней единственное равновесие Нэша.
А. Применение концепции рационализации
Рассмотрим игру на рис. 5.6, аналогичную той, что приведена на , но с дополнительной стратегией на каждого игрока. Как отмечалось выше, девять комбинаций стратегий, в которые входит одна из первых трех стратегий для каждого из игроков, можно обосновать посредством цепочки убеждений игроков в отношении убеждений друг друга. Это верно и в увеличенной матрице. Но подходит ли такой способ для стратегий R4 и C4?
Рис. 5.6. Рационализируемые стратегии
Может ли Строка исходить из убеждения, что Столбец выберет стратегию C4? В его основе должны лежать убеждения Столбца в отношении выбора Строки. Могут ли они сделать стратегию С4 наилучшим ответом Столбца? Нет. Если Столбец полагает, что Строка сыграет R2, его наилучший ответ С2. Если Столбец считает, что Строка предпочтет R3, то его наилучший ответ С3. А если Столбец убежден, что Строка выберет R4, тогда его наилучший ответ либо С1, либо С3. Следовательно, С4 не может быть наилучшим ответом Столбца. Это означает, что Строка, зная о рациональности Столбца, ни в коем случае не припишет ему выбор стратегии С4. Стало быть, Строка не должна исходить из убеждения, что Столбец сыграет С4.
Обратите внимание, что хотя стратегия С4 не может быть наилучшим ответом, она не является доминируемой по отношению к стратегиям С1, С2 и С3. Для Столбца она предпочтительнее стратегии С1 против стратегии Строки R3, предпочтительнее стратегии С2 против стратегии Строки R4 и предпочтительнее стратегии С3 против стратегии Строки R1. Если стратегия все же доминируемая, она тоже не может быть наилучшим ответом. Таким образом, «стратегия, которая не может быть наилучшим ответом», — более общая концепция, чем «доминируемая стратегия». Исключение таких стратегий возможно даже тогда, когда исключение доминируемых стратегий невозможно. Следовательно, исключение стратегий, которые не могут быть наилучшим ответом, способно сузить совокупность вероятных исходов игры в большей степени, чем исключение доминируемых стратегий.
Исключение стратегий, которые не могут быть наилучшим ответом, также можно выполнять в итеративном режиме. Поскольку рациональный игрок Строка не может исходить из убеждения, что рациональный игрок Столбец выберет стратегию С4, рациональный игрок Столбец должен это предвидеть. Учитывая, что R4 — наилучший ответ Строки только на стратегию С4, Столбец не должен думать, что Строка сыграет R4. Следовательно, R4 и С4 не могут входить в набор рационализируемых стратегий. Концепция рационализации действительно позволяет сократить совокупность возможных исходов данной игры.
Если в игре есть равновесие Нэша, оно будет рационализируемым и его можно подтвердить посредством простой системы убеждений, состоящей из одного цикла, как в представленном выше . Но в более общем плане, даже если в игре нет равновесия Нэша, она может иметь рационализируемые исходы. Возьмем в качестве примера игру два на два, полученную из игры на или , в которой оставлены только стратегии R1 и R3 для Строки и С1 и С3 для Столбца. Легко увидеть, что в этой игре нет равновесия Нэша в чистых стратегиях. Однако все четыре ее исхода рационализируемы посредством такой же цепочки убеждений, как выстроенная выше и охватывающая эти стратегии.
Таким образом, концепция рационализации представляет собой возможный способ решения игр с отсутствием равновесия Нэша. Что еще более важно, эта концепция подсказывает нам, как сократить совокупность вероятных исходов игры исключительно на основании рациональности.
Б. Рационализация может привести к равновесию Нэша
В некоторых играх итеративное исключение стратегий, которые не могут быть наилучшим ответом, может сократить всю совокупность возможных исходов до равновесия Нэша. Обратите внимание, что мы сказали «может», а не «должно». Но если подобное все же происходит, это очень полезно, поскольку позволяет подкрепить доводы в пользу равновесия Нэша путем утверждения, что оно следует исключительно из рациональных мнений игроков о рассуждениях друг друга. Интересно, что один класс игр, решаемых таким способом, играет важную роль в экономике. К нему относится конкуренция между компаниями при определении количества производимой продукции, когда они знают, что от ее общего объема на рынке зависит цена.
Мы проиллюстрируем игру такого типа в контексте небольшого прибрежного городка. В нем две некие рыбацкие лодки каждый вечер уходят в море, а утром возвращаются с уловом и выставляют его на рынок. Игра разыгрывается во времена, когда еще не было современного холодильного оборудования, поэтому вся рыба должна быть продана и съедена в тот же день. В океане неподалеку от города полно рыбы, поэтому владелец каждой лодки может решать, сколько рыбы поймать за ночь. Но каждый из них также знает, что избыток рыбы на рынке приведет к снижению цен и прибыли.
Предположим, что если одна лодка выставит на рынок R бочек рыбы, а другая S бочек, то цена P (в дукатах за бочку) будет равна P = 60 — (R + S). Допустим также, что две лодки и их команды несколько отличаются по эффективности рыбной ловли: затраты первой лодки на ловлю рыбы составляют 30 дукатов на одну бочку, тогда как второй — 36 дукатов на бочку.
Теперь мы можем записать формулы определения прибыли двух владельцев лодок U и V с учетом их стратегий R и S.
U = [(60 — R — S ) — 30] R = (30 — S ) R — R 2 ,
V = [(60 — R — S ) — 36] S = (24 — R ) S — S 2 .
На основании этих формул выигрышей можно построить кривые наилучших ответов и найти равновесие Нэша. Как и в примере игры с ценовой конкуренцией из , выигрыш каждого игрока представляет собой квадратичную функцию его собственной стратегии при условии неизменности стратегии другого игрока. Следовательно, в данном случае можно применить математические методы, изложенные в данной главы и в .
Наилучший ответ первой лодки R должен максимизировать значение U для каждого заданного значения S другой лодки. При использовании дифференциального исчисления это означает, что мы должны продифференцировать U по R при фиксированном значении S и приравнять производную к нулю, что дает следующее уравнение:
(30 — S ) — 2 R = 0; R = 15 — S / 2.
Подход без дифференциального исчисления использует результат, согласно которому значение R, максимизирующее значение U, равно R = B / (2C), где B = 30 — S, а C = 1. Это дает R = (30 — S) / 2, или R = 15 — S / 2.
Аналогичным образом уравнение наилучшего ответа второй лодки можно найти, выбрав значение S, максимизирующее значение V при каждом фиксированном значении R, что дает следующее значение:
Равновесие Нэша можно найти посредством совместного решения двух уравнений наилучших ответов для R и S, что не так уж трудно сделать, поэтому мы просто приведем результаты. Количество: R = 12, S = 6; цена: P = 42; прибыль: U = 144, V = 36.
На рис. 5.7 представлены графики наилучших ответов двух рыбаков (обозначенные как BR1 и BR2 с указанием соответствующих уравнений), а также равновесие Нэша (обозначенное как N с указанием координат) на пересечении двух линий. Кроме того, на рис. 5.7 также показано, как сократить совокупность убеждений игроков в отношении выбора друг друга посредством итеративного исключения стратегий, которые не могут быть наилучшим ответом.
Рис. 5.7. Поиск равновесия Нэша с помощью рационализации
Какие значения S, по рациональному убеждению владельца первой лодки, выберет владелец второй лодки? Это зависит от того, какой улов, по мнению владельца второй лодки, получит владелец первой лодки. Но каким бы ни был этот улов, наилучшие ответы владельца второй лодки находятся в диапазоне от 0 до 12 бочек. Следовательно, владелец первой лодки не может рационально считать, что владелец второй лодки выберет что-то другое: все отрицательные варианты выбора (что очевидно) и все значения S, превышающие 12 бочек (что менее очевидно), исключаются. Точно так же владелец второй лодки не может рационально считать, что владелец первой лодки выловит рыбы меньше 0 или больше 15 бочек.
Теперь перейдем ко второму циклу рассуждений. Когда владелец первой лодки ограничит варианты выбора значений S владельцем второй лодки диапазоном от 0 до 12 бочек, его собственные варианты выбора значений R будут ограничены диапазоном наилучших ответов на диапазон значений S. Наилучший ответ на S = 0 — это R = 15, а наилучший ответ на S = 12 — это R = 15–12 / 2 = 9. Поскольку график BR1 наклонен вниз, все значения R, допустимые на данном этапе рассуждений, лежат в диапазоне от 9 до 15. Точно так же выбор владельцем второй лодки значений S ограничен диапазоном наилучших ответов на R от 0 до 15, точнее говоря, значениями от S = 12 до S = 12–15 / 2 = 4,5. Эти ограниченные диапазоны значений показаны на на осях координат.
Третий цикл рассуждений сужает диапазоны значений еще больше. Поскольку значение R должно составлять минимум 9, а график BR2 имеет отрицательный наклон, S может быть не более чем наилучшим ответом на 9; в частности, S = 12 — 9 / 2 = 7,5. В ходе второго цикла рассуждений уже было показано, что значение S должно быть как минимум 4,5. Следовательно, теперь значения S ограничены диапазоном от 4,5 до 7,5. Кроме того, так как значение S должно быть не менее 4,5, значение R может составлять не более 15 — 4,5 / 2 = 12,75. Во втором цикле рассуждений мы узнали, что значение R должно равняться минимум 9, а значит, теперь оно ограничено диапазоном от 9 до 12,75.
Эту последовательность циклов рассуждений можно продолжать сколько угодно, но уже сейчас очевидно, что последовательное сужение диапазонов значений двух показателей сводит эти значения к равновесию Нэша, R = 12 и S = 6. Таким образом, равновесие Нэша — единственный исход игры, остающийся после итеративного исключения стратегий, которые не могут быть наилучшим ответом. Мы знаем, что в общем аргументация на основе концепции рационализации не обязательно должна сводить исходы игры к равновесиям Нэша, а значит, это особое свойство данного примера. В действительности этот процесс применим к целому классу игр и позволяет решить любую игру, имеющую единственное равновесие Нэша на пересечении нисходящих кривых наилучших ответов.
Эту аргументацию следует отличать от прежней, основанной на последовательности наилучших ответов. Тогда ход рассуждений выглядел следующим образом. Начнем с любой стратегии одного из игроков, скажем R = 18. В этом случае наилучший ответ другого игрока S = 12–18/2 = 3. Наилучший ответ R на S = 3 — это R = 15 — 3/2 = 13,5. В свою очередь, наилучший ответ S на R =13,5 — 12–13,5/2 = 5,25. Тогда наилучший ответ R против этого значения S составляет R = 15 — 5,25/2 = 12,375. И так далее.
Цепочка рассуждений в прежней аргументации также сходится к равновесию Нэша, но в ней есть один недостаток. Речь идет об игре с одновременными ходами, разыгрываемой только раз. В такой ситуации невозможно, чтобы один игрок отреагировал на выбор другого игрока, после чего первый игрок снова предпринял ответное действие и т. д. Если бы такая динамика игры допускалась, разве игроки не предвидели бы реакцию друг друга и не предприняли бы совсем другие действия?
Аргументация на основе концепции рационализации представляет собой нечто иное. В ней четко учитывается тот факт, что игра проходит только раз и сводится к одновременному выполнению ходов. Все размышления относительно цепочки наилучших ответов выполняются с опережением событий, а все последующие циклы рассуждений и ответных действий носят сугубо концептуальный характер. Игроки реагируют не на фактический выбор, а лишь на расчетные значения того выбора, который так и не будет сделан. Весь процесс протекает исключительно в головах игроков.
4. Эмпирические данные о равновесии Нэша
В , посвященной анализу эмпирических данных об играх с последовательными ходами и методу обратных рассуждений, мы представили данные, полученные в ходе наблюдений за играми, происходящими в реальной жизни, и играми, специально разработанными для проверки теории в лабораторных условиях. Там же мы выделили различные достоинства и недостатки двух методов оценки достоверности прогнозов, полученных посредством поиска равновесия методом обратных рассуждений. Аналогичные вопросы возникают и в связи с получением и интерпретацией эмпирических данных относительно равновесия Нэша в играх с одновременными ходами.
В реальных играх делаются крупные ставки, и в основном в них участвуют опытные игроки, обладающие знаниями и стимулами для применения эффективных стратегий. Но в таких ситуациях присутствует много факторов, выходящих за рамки того, что изучает теория. Например, в реальных играх трудно отслеживать количественные выигрыши, которые получили бы игроки при всех возможных комбинациях стратегий. Поэтому, если их поведение не подтверждает теоретические прогнозы, невозможно определить, обусловлено ли это ошибочностью теории или тем, что какие-то иные факторы превосходят стратегические соображения.
В ходе лабораторных экспериментов эти факторы пытаются учитывать, чтобы обеспечить более точную проверку теории. Но организаторы экспериментов зачастую привлекают неопытных игроков и предоставляют им слишком мало времени и относительно слабые стимулы для изучения игры. Столкнувшись с новой игрой, большинство из нас поначалу с трудом ориентируется в ней и пробует играть бессистемно. По этой причине несколько ее первых раундов в условиях эксперимента могут представлять собой этап обучения, а не равновесие, которое нашел бы в игре опытный игрок. Обычно такую неопытность и обучение учитывают, исключая из рассмотрения данные первых нескольких раундов игры, однако этап обучения может длиться дольше, чем одно утро или вторая половина дня, что зачастую составляет предельную продолжительность лабораторных сеансов.
А. Лабораторные эксперименты
За три прошедших десятилетия ученые провели множество лабораторных исследований в целях проверки поведения людей в определенных интерактивных стратегических ситуациях. В частности, исследователи пытаются найти ответ на вопрос: «Выбирают ли участники игры стратегии равновесия Нэша?» Проанализировав эту работу, Дуглас Дэвис и Чарльз Холт пришли к выводу, что в относительно простых одноходовых играх с единственным равновесием Нэша оно «обретает значительную притягательную силу… после нескольких повторений игры с разными партнерами». Однако успех этой теории носит переменный характер в более сложных ситуациях, например при наличии множества равновесий Нэша, когда эмоциональные факторы выводят выигрыши за пределы оговоренных денежных сумм, когда для поиска равновесия Нэша требуются более сложные расчеты или когда игра повторно проводится с одними и теми же партнерами. Ниже представлен краткий анализ эффективности равновесия Нэша в нескольких подобных ситуациях.
I. Выбор из множества равновесий Нэша. В приведено несколько примеров, показывающих, что иногда фокальные точки помогают игрокам выбрать из множества равновесий Нэша одно. Игрокам не удается скоординировать свои действия в 100 процентах случаев, однако обстоятельства зачастую позволяют им добиться гораздо большей координации действий, чем при случайном выборе из всей совокупности возможных равновесных стратегий. Ниже мы представляем координационную игру с одним интересным свойством: равновесие, обеспечивающее самый высокий выигрыш всем ее участникам, при этом и самое рискованное в том смысле, о котором шла речь выше в .
Джон Ван Хайк, Реймонд Батталио и Ричард Бейл описывают игру с участием 16 игроков, в которой каждый из них одновременно выбирает уровень «усилий» от 1 до 7. Индивидуальные выигрыши зависят от «результата» всей группы, который является функцией от минимального уровня усилий, выбранного любым ее членом, за вычетом затрат на эти усилия. В игре ровно семь равновесий Нэша в чистых стратегиях: любой исход, при котором все игроки выбирают один и тот же уровень усилий, представляет собой равновесие. Максимальный выигрыш (1,30 доллара на одного игрока) будет получен в случае, если все участники игры выберут уровень усилий 7, тогда как минимальный (0,70 доллара на одного игрока) — при выборе всеми игроками уровня усилий 1. Равновесие, обеспечивающее самый высокий выигрыш, — естественный кандидат на роль фокальной точки, но при этом существует риск выбрать самый высокий уровень усилий: если хотя бы один игрок выберет уровень усилий ниже вашего, то ваши дополнительные усилия будут потрачены зря. Например, если вы предпочтете вариант 7 и минимум один игрок вариант 1, вы выиграете всего 0,10 доллара — гораздо меньше, чем в случае наихудшего равновесного выигрыша в размере 0,70 доллара. Это заставляет игроков волноваться по поводу того, выберут ли другие участники игры максимальный уровень усилий; в итоге большим группам, как правило, не удается скоординировать свои действия так, чтобы обеспечить самое выгодное равновесие. Несколько игроков неизбежно выбирают более низкий уровень усилий, и в последующих раундах игра сводится к равновесию с самым низким уровнем усилий.
II. Эмоции и социальные нормы. В в процессе анализа игр с последовательными ходами мы привели несколько примеров более щедрого отношения игроков друг к другу, чем можно было ожидать согласно равновесию Нэша. Подобные наблюдения можно сделать и в играх с одновременными ходами, таких как дилемма заключенных. Одна из причин состоит в том, что выигрыши игроков могут отличаться от тех, из которых исходит экспериментатор: помимо денег, участники игры могут относить к числу выигрышей испытываемые в ходе игры эмоции, такие как сопереживание, гнев или чувство вины. Иными словами, в системе ценностей игроков могли проявиться некоторые социальные критерии, например доброта и справедливость, которые доказали свою значимость в более широком социальном контексте и в силу этого распространяются на их поведение и в экспериментальной игре. С этой точки зрения подобные наблюдения не вскрывают недостатков самой концепции равновесия Нэша, а предостерегают против ее использования при наивных или ошибочных исходных предположениях о том, какие выигрыши важны для людей. Например, было бы ошибкой полагать, что игроки всегда движимы в своих действиях эгоистичной погоней за деньгами.
III. Когнитивные ошибки. Как мы убедились в случае экспериментальных данных по равновесию обратных рассуждений в , игроки не всегда предварительно продумывают всю игру, как и не всегда ожидают этого от других игроков. Поведение участников игры, известной как дилемма путешественников, иллюстрирует подобную ограниченность равновесия Нэша в играх с одновременными ходами. В этой игре оба путешественника во время отпуска покупают одинаковые сувениры, а на обратном пути авиакомпания теряет их багаж. Она сообщает, что намерена возместить им убытки, но ей неизвестна точная сумма ущерба. Авиаперевозчик знает, что правильная сумма должна находиться в пределах от 80 до 200 долларов на человека, поэтому проводит игру по следующей схеме. Каждый игрок может потребовать возмещения убытков в размере от 80 до 200 долларов. Авиакомпания возместит обоим игрокам сумму, которая окажется меньшей из двух заявленных. Кроме того, если они будут разниться, авиакомпания выплатит 5 долларов вознаграждения тому, кто потребовал меньше, и оштрафует на 5 долларов того, кто запросил больше.
При таких правилах игры, независимо от фактической стоимости утерянного багажа, каждый игрок заинтересован назвать более низкую сумму возмещения убытков, чем другой игрок. На самом деле единственное равновесие Нэша и единственный рационализируемый исход этой игры сводится к тому, чтобы оба указали минимальную сумму возмещения — 80 долларов. Однако в условиях эксперимента игроки редко называют 80 долларов, вместо этого требуя возмещения сумм, которые гораздо ближе к 200 долларам. (Как правило, в лаборатории реальные выигрыши исчисляются в центах, а не в долларах.) Интересно, что если размер «штрафвознаграждения» увеличивается в 10 раз, с 5 до 50 долларов, то поведение игроков существенно приближается к равновесию Нэша, а указанная ими сумма ущерба чаще всего составляет около 80 долларов. Таким образом, поведение участников эксперимента в значительной мере зависит от показателя, никак не влияющего на равновесие Нэша: единственное равновесие — это 80 долларов, независимо от суммы штрафа или вознаграждения.
Для объяснения результатов, полученных в лаборатории, Моника Капра и ее коллеги использовали теоретическую модель под названием равновесие квантильных откликов (или просто «квантильное равновесие»), первоначально предложенную Ричардом Маккелви и Томасом Палфри. Математическое описание этой модели выходит за рамки данной книги, но ее основная идея состоит в том, что она допускает возможность совершения ошибок игроками, причем вероятность определенной ошибки гораздо ниже в случае более дорогостоящих ошибок, чем в случае ошибок, незначительно уменьшающих выигрыш. Более того, в этой модели игроки ожидают друг от друга таких ошибок. Как оказалось, анализ квантильных откликов позволяет объяснить приведенные выше данные. Указание большей суммы возмещения убытков обойдется не так уж дорого при размере штрафа 5 долларов, поэтому игроки чаще называют сумму, близкую к 200 долларам, — особенно если знают, что соперники, по всей вероятности, поступят так же, а значит, выигрыш при этом может быть достаточно высоким. С другой стороны, если штраф или вознаграждение составляет 50 долларов вместо пяти, предъявление завышенных требований о возмещения ущерба может обернуться значительными потерями, поэтому игроки вряд ли будут ожидать друг от друга подобных действий. Это ожидание склоняет их в сторону равновесия Нэша, то есть 80 долларов. Благодаря такому успеху квантильное равновесие стало темой активных исследований в области теории игр.
IV. Общее знание о рациональности. Как мы только что увидели, чтобы лучше объяснить результаты экспериментов, модель квантильного равновесия допускает вероятность того, что игроки могут не считать других участников игры в высшей степени рациональными игроками. Еще один способ объяснить данные экспериментов — предположить, что разные игроки строят свои рассуждения на разных уровнях. В стратегической игре на угадывание, часто используемой в аудиториях или лабораториях, каждому участнику предлагают выбрать число от 0 до 100. Как правило, игрокам выдают карточки, на которых они должны написать свое имя и выбранное число, поэтому данная игра относится к категории игр с одновременными ходами. После сбора карточек вычисляется среднее значение указанных чисел. Побеждает тот, чье число окажется ближе всего к оговоренной доле (например, двум третям) от среднего значения. Правила игры (вся описанная выше процедура) объявляются заранее.
Равновесие Нэша в этой игре сводится к выбору каждым игроком числа 0. В действительности игра разрешима по доминированию. Даже если каждый ее участник укажет 100, половина от среднего значения не может превысить 67, поэтому для каждого игрока выбор числа больше 67 доминируемый по отношению к выбору числа 67. Однако это должно быть понятно всем рационально рассуждающим игрокам, а значит, среднее значение не может превышать 67, а две трети от него — 44, поэтому любой выбор числа больше 44 будет доминируемым по отношению к выбору числа 44. Данный процесс итеративного удаления доминируемых стратегий продолжается до тех пор, пока не останется только число 0.
Тем не менее когда группа играет в такую игру впервые, побеждает не тот, кто выбрал число 0. Как правило, выигрышное число попадает в диапазон от 15 до 20. Чаще всего игроки указывают числа 33 и 22, из чего можно сделать вывод, что многие из них выполняют всего один-два цикла итеративного доминирования, не продолжая этот процесс дальше. Иначе говоря, игроки «уровня 1» считают, что все остальные участники игры будут выбирать числа случайным образом, со средним значением 50, поэтому в качестве наилучшего ответа указывают две трети от этого числа, то есть 33. Точно так же игроки «уровня 2» предполагают, что все остальные игроки рассуждают на «уровне 1», поэтому в качестве наилучшего ответа выбирают две трети от 33, или 22. Обратите внимание, что все эти варианты далеки от равновесия Нэша, числа 0. Создается впечатление, что многие игроки иногда выполняют ограниченное количество шагов итеративного исключения доминируемых стратегий по той причине, что ожидают от других игроков ограниченного количества циклов рассуждений.
V. Обучение и движение в сторону равновесия. Что происходит при повторном разыгрывании стратегической игры на угадывание в одной и той же группе игроков? Аудиторные эксперименты показывают, что в ходе каждого очередного раунда выигрышное число может легко уменьшиться на 50 процентов, поскольку студенты ожидают, что все их одногруппники выберут число, не превышающее победившее в предыдущем раунде. Как правило, в третьем раунде выгрышные числа не больше (а то и меньше) 5.
Как следует интерпретировать этот результат? Критики бы заявили, что, если в игре не достигнуто точное равновесие Нэша, это опровергает теорию. Они бы утверждали, что в действительности, если у вас есть все основания полагать, что другие игроки не используют стратегии равновесия Нэша, ваш лучший выбор также не должен быть стратегией равновесия Нэша. Если вы можете определить, как другие игроки будут отклоняться от стратегий равновесия Нэша, то должны выбрать свой наилучший ответ на то, что они, по вашему мнению, предпочтут. Другие бы сказали, что в социальных науках теория не может претендовать на такой же уровень точности прогнозов, что и в таких науках, как физика и химия. Если наблюдаемые исходы игры близки к равновесию Нэша, это и есть подтверждение теории. В данном случае эксперимент не только обеспечивает это подтверждение, но и иллюстрирует процесс, посредством которого люди накапливают опыт и учатся применять стратегии, близкие к равновесию Нэша. Мы склонны согласиться с данной точкой зрения.
Примечательно одно наше наблюдение: люди учатся немного быстрее, следя за игрой со стороны, чем принимая в ней непосредственное участие. Это можно объяснить тем, что как наблюдатели они могут сфокусироваться на игре в целом и использовать аналитическое мышление. А поскольку мозг игроков занят решением задачи собственного выбора, они в меньшей степени способны увидеть более широкую картину.
Мы должны внести ясность в концепцию накопления опыта посредством участия в играх. В цитате Дэвиса и Холта в начале данного раздела говорится о повторении игры с разными партнерами. Иными словами, опыт игры следует накапливать посредством многократного участия в ней, но всякий раз с разными соперниками. Однако для того, чтобы такой процесс обучения обеспечивал исходы игры, максимально приближающиеся к равновесию Нэша, вся совокупность обучающихся игроков должна оставаться неизменной. Если в игре постоянно будут появляться новички, применяющие новые экспериментальные стратегии, исходная группа рискует утратить знания, накопленные в процессе игры друг против друга.
Если игра повторно проводится между двумя игроками или среди небольшой группы одних и тех же игроков, то два любых игрока с большой вероятностью могут неоднократно играть друг с другом. В такой ситуации повторяющаяся игра в целом сама по себе становится игрой. Равновесия Нэша в ней могут отличаться от тех, которые просто дублируют равновесие Нэша в одном раунде игры. Например, в повторяющихся дилеммах заключенных молчаливое сотрудничество может сформироваться как следствие ожиданий того, что любая временная выгода от обмана будет полностью сведена на нет последующей потерей доверия. Если игры повторяются таким способом, то процесс обучения должен включать в себя многократное участие в полных множествах таких повторений, каждый раз против других партнеров.
Б. Реальные игры
В играх, разыгрываемых в естественных условиях, нет стольких возможностей для прямых наблюдений, как в ходе лабораторных экспериментов, но тем не менее наблюдения за пределами лабораторий также позволяют получить ценные доказательства значимости равновесия Нэша. В свою очередь оно зачастую становится для социологов ценной отправной точкой для осмысления реального мира.
I. Области применения равновесия Нэша. Одной из первых областей применения концепции равновесия Нэша по отношению к поведению субъектов реального мира стала сфера международных отношений. Томас Шеллинг первым использовал теорию игр для объяснения таких феноменов, как эскалация гонки вооружений (даже между странами, не имеющими намерения нападать друг на друга) и достоверность сдерживающих угроз. Впоследствии концепцию равновесия Нэша начали применять в этой сфере для решения вопросов о том, когда и как страна может подать достоверный сигнал о своих намерениях в ходе дипломатических переговоров или перед лицом возможной войны. В середине 1970-х теорию игр начали систематически использовать в сфере экономики и бизнеса, и количество областей применения продолжает расти.
Как мы уже говорили в данной главе, ценовая конкуренция — одна из важных областей применения равновесия Нэша. К числу других областей, в которых компаниям приходится делать стратегический выбор, относится качество продукции, инвестиции, научные исследования и разработки и т. д. Кроме того, теория игр помогла нам понять, как и когда компании, присутствующие в отрасли много лет, могут взять на себя достоверные обязательства по сдерживанию новых конкурентов — например, посредством ведения губительной ценовой войны против нового участника рынка. Теоретико-игровые модели, построенные на концепции равновесия Нэша и ее динамических обобщениях, достаточно эффективно обеспечивают необходимыми данными многие крупные отрасли промышленности, в частности автомобилестроение. Кроме того, такие модели позволяют лучше понять основные факторы конкуренции по сравнению с более старыми моделями, исходящими из совершенной конкуренции и оценочных кривых спроса и предложения.
Профессор бизнес-школы IESE в Барселоне Панкадж Гемават представил ряд исследований отдельных компаний или отраслей, подкрепив их статистическим анализом данных. Его теоретико-игровые модели чрезвычайно эффективно улучшают наше понимание нескольких на первый взгляд озадачивающих бизнес-решений по таким вопросам, как ценообразование, производственные мощности, инновации и т. д. Например, в 1970-х компания DuPont нарастила огромный объем производственных мощностей по выпуску диоксида титана. Их избыток превышал прогнозируемый рост мирового спроса на этот продукт на протяжении следующего десятилетия. Поначалу этот выбор казался ужасной стратегией, поскольку избыток мощностей мог повлечь за собой снижение рыночных цен на данный товар. Однако в DuPont с успехом предвидели, что наличие в резерве дополнительных производственных мощностей позволит компании наказывать конкурентов, занижающих цены, увеличивая объем производства и снижая цены еще больше. Это сделало DuPont ценовым лидером в своей отрасли и позволило обеспечить высокую рентабельность. Стратегия оказалась весьма эффективной, и даже 40 лет спустя компания DuPont сохраняет мировое лидерство по производству диоксида титана.
В последнее время теория игр стала самым предпочтительным инструментом изучения политических систем и институтов. Как мы увидим в , она показала, как в погоне за чьими-то целями могут осуществляться стратегические манипуляции в ходе голосования и определения повестки дня в комитетах и на выборах. В четвертой части книги представлены примеры практического применения равновесия Нэша при проведении аукционов, голосований и переговоров. Кроме того, в мы приводим свой учебный пример, посвященный Карибскому ракетному кризису.
Некоторые критики не признают ценности концепции равновесия Нэша, заявляя, что аналогичное объяснение тех же явлений можно получить с помощью уже известных общих экономических принципов, политологии и т. д. Отчасти они правы. Ряд подобных аналитических инструментов существовал еще до появления данной концепции. Например, равновесие во взаимодействии между двумя компаниями, устанавливающими цены, о котором шла речь в данной главы, известно в экономике уже более 100 лет. Равновесие Нэша можно считать общей формулировкой концепции равновесия, применимой ко всем играм. Некоторые теории стратегического голосования сформулированы еще в XVIII столетии, а представления о достоверности можно найти в «Истории Пелопонесской войны» Фукидида. Однако равновесие Нэша позволяет унифицировать все эти области применения, а значит, способствует формированию новых областей.
Кроме того, развитие теории игр обусловило появление огромного количества новых идей и областей применения, не существовавших ранее, например: как возможность нанести второй удар уменьшает страх перед внезапным нападением; как разные правила проведения аукционов влияют на характер предложения цены и доход продавца; как правительства могут успешно манипулировать фискальной и монетарной политикой с тем, чтобы добиться переизбрания даже тогда, когда опытные избиратели знают об этих попытках, и т. д. Если бы все эти задачи можно было решить с помощью ранее известных подходов, это бы уже давно было сделано.
II. Реальные примеры обучения. Напоследок предлагаем вашему вниманию интересный пример равновесия и процесса обучения в реальной игре Главная лига бейсбола. В ней очень высокие ставки, а игроки участвуют более чем в 100 матчах в год, что создает сильную мотивацию и благоприятные возможности для обучения. Стивен Гулд обнаружил следующий замечательный пример. На протяжении большей части XX столетия максимальное значение средних коэффициентов результативности отбивания, зафиксированных на протяжении бейсбольного сезона, неизменно снижалось. Скажем, в прошлом игроки обеспечивали средний коэффициент результативности отбивания 0,400 гораздо чаще, чем сейчас. Почитатели истории бейсбола часто объясняют такое снижение, с ностальгией восклицая: «В те времена были выдающиеся игроки!» Если на секунду задуматься, сразу же возникает вопрос: почему тогда не было выдающихся питчеров, способных удерживать средний коэффициент результативности отбивания на низком уровне? Однако Гулд опровергает подобные доводы посредством более системного подхода, указывая на то, что следует анализировать все значения среднего коэффициента результативности отбивания, а не только самые высокие. В настоящее время худшие показатели далеко не такие низкие, как раньше; кроме того, сейчас в командах Главной лиги гораздо меньше хиттеров со средним коэффициентом результативности отбивания 0,150, чем раньше. Гулд утверждает, что общее сокращение разброса — следствие стандартизации или стабилизации.
Когда бейсбол был очень молодым, методы игры еще не стандартизировались настолько, чтобы это могло помешать проделкам лучших игроков. Вилли Килер мог «бить туда, где никого нет» (и набрать средний коэффициент 0,432 в 1897 году), потому что филдеры еще не знали, где им следует находиться. Постепенно игроки осваивали оптимальные методы расстановки на поле, перемещения по нему, подачи и отбивания мяча — и разброс неизбежно сокращался. Сегодня лучшие игроки столкнулись с настолько отточенным под их собственное совершенство противодействием, что это делает невозможным достижение тех высоких результатов, которые были характерны для времен более бессистемной игры. [Выделено автором.]
Иными словами, посредством непрерывной корректировки стратегий в их противостоянии друг с другом система пришла к своему равновесию (Нэша).
Гулд проанализировал статистику хиттинга за десятилетия, чтобы доказать, что сокращение разброса действительно происходит, за исключением единичных «выбросов». В действительности такие «выбросы» подтверждают эту гипотезу, поскольку происходят вскоре после нарушения равновесия под влиянием внешних изменений. Каждый раз при изменении правил игры (зона страйка увеличивается или уменьшается, уменьшается высота питчерской горки или увеличивается количество команд) или технологии (используется более упругий мяч или наконец разрешат алюминиевые биты) сложившаяся система взаимных наилучших ответов выходит из равновесия. И на какое-то время, пока игроки экспериментируют, разброс значений их показателей увеличивается и некоторые из них добиваются успеха, тогда как другие терпят неудачу. В конечном счете равновесие восстанавливается, а разброс снова сокращается. Именно этого и следует ожидать в рамках обучения и корректировки в сторону равновесия Нэша.
В книге Майкла Льюиса Moneyball (по которой впоследствии был снят фильм «Человек, который изменил все» с Брэдом Питтом в главной роли) приведен похожий пример движения к равновесию в бейсболе, однако вместо акцента на стратегиях отдельных игроков он сосредоточен на административных стратегиях команды в отношении найма игроков. В книге рассказывается о решении главного менеджера команды Oakland Athletics использовать при найме игроков так называемую саберметрику, то есть уделять пристальное внимание бейсбольной статистике, основанной на теории максимизации засчитанных очков за пробежки и минимизации очков, проигранных сопернику. Такие решения подразумевали необходимость обращать больше внимания на недооцененную на рынке способность игроков зарабатывать очки. Считается, что именно эти решения сделали Oakland Athletics очень сильной командой, вышедшей в плей-офф в пяти из семи сезонов, несмотря на то что фонд ее заработной платы был меньше половины фонда заработной платы более богатых команд, таких как New York Yankees. Инновационные стратегии найма игроков и формирования фонда заработной платы впоследствии взяли на вооружение другие команды, в частности Boston Red Sox, которая под руководством Тео Эпштейна разрушила «проклятие Бамбино» в 2004 году, выиграв Мировую серию впервые за 86 лет. На протяжении десятилетия почти в дюжине команд было решено нанять специалиста по саберметрике на полную ставку. В сентябре 2011 года Билли Бин посетовал, что ему снова приходится бороться в невыгодных условиях против более крупных команд, научившихся находить наилучшие ответы на его стратегии. В реальных играх часто внедряются инновации, за которыми следует постепенное схождение к равновесию. Приведенные выше примеры из бейсбола подтверждают этот факт, хотя порой на полное схождение к равновесию могут уйти годы, а то и десятилетия.
Мы рассмотрим дополнительные сведения о других прогнозах, основанных на теории игр, в соответствующих разделах следующих глав. К настоящему моменту представленные выше экспериментальные и эмпирические данные должны выработать у вас осторожный оптимизм по отношению к использованию равновесия Нэша, особенно в качестве первого подхода. В целом мы убеждены, что вы сможете достаточно уверенно применять концепцию равновесия Нэша в случаях многократного проведения игры между игроками, составляющими достаточно устойчивую совокупность, при относительно неизменных правилах и условиях. В случае новой игры или игры, разыгрываемой только один раз, с неопытными игроками, концепцию равновесия следует использовать более осмотрительно; при этом для вас не должен стать неожиданностью тот факт, что исход игры окажется не тем равновесием, на которое вы рассчитали. Но даже тогда вашим первым шагом в процессе анализа игры должен быть поиск равновесия Нэша. Это позволит определить, возможен ли такой исход игры, и если нет, выполнить следующий шаг — выяснить причину. Зачастую она кроется в вашем неправильном понимании целей игроков, а не в их неспособности вести игру правильно с учетом своих истинных целей.
Резюме
Когда участники игры с одновременными ходами могут делать выбор из непрерывного диапазона возможных действий, анализ наилучших ответов приводит к формированию правил наилучших ответов, одновременное решение которых позволит определить стратегии равновесия Нэша. Правила наилучших ответов можно отобразить на графике, на котором пересечение двух линий представляет собой равновесие Нэша. Компании, выбирающие цены или количество из большого диапазона возможных значений, или политические партии, выбирающие объемы рекламных расходов, — примеры игр с непрерывными стратегиями.
Теоретические замечания в адрес концепции равновесия Нэша гласят, что она неадекватно учитывает риск, что от нее мало пользы, поскольку во многих играх присутствует множество равновесий Нэша, и что ее невозможно обосновать только рациональностью. Во многих случаях более полное описание игры и ее структуры выигрышей или уточнение самой концепции равновесия Нэша может привести к составлению более точных прогнозов или уменьшению количества возможных равновесий. Концепция рационализации основана на исключении стратегий, которые не могут быть наилучшим ответом, для получения совокупности рационализируемых исходов. Когда в игре есть равновесие Нэша, этот исход будет рационализируемым, однако рационализация позволяет спрогнозировать равновесные исходы и в играх, где равновесие Нэша отсутствует.
Согласно результатам лабораторных экспериментов с концепцией равновесия Нэша, координация в играх со множеством равновесий Нэша в значительной мере зависит от наличия общего культурного опыта. Повторное проведение некоторых игр показывает, что игроки учатся в процессе накопления опыта и со временем начинают выбирать стратегии, максимально близкие к равновесию Нэша. Кроме того, прогнозы равновесий точны только в случае, если исходные предположения экспериментатора соответствуют истинным предпочтениям игроков. Практическое применение теории игр помогло экономистам и политологам понять ряд важных аспектов поведения потребителей, компаний, избирателей, а также законодательных и правительственных органов.
Ключевые термины
График наилучших ответов
Непрерывные стратегии
Правила наилучших ответов
Равновесие квантильных откликов
Рационализация
Рационализируемые стратегии
Стратегии, которые не могут быть наилучшим ответом
Уточнения
Упражнения с решениями
S1. В игре с политической рекламой, о которой шла речь в , партия Л выбирает рекламный бюджет в размере x (миллионов долларов), а партия П — в размере y (миллионов долларов). Мы показали, что правила наилучших ответов в этой игре таковы:
для партии П и
для партии Л.
a) Каким будет наилучший ответ партии П, если партия Л потратит на рекламу 16 миллионов долларов?
Используйте указанные выше правила наилучших ответов для подтверждения того, что рекламные бюджеты, обеспечивающие равновесие Нэша, составляют: x = y = 25, или 25 миллионов долларов.
S2. В игре с ценообразованием в ресторанах, представленной на , функции потребительского спроса на блюда в ресторанах Xavier’s (Q x ) и Yvonne’s (Q y ) определены как Q x = 44 — 2P x + P y и Q y = 44 — 2P y + P x . Кроме того, прибыль каждого ресторана зависит от затрат на обслуживание каждого клиента. Предположим, ресторану Yvonne’s удастся их сократить до 2 долларов на одного клиента, полностью отказавшись от официантов (клиенты сами выбирают блюда у стойки, а несколько оставшихся работников убирают посуду со столов). Ресторан Xavier’s по-прежнему несет расходы в размере 8 долларов на одного клиента.
a) Вычислите заново правила наилучших ответов и цены в соответствии с равновесием Нэша для этих двух ресторанов с учетом изменения объема затрат.
b) Постройте график двух кривых наилучших ответов и опишите различия между ним и графиком, представленным на . В частности, какая линия сместилась, куда и насколько? Объясните почему.
S3. В Яппи-Тауне два продуктовых магазина: La Boulangerie, который продает хлеб, и La Fromagerie, который торгует сыром. Производство буханки хлеба обходится в 1 доллар, а фунта сыра — в 2 доллара. Если цена La Boulangerie составляет P 1 долларов за буханку хлеба, а La Fromagerie — P 2 доллара за фунт сыра, то их недельные объемы продаж, Q 1 буханок хлеба и Q 2 фунтов сыра, описываются следующими уравнениями:
Q 1 = 14 — P 1 — 0,5 P 2 , Q 2 = 9–0,5 P 1 — P 2 .
a) Запишите прибыль каждого магазина как функцию P 1 и P 2 (в следующих упражнениях мы для краткости будем называть ее функцией прибыли). Затем установите соответствующие правила наилучших ответов. Постройте график кривых наилучших ответов и определите цены, соответствующие равновесию Нэша в этой игре.
b) Предположим, оба магазина вступят в сговор и совместно установят цены, позволяющие максимизировать общую сумму своих прибылей. Определите эти цены.
c) Дайте короткое интуитивное объяснение различий между ценами в случае равновесия Нэша и ценами, максимизирующими общую прибыль. Почему максимизация общей прибыли не является равновесием Нэша?
d) В данной задаче хлеб и сыр — взаимодополняющие продукты. Их часто потребляют вместе; именно поэтому снижение цены одного продукта приводит к увеличению объема продаж другого. В ресторанах из примера, приведенного в , используются взаимозаменяющие продукты. Как это различие объясняет разницу между вашими выводами в отношении правил наилучших ответов, цен в равновесии Нэша и цен, максимизирующих общую прибыль?
S4. В игре на есть единственное равновесие Нэша в чистых стратегиях. Тем не менее все девять ее исходов будут рационализируемыми. Обоснуйте это утверждение, объясняя логику своих рассуждений по каждому исходу.
S5. Перечислите рационализруемые стратегии каждого игрока в игре, представленной в . Объясните логику своих рассуждений.
S6. В данной главы анализируется игра в рыбную ловлю, разыгрываемая в небольшом прибрежном городке. После определения правил наилучших ответов двух лодок можно использовать концепцию рационализации для обоснования равновесия Нэша в данной игре. В ее описании процесс сокращения количества стратегий, которые не могут быть наилучшим ответом, сводится к трем циклам. К третьему циклу мы знаем, что R (количество бочек рыбы, выловленной лодкой 1) должно составлять минимум 9, а S (количество бочек рыбы, выловленной лодкой 2) — минимум 4,5. Процесс сокращения в ходе этого цикла ограничил значения R диапазоном от 9 до 12,75, а значения S — диапазоном от 4,5 до 7,5. Выполните еще один (четвертый) цикл сокращений и покажите полученные к его концу диапазоны значений R и S.
S7. Две тележки для торговли кокосовым молоком (из кокосового ореха) находятся в местах 0 и 1 в одной миле друг от друга на пляже в Рио-де-Жанейро. (На этом пляже кокосовое молоко продают только эти две тележки.) Тележки 0 и 1 назначают цену за каждый кокос p0 и p1 соответственно. Кокосовое молоко покупает тысяча отдыхающих, равномерно распределенных вдоль пляжа между тележками 0 и 1. В течение одного дня, проведенного на пляже, один отдыхающий покупает одну порцию кокосового молока. Помимо цены каждый отдыхающий несет транспортные издержки в размере 0,5 × d2 где d — расстояние (в милях) от его пляжного места до кокосовой тележки. В данной системе тележка 0 продает кокосовое молоко всем отдыхающим, находящимся между точками 0 и x, а тележка 1 — всем отдыхающим между точками x и 1, где x — это местоположение отдыхающего, который платит одну и ту же общую цену, куда бы он ни отправился — к тележке 0 или к тележке 1. В таком случае местоположение точки x описывает следующая формула:
p 0 + 0,5 x 2 = p 1 + 0,5(1 — x ) 2 .
Две тележки установят цены таким образом, чтобы максимизировать свои показатели чистой прибыли B; прибыль зависит от дохода (цена, установленная тележкой, умноженная на количество покупателей) и издержек (каждая тележка несет издержки в размере 0,25 доллара на один кокос, умноженные на количество проданных кокосов).
a) Выведите для каждой тележки формулу, описывающую количество обслуженных покупателей как функцию от p 0 и p 1 . (Помните, что тележка 0 обслуживает покупателей, находящихся между точками 0 и x, то есть просто x, а тележка 1 обслуживает покупателей между точками x и 1, или 1 — x. Иными словами, тележка 0 продает кокосовое молоко x покупателям, а тележка 1 (1 — x) покупателям, где x и (1 − х) исчисляются в тысячах.)
b) Запишите функции прибыли для двух тележек. Определите правила наилучших ответов для обеих тележек как функцию от цены конкурента.
c) Постройте график правил наилучших ответов, а затем вычислите (и покажите на графике) соответствующий равновесию Нэша уровень цен на кокосовое молоко, продающееся на пляже.
S8. Нефть транспортируется по всему миру в танкерах класса VLCC (водоизмещением свыше 160 тысяч тонн). По состоянию на 2001 год более 92 процентов всех танкеров класса VLCC были построены в Южной Корее и Японии. Допустим, цена новых танкеров VLCC (в миллионах долларов) определяется функцией P = 180 — Q, где Q — количество построенных танкеров, Q = qКорея + qЯпония. (То есть будем исходить из того, что такие танкеры выпускают только в Японии и Корее, стало быть, они образуют дуополию.) Предположим, затраты на строительство каждого танкера составляют 30 миллионов долларов как в Корее, так и в Японии. Иначе говоря, cКорея = cЯпония = 30, где затраты на один танкер измеряются в миллионах долларов.
a) Запишите функции прибыли для каждой из двух стран, выраженные через qКорея и qЯпония, а также либо cКорея, либо cЯпония. Найдите функцию наилучшего ответа каждой страны.
b) С помощью функций наилучших ответов, вычисленных в пункте а, отыщите соответствующее равновесию Нэша количество танкеров класса VLCC, выпускаемых каждой страной в год. Какова цена танкера VLCC? Какую прибыль получает каждая страна?
c) Затраты на оплату труда на корейских верфях существенно ниже, чем на японских. Теперь предположим, что стоимость строительства одного танкера в Японии составляет 40 миллионов долларов, а в Корее — всего 20 миллионов долларов. Если cКорея = 20, а cЯпония = 40, какова рыночная доля каждой страны (то есть процент танкеров, которые продает каждая страна, от общего количества проданных танкеров)? Какова прибыль каждой страны?
S9. Расширим предыдущую задачу. Предположим, на рынок строительства танкеров класса VLCC решит выйти Китай. Дуополия, соответственно, превратится в триополию, а значит, хотя цена по-прежнему рассчитывается как P = 180 — Q, количество построенных танкеров описывается формулой Q = qКорея + qЯпония + qКитай. Допустим, во всех странах объем затрат на строительство одного танкера составляет 30 миллионов долларов: cКорея = cЯпония = сКитай = 30.
a) Запишите функции прибыли для каждой из трех стран, выраженные через qКорея, qЯпония и qКитай, а также через cКорея, cЯпония или сКитай. Вычислите функцию наилучшего ответа каждой страны.
b) Воспользовавшись решением, полученным в пункте а, определите количество выпущенных танкеров, рыночную долю (см. ) и прибыль каждой страны. Это потребует решения трех уравнений с тремя неизвестными.
c) Как изменится цена одного танкера VLCC в новой триополии по сравнению с дуополией, представленной в ? Почему?
S10. Моника и Нэнси создали деловое товарищество в целях предоставления консультационных услуг в гольф-индустрии. Каждой из них предстоит решить, сколько усилий вкладывать в этот бизнес. Пусть m — это количество усилий, вкладываемых Моникой, а n — Нэнси.
Общая прибыль товарищества рассчитывается по формуле 4m + 4n + mn и исчисляется в десятках тысяч долларов, а партнеры делят ее поровну. Однако партнеры должны по отдельности нести затраты, связанные с вложением усилий; объем этих затрат в случае Моники составляет m2, а в случае Нэнси — n2 (также исчисляются в десятках тысяч долларов). Каждая участница товарищества должна принять решение о количестве усилий, не зная о решении коллеги.
a) Если Моника и Нэнси вложат в бизнес усилия m = n = 1, какой выигрыш получит каждая из них?
b) Если Моника вложит усилия m = 1, каким должен быть наилучший ответ Нэнси?
c) Каково равновесие Нэша в этой игре?
S11. Равновесие Нэша можно получить посредством рационализации в играх с кривыми наилучших ответов, направленными вверх, если циклы исключения стратегий, которые не могут быть наилучшими ответами, начинаются с минимально возможных значений. Рассмотрим игру в ценообразование между ресторанами Xavier’s Tapas Bar и Yvonne’s Bistro, представленную на . Используйте и правила наилучших ответов, на основании которых он получен, чтобы приступить к рационализации равновесия Нэша в этой игре. Начните с самых низких цен в двух ресторанах и опишите (минимум) два цикла сужения совокупности рационализируемых цен до равновесия Нэша.
S12. Профессор предлагает Эльзе и ее 49 однокурсникам сыграть в следующую игру. Все студенты одновременно и втайне друг от друга записывают на листках бумаги число от 0 до 100, после чего сдают листки профессору. Тот подсчитывает Х — среднее чисел, выбранных студентами. Студент, число которого окажется наиболее близким к половине от Х, получает 50 долларов. Если такое число выберут несколько студентов, они делят приз поровну.
a) Докажите, что выбор числа 80 — доминируемая стратегия.
b) Какой была бы совокупность наилучших ответов для Эльзы, если бы она знала, что все однокурсники выберут число 40? То есть каков диапазон чисел, в котором каждое число ближе к выигрышному числу, чем 40?
c) Какой была бы совокупность наилучших ответов для Эльзы, если бы она знала, что все ее однокурсники выберут число 10?
d) Найдите симметричное равновесие Нэша в этой игре. Иными словами, какое число будет наилучшим ответом на выбор всеми остальными игроками одного и того же числа?
e) Какие стратегии в этой игре будут рационализируемыми?
Упражнения без решений
U1. Diamond Trading Company (DTC), дочерняя компания De Beers, — основной поставщик высококачественных алмазов на оптовый рынок. Для простоты предположим, что DTC имеет монополию на оптовую торговлю алмазами. Следовательно, их оптовая цена напрямую зависит от количества алмазов, которое решает продать компания DTC. Пусть оптовую цену алмазов (в сотнях долларов) описывает следующая функция обратного спроса: P = 120 — Q DTC , где Q DTC — количество продаваемых алмазов. Допустим, DTC несет издержки в размере 12 (сотен долларов) на один алмаз высокого качества.
a) Запишите функцию прибыли DTC, выраженную через Q DTC , и вычислите объем поставок алмазов, обеспечивающий DTC максимальную прибыль. Какой будет оптовая цена алмазов при таком объеме поставок? Какова прибыль DTC?
Возмущенные монополией DTC, несколько компаний по добыче алмазов и крупных ретейлеров создали совместное предприятие под названием Adamantia в качестве конкурента DTC на оптовом рынке алмазов. Теперь оптовая цена алмазов определяется по формуле P = 120 — Q DTC — Q ADA . Предположим, Adamantia несет издержки в размере 12 (сотен долларов) на один алмаз высокого качества.
b) Запишите функцию прибыли компаний DTC и Adamantia. Какое количество алмазов поставляет на оптовый рынок каждая из них в случае равновесия? Какую оптовую цену алмазов подразумевает такое количество? Какую прибыль получит каждый поставщик в такой дуополии?
c) Опишите различия между ситуацией на оптовом рынке алмазов в случае дуополии с участием DTC и Adamantia и монополии DTC. Что произойдет с объемом поставок алмазов на рынок и рыночной ценой в связи с выходом на него Adamantia? Что произойдет с совокупной прибылью компаний DTC и Adamantia?
U2. В городе Харкинсвилль есть два кинотеатра: Modern Multiplex, осуществляющий премьерные показы, и Sticky Shoe, демонстрирующий фильмы, вышедшие в прокат ранее, по более низкой цене. Спрос на фильмы в Modern Multiplex описывается формулой Q M M = 14 — P MM + P SS , а в Sticky Shoe — формулой Q SS = 8–2P SS + P MM , где цены измеряются в долларах, а количество — в сотнях кинозрителей. В кинотеатре Modern Multiplex объем затрат на одного зрителя составляет 4 доллара, а в Sticky Shoe — всего 2 доллара.
a) На основании уравнений спроса определите, какие услуги предоставляют кинотеатры Modern Multiplex и Sticky Shoe — взаимозаменяющие или взаимодополняющие.
b) Запишите функцию прибыли каждого кинотеатра, выраженную через P SS и P MM . Определите правило наилучших ответов для каждого кинотеатра.
c) Определите цену, количество и прибыль каждого кинотеатра в соответствии с равновесием Нэша.
d) Какими бы были значения цены и количества для каждого кинотеатра, если бы они вступили в сговор в целях максимизации общей прибыли на этом рынке? Почему исход, основанный на сговоре, не будет равновесием Нэша?
U3. Перенесемся на десять лет в будущее в ситуации, представленной в упражнении S3. Спрос на хлеб и сыр в Яппи-Тауне снизился, и два магазина, La Boulangerie и La Fromagerie, выкупила третья компания — L’Épicerie. Производство буханки хлеба по-прежнему обходится в 1 доллар, а фунта сыра — в 2 доллара, однако количество продаваемого хлеба и сыра (Q 1 и Q 2 соответственно, в тысячах) теперь описывается следующими уравнениями:
Q 1 = 8 — P 1 — 0,5 P 2 , Q 2 = 16 — 0,5 P 1 — P 2 .
Как и прежде, P 1 — это цена буханки хлеба в долларах, а P 2 — цена фунта сыра в долларах.
a) Поначалу компания L’Épicerie управляет магазинами La Boulangerie и La Fromagerie так, будто это две отдельные компании с независимыми управляющими, каждый из которых пытается максимизировать прибыль своего магазина. Определите количество, цену и прибыль этих двух подразделений L’Épicerie в соответствии с равновесием Нэша с учетом новых уравнений количества продаваемого хлеба и сыра.
b) Владельцы L’Épicerie считают, что могут получить более высокую общую прибыль посредством координации стратегий ценообразования в подразделениях своей компании в Яппи-Тауне. Какова цена хлеба и сыра, максимизирующая общую прибыль, при условии такого сговора? Какое количество каждого продукта продают магазины La Boulangerie и La Fromagerie, и какую прибыль получает каждый из них в отдельности?
c) Почему компании порой продают часть своей продукции по цене ниже себестоимости? Дайте логическое обоснование продажи продукции с убытком, воспользовавшись своим ответом из пункта b в качестве иллюстрации.
U4. Тележки для торговли кокосовым молоком из снова установили на следующий день. Почти все условия прежние: тележки находятся в тех же местах; количество и распределение отдыхающих такое же; спрос тоже не изменился — одна порция кокосового молока. Единственное отличие — это неимоверно жаркий день, поэтому каждый отдыхающий несет более высокие транспортные издержки в размере 0,6 × d2. Как и прежде, тележка 0 продает кокосовое молоко всем отдыхающим, находящимся между точками 0 и x, а тележка 1 — всем отдыхающим между точками x и 1, где x — это местоположение отдыхающего, который платит одну и ту же общую цену, куда бы он ни отправился — к тележке 0 или 1. Однако теперь местоположение точки x определяется выражением
p 0 + 0,6 x 2 = p 1 + 0,6(1 — x ) 2 .
Каждая тележка продолжает нести издержки в размере 0,25 доллара на один проданный кокос.
a) Для каждой тележки выведите формулу, описывающую количество обслуженных покупателей как функцию от p0 и p1. (Не забывайте, что тележка 0 обслуживает покупателей, находящихся между точками 0 и x, то есть просто x, а тележка 1 — между точками x и 1, или 1 — x. Иными словами, тележка 0 продает кокосовое молоко x покупателям, а тележка 1 — (1 — x) покупателям, где x и (1 — х) исчисляются в тысячах.)
b) Запишите функции прибыли для двух тележек и определите для них правила наилучших ответов.
c) Вычислите соответствующий равновесию Нэша уровень цен на кокосовое молоко, продающееся на пляже. Как эта цена отличается от цены, рассчитанной в упражнении S7? Почему?
U5. В игре, представленной на , есть единственное равновесие Нэша в чистых стратегиях. Найдите его и покажите, что оно будет также рационализируемым исходом данной игры.
U6. Найдите рационализируемые стратегии игры «чет или нечет» из .
U7. В игре с рыболовными лодками в мы показали, как может сложиться ситуация, когда единственный рационализируемый исход в непрерывных стратегиях представляет собой также и равновесие Нэша. Тем не менее так бывает не всегда: может существовать множество рационализируемых стратегий, и не все из них обязательно будут частью равновесия Нэша.
Вернувшись к игре в политическую рекламу из , найдите совокупность рационализируемых стратегий для партии Л. (Учитывая симметричные выигрыши двух партий, совокупность рационализируемых стратегий будет такой же и для партии П.)
U8. Компании Intel и AMD, основные производители центральных процессоров, конкурируют друг с другом в категории микросхем (чипов) средней производительности (среди прочих категорий). Предположим, что мировой спрос на такие чипы зависит от их количества, выпускаемого двумя компаниями, а значит цена (в долларах) микросхем средней производительности определяется по формуле P = 210 — Q, где Q = q Intel + q AMD — количество микросхем, исчисляемое в миллионах. Производство каждого чипа обходится Intel в 60 долларов. В AMD процесс производства организован лучше, поэтому ей производство каждой микросхемы обходится в 48 долларов.
a) Запишите функцию прибыли каждой компании, выраженную через q Intel и q AMD . Определите правило наилучших ответов каждой компании.
b) Вычислите цену, количество и прибыль каждой компании в соответствии с равновесием Нэша.
c) (дополнительное упражнение). Предположим, Intel приобрела AMD и теперь имеет два подразделения с разными производственными затратами. Компания, образовавшаяся в результате поглощения, стремится максимизировать общую прибыль двух подразделений. Сколько микросхем должно производить каждое подразделение? (Подсказка: возможно, вам придется хорошенько поразмышлять над этой задачей, а не слепо применять математические методы.) Какова рыночная цена и совокупная прибыль компании?
U9. Вернемся к игре с триополией на рынке танкеров класса VLCC из . В действительности у этих стран не одинаковые издержки производства. Китай постепенно, в течение нескольких лет, выходит на этот рынок, и из-за отсутствия опыта его издержки производства с самого начала были достаточно высокими.
a) Определите количество, рыночную цену и прибыль участников триополии в случае, когда затраты на один танкер составляют 20 миллионов долларов в Корее, 40 миллионов долларов в Японии и 60 миллионов долларов в Китае (cКорея = 20, cЯпония = 40, cКитай = 60).
После того как Китай накопит больше опыта и увеличит производственные мощности, его издержки производства существенно сократятся. Поскольку в Китае рабочая сила еще дешевле, чем в Корее, в конечном счете затраты на строительство одного танкера станут в Китае даже меньше, чем в Корее.
b) Выполните то же задание, что и в пункте а, но с условием, что затраты Китая на один танкер составляют 16 миллионов долларов (cКорея = 20, cЯпония = 40, cКитай = 16).
U10. Вернемся к истории Моники и Нэнси из . После дополнительной профессиональной подготовки Моника более эффективно выполняет работу, поэтому теперь общая прибыль их компании рассчитывается по формуле 5m + 4n + mn в десятках тысяч долларов. Как и прежде, m — количество усилий, вкладываемых в бизнес Моникой, а n — Нэнси; затраты обеих составляют m2 и n2 соответственно (в тысячах долларов).
Условия партнерства по-прежнему требуют разделения прибыли поровну, несмотря на то, что Моника более продуктивна. Предположим, Моника и Нэнси принимают решения о вложении усилий одновременно.
a) Каким должен быть наилучший ответ Моники в случае, если, по ее оценкам, Нэнси будет вкладывать усилия в размере n = 4/3?
b) Найдите равновесие Нэша в этой игре.
c) По сравнению с равновесием Нэша, найденным в , Моника вкладывает больше, меньше или столько же усилий? Что можно сказать о Нэнси?
d) Каковы итоговые выигрыши Моники и Нэнси в новом равновесии Нэша (после разделения общей прибыли с учетом затрат на вложенные усилия)? Как они отличаются от выигрышей обеих при прежнем равновесии Нэша? Кто в конечном счете получает большую выгоду от дополнительной подготовки Моники?
U11. Профессор предлагает Эльзе и ее 49 однокурсникам сыграть в новую игру. Как и прежде, все студенты одновременно и втайне друг от друга записывают на листках бумаги число от 0 до 100, после чего профессор вычисляет среднее выбранных чисел и обозначает его символом X. На этот раз студент, число которого окажется наиболее близким к 2/3 × (X + 9), получит 50 долларов. Если такое число выберут несколько студентов, они разделят приз поровну.
a) Найдите симметричное равновесие Нэша в этой игре. То есть какое число станет наилучшим ответом на выбор всеми остальными игроками одного и того же числа?
b) Докажите, что выбор числа 5 — это доминируемая стратегия. (Подсказка: каким должно быть среднее значение X для всей группы, чтобы ожидаемое число было равно 5?)
c) Докажите, что выбор числа 90 — это доминируемая стратегия.
d) Определите все доминируемые стратегии.
e) Предположим, Эльза убеждена, что никто из ее однокурсников не выберет доминируемые стратегии, найденные в пункте d. Учитывая эти убеждения, какие стратегии не могут быть наилучшими ответами для Эльзы?
f) Какие стратегии в этой игре рационализируемые? Объясните логику ваших рассуждений.
U12 (дополнительное упражнение, требующее вычислений). Вспомните игру с политической рекламной кампанией партий Л и П из . В ней, когда партия Л тратит на рекламу x миллионов долларов, а партия R — y миллионов долларов, Л получает долю голосов x / (x + y), а П — y / (x + y). Мы также упоминали, что в такой модели может возникнуть два типа асимметрий между партиями. У одной партии (скажем, П) может быть возможность размещать рекламу по более низкой цене, или рекламный бюджет партии П может оказаться более эффективным с точки зрения привлечения голосов избирателей по сравнению с бюджетом партии Л. Для того чтобы учесть обе возможности, мы можем записать функции выигрышей двух партий следующим образом:
Эти функции выигрышей показывают, что у партии П есть преимущество в плане относительной эффективности ее рекламы при высоком значении k и при низком значении c.
a) Используйте эти функции выигрышей для получения функций наилучших ответов для партии П (которая выбирает y) и Л (которая выбирает x).
b) С помощью калькулятора или компьютера постройте график этих функций наилучших ответов при k = 1 и c = 1. Какой результат обеспечивает преимущество в отношении затрат на рекламу?
c) Сравните график из пункта b при k = 1 и c = 1 с графиком при k = 2 и c = 1. Какой результат обеспечивает преимущество в плане эффективности рекламного бюджета?
d) Найдите решения по функциям наилучших ответов, которые вы определили в пункте а, для x и y, чтобы показать, что расходы на рекламные кампании в случае равновесия Нэша составляют
e) Пусть k = 1 в равновесных уравнениях уровней расходов. Покажите, как эти два равновесных уровня расходов меняются в зависимости от значения c (то есть объясните знаки dx / dc и dy / dc). Тогда пусть c = 1; покажите, как эти два равновесных уровня расходов меняются в зависимости от значения k (то есть объясните знаки dx / dk и dy / dk). Подтверждают ли ваши ответы результаты, полученные вами в пунктах b и c данного упражнения?
Приложение. Поиск значения, максимизирующего функцию
В данном приложении представлен простой метод выбора переменной X для получения максимального значения переменной, которое является ее функцией, скажем Y = F(X). В наших примерах практического применения теории игр эта функция в большинстве случаев будет квадратичной, а именно Y = A + BX + CX2. Для таких функций мы выведем формулу X = B / (2C), используемую в данной главе. Мы сформулируем общую идею с помощью дифференциального исчисления, а затем предложим альтернативный подход, в котором это исчисление не применяется и который опирается исключительно на квадратичную функцию.
Метод дифференциального исчисления проверяет значение X на оптимальность посредством анализа того, что произойдет со значением функции в случае других значений по любую сторону от X. Если на самом деле X не максимизирует Y = F(X), то результатом увеличения или уменьшения X должно быть уменьшение значения Y. Исчисление предоставляет нам возможность быстро выполнить такую проверку.
Рисунок 5П.1 иллюстрирует основную идею. На нем представлен график функции Y = F(X), для которого мы использовали функцию, подходящую для наших примеров практического применения теории игр, хотя сама идея носит абсолютно универсальный характер. Начнем с любой точки P с координатами (X, Y) на этом графике. Рассмотрим несколько отличающееся значение X, скажем (X + h). Пусть k — это итоговое изменение Y = F(X), то есть точка Q с координатами (X + h, Y + k) также находится на графике. Наклон хорды, соединяющей точки P и Q, — коэффициент k / h. Если значение этого коэффициента положительное, то h и k имеют одинаковый знак: при увеличении X увеличивается и Y. Если значение коэффициента отрицательное, то h и k имеют противоположные знаки, и в случае увеличения X значение Y уменьшается.
Рис. 5П.1. Иллюстрация к производной функции
Если теперь мы проанализируем все меньшие изменения h значения X и все меньшие изменения k значения Y, хорда PQ будет приближаться к касательной к данному графику в точке P. Наклон этой касательной — и есть предельное значение k/h, называемое производной функцией Y = F(X) в точке X. Символически эта производная записывается как F´(X) или dY / dX.
Для нашей квадратичной функции имеем
Y = A + BX + CX 2 и Y + k = A + B ( X + h ) — C ( X + h ) 2 .
Мы можем найти формулу для k следующим образом:
k = [ A + B ( X + h ) — C ( X + h ) 2 ] — ( A + BX–CX 2 ) =
Bh — C [( X + h ) 2 — X 2 ] =
Bh — C ( X 2 + 2 Xh + h 2 — X 2 ) =
( B — 2 CX ) h — Ch 2 .
Тогда k / h = (B — 2CX) — Ch. В пределе, когда значение h стремится к нулю, k/h = (B — 2CX). Последнее выражение и есть производная нашей функции.
Теперь используем эту производную для проверки на оптимальность. На рис. 5П.2 проиллюстрирована эта идея. Точка M дает самое высокое значение Y = F(X). Функция возрастает по мере приближения к точке M слева (точка L) и убывает после удаления от точки M направо (точка R). Следовательно, производная F´(X) должна быть положительной при значениях X меньше M и отрицательной при значениях X больше M. По условию непрерывности производная в точке M должна равняться нулю. На обычном языке это означает, что график функции должен быть плоским в точке максимума, точнее, касательная в этой точке должна быть горизонтальной.
Рис. 5П.2. Оптимум функции
В нашем примере с квадратичной функцией производная равна F´(X) = B — 2CX. Проверка оптимальности подразумевает, что функция имеет оптимум в точке, значение производной в которой равно 0, то есть в точке X = B/2C. Это и есть та формула, которая приведена в данной главе.
Необходимо выполнить еще одну дополнительную проверку. Если перевернуть график функции, то точка M станет минимальным значением перевернутой функции и в этой самой нижней точке график также будет плоским. Таким образом, для общей функции F(X) установление значения F´(X) равным 0 позволяет получить значение X, которое обеспечивает как минимум, так и максимум. Как же провести различие между этими двумя возможностями?
В точке максимума функция возрастает слева и убывает справа. Следовательно, производная будет положительной при значениях X меньше предполагаемого максимума и отрицательной при значениях X больше предполагаемого максимума. Иными словами, производная, которая рассматривается как функция от X, убывает в этой точке. Убывающая функция имеет отрицательную производную. Стало быть, производная производной, которая называется второй производной исходной функции и записывается как F´(X) или d 2 Y / dX2, должна иметь отрицательное значение в точке максимума. Согласно той же логике вторая производная должна иметь положительное значение в точке минимума — именно это и отличает два случая.
Что касается производной F´(X) = B — 2CX в нашем примере с квадратичной функцией, то применение той же процедуры с h, k по отношению к F´(X), что и в случае F(X), показывает, что F˝(X) = — 2C. Значение этой производной будет отрицательным при положительном значении C; именно из такого предположения мы исходили, формулируя задачу в данной главе. Проверка F´(X) = 0 называется условием максимизации первого порядка функции F(X), а F˝(X) < 0 — условием второго порядка.
Для того чтобы закрепить эту идею, применим ее в конкретном примере с наилучшим ответом Xavier’s, который мы рассматривали в данной главе. У нас была такая формула:
П x = — 8(44 + P y ) + (16 + 44 + P y ) P x — 2( P x ) 2 .
Это квадратичная функция от P x (при неизменном значении цены другого ресторана P y ). Наш метод позволяет получить ее производную:
Условие первого порядка для P x для максимизации Пx состоит в том, что эта производная должна быть равной нулю. Установив такое значение производной и определив ее значение относительно P x , получим то же уравнение, что и в разделе 1.П. (Условие второго порядка: d 2 Пx / dP x 2 < 0, и оно удовлетворено, поскольку вторая производная равна −4.)
Мы надеемся, что метод с применением дифференциального исчисления покажется вам достаточно простым и вы сможете использовать его в нескольких местах книги, например в , посвященной коллективному действию. Однако если вы находите его слишком сложным, предлагаем альтернативный метод без исчисления, который работает в случае квадратичных функций. Перегруппируем члены уравнения, описывающего эту функцию, таким образом:
Y = A + BX–CX 2 =
В окончательном варианте формулы X присутствует только в последнем члене, где содержащий это значение квадрат вычитается (помните, что C > 0). Все выражение максимизируется в случае, если его вычитаемый член становится минимальным, что и происходит, если X = B / 2C. Что и требовалось доказать!
Такой метод дополнения до полного квадрата работает для квадратичных функций, поэтому применим к большинству примеров, рассматриваемых в книге. Однако мы должны признать, что в нем присутствует некий элемент магии. Метод с использованием дифференциального исчисления носит более общий методологический характер, так что изучение основ дифференциального исчисления окупится сторицей.
Глава 6. Сочетание последовательных и одновременных ходов
* * *
В мы рассматривали игры исключительно с последовательными ходами, а и посвящены играм только с одновременными ходами. Мы сформулировали концепции и методы анализа, применимые к чистым типам игр, такие как дерево игры и равновесие обратных рассуждений для игр с последовательными ходами, и таблицы выигрышей и равновесие Нэша в играх с одновременными ходами. Однако в реальной жизни многие стратегические ситуации содержат элементы взаимодействия обоих типов игр. Кроме того, хотя мы использовали дерево игры (экстенсивную форму) в качестве единственного метода иллюстрации игр с последовательными ходами и таблицу игры (стратегическую форму) как единственный метод иллюстрации игр с одновременными ходами, каждая из этих форм представления применима к играм любого типа.
В данной главе мы проанализируем многие из этих возможностей. Сначала покажем, как игры, сочетающие последовательные и одновременные ходы, решаются с помощью комбинации деревьев игр и таблицы выигрышей, а также подходящего объединения анализа равновесия обратных рассуждений и равновесия Нэша, затем рассмотрим последствия изменения характера взаимодействия в конкретной игре. В частности, проанализируем результат изменения правил игры в целях преобразования игры с последовательными ходами в игру с одновременными ходами и наоборот и изменения порядка ходов в игре с последовательными ходами. Эта тема позволяет сравнить равновесия, найденные посредством концепции обратных рассуждений в игре с последовательными ходами, с равновесиями, найденными с помощью концепции равновесия Нэша в одновременной версии той же игры. На основании такого сравнения мы расширим концепцию равновесий Нэша на игры с последовательными ходами. Оказывается, равновесие обратных рассуждений — частный случай равновесия Нэша, обычно называемый уточнением.
1. Игры с одновременными и последовательными ходами
Как уже неоднократно отмечалось ранее, большинство реальных игр, с которыми вы столкнетесь, будут состоять из множества более мелких компонентов, причем каждый может подразумевать игру либо с одновременными, либо с последовательными ходами, поэтому игра в целом потребует от вас знания обоих типов. Самый очевидный пример стратегического взаимодействия, содержащего как последовательную, так и одновременную составляющую, — это игры между двумя (или более) игроками, продолжающиеся на протяжении длительного периода. За год совместного проживания в комнате вы можете сыграть с соседом в ряд разных игр с одновременными ходами: ваши действия в любой из них зависят от истории вашего общения до нынешнего момента и ваших ожиданий в отношении дальнейших коммуникаций. Кроме того, любые спортивные соревнования, взаимодействие между конкурирующими компаниями в отрасли и политические отношения — все это последовательно связанные серии игр с одновременными ходами. Анализ таких игр подразумевает использование набора инструментов, представленных в (дерево игры и равновесие обратных рассуждений), и (таблица выигрышей и равновесие Нэша). Единственное различие состоит в том, что фактический анализ усложняется по мере увеличения количества ходов и взаимодействий.
А. Двухэтапные игры и подыгры
Наш основной иллюстративный пример таких ситуаций касается двух вымышленных крупных телекоммуникационных компаний CrossTalk и GlobalDialog. Каждая из них решает, стоит ли инвестировать 10 миллиардов долларов в покупку волоконно-оптической сети; решение обеими принимается одновременно. Если ни одна не выберет инвестиции, это конец игры. Если одна сделает инвестиции, а другая нет, то компания-инвестор должна установить цены на телекоммуникационные услуги. Она может назначить либо высокую цену, позволяющую привлечь 60 миллионов клиентов, каждый из которых принесет компании операционную прибыль в размере 400 долларов, либо низкую цену, позволяющую привлечь 80 миллионов клиентов, каждый из которых обеспечит компании операционную прибыль в размере 200 долларов. Если обе компании купят волоконно-оптические сети и выйдут на рынок, то ценообразование станет второй игрой с одновременными ходами. Каждая компания может установить либо высокую, либо низкую цену. Если обе предпочтут высокую цену, они разделят рынок поровну и каждая получит 30 миллионов клиентов и операционную прибыль 400 долларов на одного клиента. Если обе выберут низкую цену, они тоже разделят рынок поровну и каждая получит 40 миллионов клиентов и операционную прибыль 200 долларов на одного клиента. Если одна компания установит высокую цену, а другая низкую, то компания с низкой ценой получит все 80 миллионов клиентов, а компания с высокой ценой не получит ничего.
Взаимодействие между CrossTalk и GlobalDialog представляет собой двухэтапную игру. Из четырех возможных комбинаций вариантов выбора в случае игры с одновременными ходами на первом (инвестиционном) этапе одна комбинация завершает игру, две приводят к принятию решения только одним игроком на втором этапе (ценообразования), а четвертая сводится к игре с одновременными ходами (игре в ценообразование) на втором этапе. Игра в графическом виде представлена на рис. 6.1.
Рис. 6.1. Двухэтапная игра, состоящая из последовательных и одновременных ходов
В целом рис. 6.1 иллюстрирует дерево игры, но более сложное, чем в . Его можно представить как своего рода «дом на дереве» с несколькими уровнями, показанными в разных частях одного двумерного рисунка, как будто вы смотрите на него с вертолета, зависшего непосредственно над ним.
Первый этап игры отображен в виде таблицы выигрышей в верхнем левом квадранте . Вообразите его как первый этаж дома на дереве, на котором находятся четыре «комнаты». Комната, расположенная в северо-западном углу, соответствует ходам «не инвестировать», которые делают на первом этапе обе компании. Если принятые решения приводят компанию в эту комнату, дальше у нее нет никаких вариантов выбора, а значит, можно ассоциировать эту комнату с концевым узлом дерева из и показать выигрыши в ячейке таблицы (в данном случае для обеих компаний он составляет 0). Тем не менее все остальные комбинации действий двух компаний ведут в другие комнаты, в которых компании делают дальнейший выбор, поэтому мы еще не можем показать выигрыши в этих ячейках. Вместо этого мы показываем ветви, ведущие на второй этаж. В комнатах, расположенных в северо-восточном и юго-западном углах, отображены только выигрыши компании, решившей не инвестировать; ветви, исходящие из каждой из этих комнат, приводят нас к решениям соответствующей компании на втором этапе. Комната в юго-восточном углу приводит к многокомнатной структуре второго этажа дома на дереве, которая представляет игру в ценообразование второго этапа, разыгрываемую лишь в случае, если обе компании инвестировали на первом этапе. Эта структура второго этажа состоит из четырех комнат, соответствующих четырем комбинациям ходов двух компаний в игре в ценообразование.
Все ветви и комнаты второго этажа подобны концевым узлам дерева игры, а значит, мы можем показать выигрыши в каждом из этих случаев. Выражены они в виде операционной прибыли каждой компании за вычетом предшествующих инвестиционных затрат и исчисляются в миллиардах долларов.
Рассмотрим ветвь, ведущую в юго-западный угол на . Игра перемещается в этот угол, только если CrossTalk решит инвестировать в покупку волоконно-оптической сети. Тогда при выборе высокой цены операционная прибыль CrossTalk составит 400 долларов × 60 миллионов = 24 миллиарда долларов, и после вычитания 10 миллиардов инвестиционных затрат будет получен ее выигрыш — 14 миллиардов долларов, что мы записываем как выигрыш 14. В том же углу при выборе CrossTalk низкой цены ее операционная прибыль составит 200 долларов × 80 миллионов = 16 миллиардов долларов, что после вычитания первоначальных инвестиций даст выигрыш в размере 6 миллиардов долларов. В этой ситуации выигрыш GlobalDialog равен 0, как отображено в юго-западном углу ; выигрыш 0 компании CrossTalk при аналогичных расчетах для GlobalDialog показан в северо-восточной комнате таблицы игры, соответствующей первому этапу.
Если обе компании решат инвестировать, обе перейдут к игре в ценообразование, отображенной в юго-восточном углу рисунка. Если обе компании предпочтут высокую цену на втором этапе, каждая получит операционную прибыль 400 долларов × 30 миллионов (половина рынка), или 12 миллиардов долларов; после вычитания 10 миллиардов долларов инвестиционных затрат у каждой компании останется по 2 миллиарда долларов чистой прибыли, или выигрыш 2. Если обе компании выберут низкую цену на втором этапе, каждая получит операционную прибыль 200 долларов × 40 миллионов = 8 миллиардов долларов и после вычитания 10 миллиардов долларов инвестиционных затрат останется с чистым убытком в размере 2 миллиардов долларов, или выигрышем −2. И наконец, если одна компания установит высокую цену, а другая низкую, то вторая получит прибыль 200 долларов × 80 миллионов = 16 миллиардов долларов, что обеспечит ей выигрыш 6, тогда как первая вообще не получит операционной прибыли и просто потеряет вложенные 10 миллиардов долларов с выигрышем −10.
Как и в любой многоэтапной игре, представленной в , мы должны решить эту игру в обратном порядке, начиная с игры второго этапа. В двух задачах с принятием решений о ценообразовании каждой компанией мы сразу же видим, что выбор высокой цены приносит более крупный выигрыш. Мы фиксируем это, выделив данный выигрыш более крупным шрифтом.
Игру в ценообразование, разыгрываемую на втором этапе, необходимо решать с помощью методов, представленных в . Несложно заметить, что она относится к категории «дилемма заключенных». «Низкая цена» — это доминирующая стратегия для каждой компании; следовательно, исход игры — комната в юго-восточном углу таблицы игры второго этажа: каждая компания получает выигрыш −2.
Обратные рассуждения показывают, что на первом этапе следует оценивать каждую конфигурацию ходов, сначала проанализировав равновесие в игре второго этапа (или оптимальное решение на втором этапе) и полученные в результате выигрыши. Это позволит подставить только что рассчитанные выигрыши в ранее незаполненные или частично заполненные комнаты на первом этаже дома на дереве. Такая подстановка дает нам первый этаж с известными выигрышами, представленный на рис. 6.2.
Рис. 6.2. Инвестиционная игра первого этапа (после подстановки выигрышей, полученных методом обратных рассуждений на основании равновесия на втором этапе)
Теперь можем использовать методы из для решения этой игры с одновременными ходами. Вы должны сразу же распознать игру, представленную на рис. 6.2, как игру в труса. В ней два равновесия Нэша, каждое из которых сводится к выбору одной компанией стратегии «инвестировать», а другой — «не инвестировать». Компания-инвестор получит огромную прибыль, поэтому каждая компания предпочтет то равновесие, в котором она будет инвестором, а другая компания — нет. В мы кратко описали способы, позволяющие выбрать одно из двух равновесий, и указали на то, что каждая компания может попытаться получить предпочтительный исход, но это приведет к тому, что обе решат инвестировать и обе понесут убытки. На самом деле именно это и произошло в реальной игре такого рода. В мы проанализируем данный тип игр более подробно и покажем, что они имеют третье равновесие Нэша — в смешанных стратегиях.
Исходя из анализа , в нашем примере в игре первого этапа нет единственного равновесия Нэша. Это не особо серьезная проблема, поскольку мы можем оставить решение неоднозначным в той степени, в которой это было сделано выше. Было бы гораздо хуже, если бы единственное равновесие Нэша отсутствовало в игре второго этапа. Тогда было бы очень важно указать точный принцип выбора исхода игры с тем, чтобы определить выигрыши на втором этапе и использовать их в процессе обратных рассуждений в отношении первого этапа.
Игра в ценообразование второго этапа, показанная в нижней правой ячейке таблицы на , — одна часть полной двухэтапной игры. При этом она представляет собой полноценную игру с полностью заданной системой игроков, стратегий и выигрышей. Для того чтобы точнее описать двойственную природу этой игры, ее называют подыгрой полной игры.
В более общем смысле подыгра — это часть многоходовой игры, которая начинается в определенном узле исходной игры. При этом дерево подыгры — просто часть дерева полной игры, в котором этот узел выступает в качестве корня, или начального узла. В многоходовой игре столько подыгр, сколько и узлов принятия решений.
Б. Конфигурации многоэтапных игр
В многоуровневой игре, представленной на , каждый этап включает игру с одновременными ходами. Однако так бывает не всегда. Элементы игр с одновременными и последовательными ходами могут смешиваться и сочетаться друг с другом в любой комбинации. Мы приведем еще два примера, чтобы внести ясность в этот вопрос и закрепить идеи, рассмотренные в предыдущем разделе.
Первый пример — несколько измененный вариант игры между компаниями CrossTalk и GlobalDialog. Предположим, одна из них (скажем, GlobalDialog) уже инвестировала 10 миллиардов долларов в покупку волоконно-оптической сети. CrossTalk знает об этом и теперь должна решить, делать ли тоже такую инвестицию. Если CrossTalk откажется, то GlobalDialog останется только определиться с ценой. Если CrossTalk решит инвестировать, то две компании сыграют в описанную выше игру в ценообразование второго этапа. Дерево такой многоэтапной игры содержит условные ветви в начальном узле, а также подыгру с одновременными ходами в одном из узлов, к которому ведут эти исходные ветви. Полное дерево игры представлено на рис. 6.3.
Рис. 6.3. Двухэтапная игра в случае, когда одна компания уже сделала инвестиции
После построения дерева проанализировать игру не составит труда. На рис. 6.3 анализ методом обратных рассуждений показан посредством использования крупного шрифта для равновесных выигрышей, вытекающих из игры или решения на втором этапе, а также жирных линий для выбора CrossTalk на первом этапе. Иными словами, CrossTalk приходит к выводу, что инвестиции приведут ее к дилемме заключенных, которая оставит компанию с выигрышем −2, тогда как отказ от инвестиций обеспечит выигрыш 0. В итоге CrossTalk предпочитает второе. GlobalDialog получит выигрыш 14 вместо −2, который бы она получила в случае выбора CrossTalk стратегии «инвестировать», но CrossTalk интересует максимизация собственного выигрыша, а не намеренное уничтожение компании GlobalDialog.
Однако этот анализ показывает, что GlobalDialog может попытаться оперативно инвестировать средства в покупку волоконно-оптической сети, прежде чем CrossTalk примет решение, гарантирующее ей самый предпочтительный исход всей игры. А CrossTalk может попробовать обойти GlobalDialog аналогичным образом. В мы проанализируем некоторые методы под названием «стратегические ходы», позволяющие игрокам обеспечить подобные преимущества.
Наш второй пример связан с футболом. Накануне каждого матча тренер команды нападающих выбирает игру, которую они будут вести; в то же время тренер команды защиты дает игрокам инструкции в отношении их размещения на поле, чтобы противостоять нападению. Следовательно, перед нами игра с одновременными ходами. Предположим, у команды нападения всего две альтернативы — безопасная и рискованная игра, а команда защиты может подготовиться к ответу на любой из вариантов. Если команда нападения настроена на рискованную игру и квотербек видит расстановку игроков защиты, позволяющую противодействовать такой игре, он может изменить игру у линии розыгрыша мяча. А команда защиты, в свою очередь, может отреагировать изменением своей расстановки. Таким образом, мы имеем игры с одновременными ходами на первом этапе, а одна из комбинаций вариантов выбора ходов на данном этапе приводит к подыгре с последовательными ходами. На рис. 6.4 показано полное дерево этой игры.
Рис. 6.4. Игра с одновременными ходами на первом этапе, за которым идут последовательные ходы
Это игра с нулевой суммой, в которой выигрыши команды нападения исчисляются в количестве ярдов, которое она рассчитывает получить, а выигрыши команды защиты прямо противоположны и исчисляются в количестве ярдов, которые она намерена уступить. Безопасная игра команды нападения обеспечивает ей 2 ярда, даже если команда защиты готова к такой игре; если не готова, игра будет ненамного успешнее и обеспечит 6 ярдов. Рискованная игра, в случае если команда защиты к ней не готова, принесет команде нападения 30 ярдов. Однако если команда защиты к ней готова, нападающие потеряют 10 ярдов. Эта совокупность выигрышей, −10 у команды нападения и 10 у команды защиты, показана в концевом узле, в случае если нападение не изменит игру. Если же изменит (вернется к безопасной игре), выигрыши составят 2, −2, если команда защиты отреагирует, и 6, −6 — если не отреагирует. Эти же выигрыши получат команды, если команда нападения изначально запланирует безопасную игру.
На ветви, выбранные в последовательной подыгре, представлены жирными линиями. Нетрудно увидеть, что, если команда нападения изменит игру, команда защиты отреагирует на это, чтобы обеспечить выигрыш −2, а не −6, и что команда нападения изменит игру, чтобы получить выигрыш 2 вместо −10. В ходе обратных рассуждений мы должны разместить полученную совокупность выигрышей 2, −2 в правой нижней ячейке таблицы выигрышей игры с одновременными ходами, протекающей на первом этапе. Далее мы увидим, что в этой игре отсутствует равновесие Нэша в чистых стратегиях. Причина та же, что и в игре в теннис из : один игрок (команда защиты) стремится согласовать ходы (выбрать расстановку, позволяющую противостоять игре команды нападения), тогда как другой (команда нападения) старается их рассогласовать (поймать команду защиты на неправильной расстановке). В мы покажем, как вычислить равновесие в смешанных стратегиях в этой игре. Получается, что команда нападения должна выбирать рискованную стратегию с вероятностью 1/8, или 12,5 процента.
2. Изменение порядка выполнения ходов
Игры, рассмотренные в предыдущих главах, были представлены либо как последовательные, либо как одновременные по своему характеру. Мы использовали соответствующие инструменты анализа для прогнозирования равновесий в играх каждого типа. В данной главы мы обсуждали игры с элементами как последовательного, так и одновременного выполнения ходов. Для поиска решений таких игр понадобятся оба набора инструментов. А как на счет игр, которые можно вести либо последовательно, либо одновременно? Как изменение хода конкретной игры, а значит, и соответствующих инструментов анализа может повлиять на ожидаемые исходы?
Задача превращения игры с последовательными ходами в игру с одновременными ходами требует только изменения момента выполнения ходов или наблюдаемости, при которой игроки делают выбор. Игры с последовательными ходами становятся играми с одновременными ходами, если игроки не могут видеть ходы, сделанные соперниками, до того, как походят сами. В таком случае мы бы проанализировали игру скорее посредством поиска равновесия Нэша, а не равновесия обратных рассуждений. С другой стороны, игра с одновременными ходами могла бы стать игрой с последовательными ходами, если бы один игрок мог наблюдать за действиями другого игрока до выбора своего хода.
Любые изменения правил игры способны изменить ее исходы. Ниже мы проиллюстрируем ряд возможностей, возникающих вследствие изменений в играх разных типов.
А. Превращение игр с одновременными ходами в игры с последовательными ходами
I. Преимущество первого хода. Преимущество первого хода может возникнуть вследствие изменений правил игры с одновременного на последовательное выполнение ходов. Если в версии игры с одновременными ходами множество равновесий, версия с последовательными ходами как минимум позволяет игроку, который ходит первым, выбрать предпочтительный исход игры. Мы проиллюстрируем такую ситуацию на примере игры в труса, когда два подростка мчатся на автомобилях навстречу друг другу, решительно настроенные не сворачивать. На рис. 6.5a воспроизведена стратегическая форма, представленная на , а на рис. 6.5б и 6.5в отображены две экстенсивные формы, по одной на каждый возможный порядок выполнения ходов в игре.
Рис. 6.5. Версии игры в труса с одновременным и последовательным выполнением ходов
При одновременном выполнении ходов два исхода игры, при которых один игрок сворачивает («трус»), а другой едет прямо («храбрец»), — это равновесия Нэша в чистых стратегиях. Без исторического, культурного или любого другого соглашения ни один из этих исходов не может стать фокальной точкой. Анализ в показал, что координация действий могла бы помочь участникам этой игры, например посредством договоренности чередовать два равновесия.
Если мы изменим правила игры таким образом, чтобы предоставить одному из игроков возможность ходить первым, двух равновесий больше не будет. Скорее, мы увидим, что равновесная стратегия игрока, делающего ход вторым, сводится к выбору действия, противоположного действию игрока, который ходил первым. Далее анализ методом обратных рассуждений показывает, что равновесная стратегия игрока, ходившего первым, — «ехать прямо». На и мы видим, что предоставление одному игроку возможности сделать ход первым, причем так, чтобы другой игрок видел, как он это делает, в итоге приводит к единственному равновесию обратных рассуждений, в котором игрок, сделавший первый ход, получает выигрыш 1, тогда как второй игрок — выигрыш −1. При таких правилах фактическое ведение игры не имеет никакого значения, поэтому ее последовательная версия может не представлять интереса для многих наблюдателей. Хотя подростки, скорее всего, не захотели бы играть в эту игру по измененным правилам, стратегические последствия изменения правил весьма существенны.
II. Преимущество второго хода. Преимущество второго хода может возникнуть в играх, когда одновременное выполнение ходов меняется на последовательное. Это можно проиллюстрировать на примере игры в теннис, о которой рассказывалось в . Напомним, что в этой игре Эверт планирует место возврата подачи, тогда как Навратилова решает, где обеспечивать прикрытие. В рассмотренной ранее версии игры предполагалось, что каждая ее участница умеет маскировать предстоящие ходы до самого последнего момента, поэтому, по сути, они делали их одновременно. Однако если движения Эверт перед ударом по мячу каким-то образом раскроют ее намерения, Навратилова может отреагировать и сделать второй ход в игре. Точно так же, если Навратилова наклонится в ту сторону, которую планирует прикрывать, до того как Эверт фактически выполнит возврат подачи, то Эверт становится игроком, делающим второй ход.
В этой версии игры с одновременными ходами нет равновесия в чистых стратегиях. Тем не менее при каждом порядке выполнения ходов в последовательной версии существует исход в виде единственного равновесия обратных рассуждений, причем характер этого равновесия зависит от того, кто ходит первым. Если это Эверт, то Навратилова решит прикрывать то направление, которое выбрала Эверт для удара по линии. При таком равновесии каждая теннисистка должна выигрывать очко в половине случаев. Если порядок выполнения ходов обратный, Эверт решает послать мяч в направлении, противоположном тому, которое прикрывает Навратилова; следовательно, Навратилова должна двигаться так, чтобы прикрыть удар по диагонали. В такой ситуации Эверт должна выигрывать в 80 процентах случаев. Участница игры, делающая второй ход, добивается более весомых результатов, поскольку может оптимально реагировать на ход соперницы. Для иллюстрации таких исходов вы уже умеете строить деревья игры наподобие показанных на и .
Мы вернемся к версии этой игры с одновременными ходами в и докажем, что в ней есть равновесие Нэша в смешанных стратегиях. При этом равновесии Эверт добивается успеха в 62 процентах случаев. Следовательно, в двух версиях игры с последовательными ходами показатель результативности Эверт при равновесии в смешанных стратегиях в одновременной игре выше 50 процентов, которые она получит, делая ход первой, но ниже 80 процентов, если она будет ходить второй.
III. Оба игрока могут добиться большего. То, что в игре может быть преимущество первого или второго хода, которое блокируется при одновременном выполнении ходов, вполне понятно на интуитивном уровне. Куда больше удивляет вероятность того, что оба игрока могут добиться большего при том или ином наборе правил выполнения ходов. Мы проиллюстрируем это на примере игры с монетарной и фискальной политикой между Федеральной резервной системой и Конгрессом. В мы анализировали эту игру с одновременными ходами; таблица выигрышей () воспроизводится на рис. 6.6a, а две версии игры с последовательными ходами представлены на рис. 6.6б и рис. 6.6 в. Для краткости обозначим стратегии Конгресса как «баланс» и «дефицит» вместо «сбалансированный бюджет» и «дефицит бюджета», а стратегии ФРС как «высокие ставки» и «низкие ставки» вместо «высокие процентные ставки» и «низкие процентные ставки».
Рис. 6.6. Три версии игры с монетарной и фискальной политикой
В версии этой игры с одновременными ходами доминирующая стратегия Конгресса — «дефицит», и ФРС, зная об этом, выбирает стратегию «высокие ставки», что обеспечивает обоим выигрыши 2. Почти то же самое происходит в версии игры с последовательными ходами, где первой ходит ФРС. Предвидя, что на каждый сделанный ею ход Конгресс ответит стратегией «дефицит», ФРС должна выбирать стратегию «высокие ставки», обеспечивающую выигрыш 2 вместо 1.
Однако версия с последовательными ходами, в которой Конгресс ходит первым, отличается от предыдущей. Теперь Конгресс предвидит, что на выбор им стратегии «дефицит» ФРС ответит стратегией «высокие ставки», тогда как в случае выбора им стратегии «баланс» ФРС предпочтет «низкие ставки». Из этих двух вариантов развития событий Конгресс выберет второй, поскольку он обеспечит ему выигрыш 3 вместо 2. Следовательно, равновесие обратных рассуждений при таком порядке выполнения ходов состоит в том, чтобы Конгресс выбрал сбалансированный бюджет, а Федеральная резервная система — низкие процентные ставки. В итоге Конгресс получит выигрыш 3, а ФРС — 4, что лучше для обоих игроков, чем в случае двух других версий игры.
Различие между этими двумя исходами еще более парадоксально, потому что лучший исход, полученный на , будет в случае выбора Конгрессом стратегии «баланс», доминируемой на . Для устранения кажущегося парадокса необходимо глубже понять смысл доминирования. Чтобы стратегия «дефицит» была доминирующей, с точки зрения Конгресса она должна быть лучше стратегии «баланс» при каждом конкретном выборе ФРС. Такое сравнение стратегий «дефицит» и «баланс» уместно в игре с одновременными ходами, поскольку в ней Конгресс вынужден принимать решение, не зная о выборе ФРС. Он должен проанализировать или сформулировать убеждение в отношении действия ФРС и выбрать свой наилучший ответ на это действие. В нашем примере наилучший ответ Конгресса — стратегия «дефицит». Концепция доминирования уместна также и в игре с последовательными ходами, если Конгресс ходит вторым, поскольку тогда он знает, что уже сделала ФРС, и просто выбирает свой наилучший ответ, который всегда «дефицит». С другой стороны, если Конгресс ходит первым, он не может воспринимать выбор ФРС как данность и вместо этого должен понять, как его первый ход повлияет на второй ход ФРС. В нашем примере Конгресс знает, что ФРС ответит на стратегию «дефицит» стратегией «высокие ставки», а на стратегию «баланс» — стратегией «низкие ставки». В таком случае ему ничего не остается, как выбирать из этих двух вариантов; самый предпочтительный для Конгресса исход («дефицит», «низкие ставки») становится неактуальным, поскольку ответ ФРС делает его невозможным.
Мысль о том, что доминирование может утратить статус значимой концепции для игрока, делающего первый ход, мы продолжим в . Там же мы проанализируем вероятность того, что игрок может намеренно изменить правила игры, чтобы получить право первого хода. Это позволяет игрокам менять исход игры в свою пользу.
Предположим, два игрока в нашем примере могут выбирать порядок выполнения ходов в игре. В этом случае они согласились бы с тем, что Конгресс должен ходить первым. В действительности, когда возникает угроза дефицита бюджета и инфляции, во время слушаний в различных комитетах Конгресса члены совета управляющих ФРС часто предлагают именно такие сделки: они обещают отреагировать на сокращение расходов бюджета снижением процентных ставок. Но зачастую просто устной договоренности с другим игроком недостаточно. Необходимо, чтобы при этом были выполнены формальные требования к первому ходу, а именно — чтобы он поддавался наблюдению и не менялся в дальнейшем. В контексте макроэкономической политики очень выигрышно выглядит то, что законодательный процесс фискальной политики в Соединенных Штатах весьма прозрачен и протекает достаточно медленно, тогда как монетарную политику можно быстро изменить на заседании совета управляющих ФРС. Стало быть, игра с последовательными ходами, в которой Конгресс ходит первым, а ФРС — второй, вполне реалистична.
IV. Исход игры не меняется. До сих пор мы рассматривали только игры, в которых последовательное выполнение ходов вместо одновременных обеспечивает другой исход. Однако определенные игры имеют один и тот же исход в обоих случаях, независимо от порядка выполнения ходов. Как правило, такой результат наблюдается при наличии у обоих (или у всех) игроков доминирующих стратегий. Мы продемонстрируем, как это происходит, на примере дилеммы заключенных.
Рассмотрим игру с дилеммой заключенных из , в которой мужа и жену подозревают в причастности к совершению преступления. Равновесие Нэша в этой игре с одновременными ходами состоит в признании каждым игроком своей вины (или предательстве другого игрока и отказе от сотрудничества с ним). Но как бы проходила игра, если бы один из супругов сделал наблюдаемый выбор еще до выбора второго игрока? Применение метода обратных рассуждений к дереву игры, подобному изображенному на (которое вы можете нарисовать сами для проверки наших результатов анализа), показывает, что второму игроку выгоднее признать свою вину, если первый уже признался в совершении преступления (10 лет тюрьмы вместо 25 лет) и если первый отрицает свою вину (1 год тюрьмы вместо 3 лет). С учетом такого выбора второго игрока первому игроку лучше признать свою вину (10 лет тюрьмы вместо 25 лет). Следовательно, равновесие подразумевает тюремное заключение длительностью 10 лет для обоих супругов, независимо от того, кто будет ходить первым. Таким образом, во всех трех версиях этой игры одно и то же равновесие!
Б. Другие изменения в порядке выполнения ходов
В предыдущем разделе представлены различные примеры игр, в которых правила были изменены с одновременного на последовательное выполнение ходов. Мы видели, как и почему такие изменения влияют на исход игры. Те же примеры служат и для иллюстрации того, что происходит в случае изменения правил в противоположном направлении, то есть с последовательного на одновременное выполнение ходов. Таким образом, если в игре с последовательными ходами есть преимущество первого или второго хода, оно может быть утрачено при одновременном выполнении ходов. А если определенный порядок ходов приносит выгоду обоим игрокам, то его нарушение способно навредить обоим.
Те же примеры показывают, что произойдет, если правила игры меняются, чтобы изменить ее порядок, сохранив при этом неизменным ее последовательный характер. Если в игре присутствует преимущество первого или второго хода, то игрок, который вместо первого хода делает второй, может остаться в выигрыше или в проигрыше соответственно, с противоположными изменениями в случае другого игрока. А если определенный порядок отвечает интересам обоих игроков, то навязанное извне изменение порядка игры может либо принести выгоду, либо навредить им обоим.
3. Изменение в методе анализа
Дерево игры — естественный способ отображения игр с последовательными ходами, а таблица выигрышей — естественный способ представления игр с одновременными ходами. Однако каждый из этих методов можно адаптировать к другому типу игр. Ниже мы покажем, как преобразовать одну форму представления информации в другую, и при этом сформулируем ряд новых идей, которые пригодятся для последующего анализа игр.
А. Представление игр с одновременными ходами с помощью дерева игры
Рассмотрим игру с обводящим ударом в теннисе, описанную в , в которой действия выполняются настолько быстро, что ходы, по сути, будут одновременными, как показано на . Однако предположим, что мы хотим представить эту игру в экстенсивной форме, то есть с помощью дерева игры, а не таблицы выигрышей, как на . На рис. 6.7 показано, как это сделать.
Рис. 6.7. Игра в теннис с одновременными ходами, представленная в экстенсивной форме
Для того чтобы нарисовать дерево этой игры, необходимо выбрать одну ее участницу, например Эверт, которая будет делать выбор в начальном узле дерева. Ветви дерева, соответствующие двум вариантам выбора — ПЛ («по линии») и ПД («по диагонали»), заканчиваются в двух узлах, в каждом из которых делает выбор Навратилова. Однако поскольку на самом деле ходы в этой игре фактически одновременные, Навратилова должна сделать выбор, не зная, что выбрала Эверт. То есть Навратилова должна делать выбор, не зная, в каком узле она находится, — в том, к которому ведет ветвь Эверт ПЛ, или в том, к которому ведет ветвь ПД. Наша древовидная схема должна каким-то образом отображать эту нехватку информации у Навратиловой.
Мы проиллюстрируем стратегическую неопределенность Навратиловой в отношении узла, в котором она должна принимать решение, нарисовав овал, вмещающий в себя два соответствующих узла. (В качестве альтернативы можно соединить их пунктирной линией; она используется для того, чтобы отличить ее от сплошных линий, которые представляют ветви дерева.) Узлы, находящиеся в пределах этого овала или круга, называются информационным множеством игрока, делающего в них ходы. Такое множество указывает на наличие у этого игрока несовершенной информации: он не может провести различие между узлами множества на основании имеющейся информации (поскольку не может видеть ход другого игрока до того, как сделает свой ход). В соответствии с этим стратегический выбор, делаемый игроком в пределах одного информационного множества, должен подразумевать один и тот же ход во всех узлах, входящих в это множество. Иными словами, Навратилова должна выбрать либо ПЛ, либо ПД в обоих узлах данного информационного множества. Она не может выбрать ПЛ в одном узле и ПД в другом, как на , где представлена игра с последовательными ходами и Навратилова ходила второй.
В связи с этим мы должны внести коррективы в наше определение стратегии. В мы определили ее как исчерпывающий план действий, указывающий, какие действия должен предпринимать игрок в каждом узле, в котором наступает его очередь ходить в соответствии с правилами игры. Теперь мы должны более точно определить стратегию как исчерпывающий план действий, указывающий, какие действия должен предпринимать игрок в каждом информационном множестве, в узлах которого наступает его очередь ходить в соответствии с правилами игры.
Концепция информационного множества также актуальна, когда игрок сталкивается с внешней неопределенностью в отношении некоторых условий, влияющих на его решение, а не ходов другого игрока. Например, фермер, сажающий ту или иную культуру, не знает, какая будет погода в период ее вегетации, хотя на основании своего опыта или метеорологических прогнозов может определить вероятность альтернативных возможностей. Мы можем рассматривать погоду как случайный выбор, который делает внешний игрок по имени «природа», не получающий никаких выигрышей, а просто выбирающий исходя из общеизвестных вероятностей. В таком случае мы можем включить различные узлы, соответствующие ходам природы, в информационное множество фермера, ограничивающее его выбор одним и тем же действием во всех узлах. Эта ситуация проиллюстрирована на рис. 6.8.
Рис. 6.8. Природа и информационное множество
С помощью понятия информационного множества мы можем формализовать концепции совершенной и несовершенной информации в игре, которые ввели в главе 2 (). В игре присутствует совершенная информация, если в ней нет ни стратегической, ни внешней неопределенности, что происходит в случае отсутствия в игре информационных множеств, содержащих два или более узла. Иными словами, в игре имеется совершенная информация, если все ее информационные множества содержат единичные узлы.
Хотя с концептуальной точки зрения это достаточно простое представление, оно не упрощает способа решения игры. По этой причине мы используем его только тогда, когда оно позволяет проще передать ту или иную мысль. В и приведено несколько примеров представления игр с помощью информационных множеств.
Б. Представление и анализ игр с последовательными ходами в стратегической форме
Рассмотрим игру () с последовательными ходами в монетарную и фискальную политику, в которой Конгресс ходит первым. Допустим, нам нужно представить эту игру в нормальной или стратегической форме, то есть в виде таблицы выигрышей, строки и столбцы которой — стратегии двух игроков. Следовательно, мы должны начать с определения стратегий.
Для Конгресса, делающего первый ход, перечислить стратегии не составит труда. Существует только два хода, «баланс» и «дефицит», они же являются стратегиями. Что касается игрока, делающего второй ход, то здесь все гораздо сложнее. Не забывайте, что стратегия — это исчерпывающий план действий, указывающий, какие действия должен предпринимать игрок в каждом узле, в котором наступает его очередь ходить. Поскольку ФРС получает право сделать ход в двух узлах (а также потому, что, согласно нашему предположению, ходы в этой игре действительно выполняются последовательно, а значит, эти два узла не объединяются в информационное множество) и может выбрать либо стратегию «низкие ставки», либо «высокие ставки» в каждом из узлов, существует четыре комбинации ее вариантов выбора: 1) «низкие ставки», если «баланс»; «высокие ставки», если «дефицит» (в сокращенном виде «Н, если Б; В, если Д»); 2) «высокие ставки», если «баланс»; «низкие ставки», если «дефицит» (сокращенно «В, если Б; Н, если Д»); 3) «низкие ставки» всегда; 4) «высокие ставки» всегда.
Полученная в результате матрица выигрышей два на четыре представлена на рис. 6.9. Последние два столбца не отличаются от тех, которые были в матрице выигрышей два на два, составленной для игры, в которой ходы выполнялись одновременно (). Это объясняется тем, что если ФРС выберет стратегию, согласно которой она делает одни и те же ходы всегда, то это равносильно тому, что ФРС делала бы свои ходы без учета того, что сделал Конгресс, то есть их ходы были бы как будто одновременными. Однако вычисление выигрышей в первых двух столбцах, где ход ФРС зависит от первого хода Конгресса, требует более пристального внимания.
Рис. 6.9. Игра с последовательными ходами с фискальной и монетарной политикой, представленная в стратегической форме
Для иллюстрации рассмотрим ячейку на пересечении первой строки и второго столбца. Здесь Конгресс выбирает «баланс», а ФРС — «В, если Б; Н, если Д». Учитывая выбор Конгресса, фактическим выбором ФРС в рамках этой стратегии будет стратегия «высокие ставки». В таком случае выигрыши здесь те же, что и в сочетании стратегий «баланс» и «высокие ставки», а именно 1 для Конгресса и 3 для ФРС.
Анализ наилучших ответов позволяет быстро определить, что в этой игре есть два равновесия Нэша в чистых стратегиях, что мы показываем, выделив соответствующие ячейки серым цветом. Одно отображено в верхней левой ячейке, в которой стратегия Конгресса — «баланс», а ФРС — «Н, если Б; В, если Д», а значит, фактический выбор ФРС — «низкие ставки». Этот исход представляет собой равновесие обратных рассуждений в игре с последовательными ходами. Однако есть еще одно равновесие Нэша в правой нижней ячейке, где Конгресс выбирает стратегию «дефицит», а ФРС — «высокие ставки». Как обычно в случае равновесия Нэша, ни у одного игрока нет явных оснований отклоняться от стратегий, приведших к данному исходу. Конгресс только ухудшил бы ситуацию, переключившись на стратегию «баланс», а ФРС не извлекла бы никакой пользы из перехода к любой из трех оставшихся стратегий, хотя при выборе стратегии «Н, если Б; В, если Д» был бы получен равноценный результат.
Анализ игры с последовательными ходами в ее экстенсивной форме обеспечивает только одно равновесие обратных рассуждений. Но если проанализировать эту же игру в нормальной или стратегической форме, в ней оказывается два равновесия Нэша. Что происходит?
Ответ на этот вопрос кроется в разном характере логики анализа равновесия Нэша и равновесия обратных рассуждений. Равновесие Нэша требует, чтобы ни у одного из игроков не было причины отклоняться от выбранной стратегии с учетом стратегии другого игрока. Однако в случае равновесия обратных рассуждений стратегии игроков, делающих ходы на более поздних этапах, не воспринимаются как данность. Вместо этого ставится вопрос о том, какое действие будет оптимальным в случае, если у игрока действительно появится возможность сделать ход.
В нашем примере стратегия ФРС «высокие ставки всегда» не удовлетворяет критерию оптимальности в случае появления возможности сделать ход. Если бы Конгресс выбрал стратегию «дефицит», то стратегия «высокие ставки» действительно была бы оптимальным ответом ФРС. Однако если бы Конгресс выбрал стратегию «баланс», а ФРС пришлось бы делать ответный ход, ей следовало бы применить стратегию «низкие ставки», а не «высокие». Стало быть, стратегия «высокие ставки всегда» не будет оптимальным ответным ходом ФРС во всех возможных конфигурациях игры и не может быть равновесием обратных рассуждений. Но логика равновесия Нэша не требует такой проверки; вместо этого стратегию ФРС «высокие ставки всегда» Конгресс мог бы обоснованно рассматривать как данность. И если он действительно сделает это, то стратегия «дефицит» — его наилучший ответ. Напротив, «высокие ставки всегда» — один наилучший ответ ФРС на стратегию Конгресса «дефицит» (хотя он и связан с условием «Н, если Б; В, если Д»). Следовательно, пара стратегий «дефицит» и «высокие ставки всегда» — обоюдно наилучшие ответы, входящие в состав равновесия Нэша, хотя они и не образуют равновесия обратных рассуждений.
Таким образом, мы можем считать равновесие обратных рассуждений добавочным критерием, который дополняет равновесие Нэша и помогает выбрать одно из множества равновесий Нэша, присутствующих в стратегической форме. Другими словами, это уточнение концепции равновесия Нэша. Чтобы сформулировать эту идею несколько более точно, вспомним понятие подыгры. По мере того как игроки по очереди делают свой выбор, игра проходит по непрерывной последовательности узлов, и каждый ход можно рассматривать как начало подыгры. Равновесие, полученное посредством метода обратных рассуждений, соответствует одной конкретной последовательности вариантов выбора в каждой подыгре и создает один конкретный путь игры. Безусловно, другие ее пути также согласуются с правилами игры. Мы называем такие пути неравновесными путями игры, а подыгры, разворачивающиеся на них, неравновесными подыграми.
Вооружившись этими терминами, мы теперь можем сказать, что равновесный путь игры сам по себе определяется ожиданиями игроков в отношении того, что бы произошло, если бы они выбрали другое действие, то есть если бы переместили игру на неравновесный путь и начали неравновесную подыгру. Равновесие обратных рассуждений требует от игроков делать свой наилучший выбор в каждой подыгре более крупной игры, независимо от того, находится ли эта подыгра на пути к конечному равновесному исходу.
Стратегии — это исчерпывающие планы действий. Следовательно, стратегия игрока должна определять, что он будет делать в каждом предполагаемом случае или в каждом узле игры (будь то на ее равновесном или неравновесном пути), в котором наступает его очередь ходить. Когда игра достигает одного такого узла, применим только тот план действий, который начинается в этом узле, а именно та часть полной стратегии, которая относится к подыгре, стартующей в данном узле. Эта часть называется продолжением стратегии в этой подыгре. Согласно равновесию обратных рассуждений, равновесная стратегия должна быть такой, чтобы ее продолжение в каждой подыгре было оптимальным для каждого игрока, который должен ходить в этом узле, независимо от того, лежат ли этот узел и подыгра на равновесном пути игры.
Вернемся к игре с монетарной политикой, в которой Конгресс делает первый ход, и рассмотрим второе равновесие Нэша, возникающее при представлении игры в стратегической форме. Здесь путь игры Конгресса состоит в выборе стратегии «дефицит», а ФРС — стратегии «высокие ставки». На равновесном пути стратегия «высокие ставки» — действительно лучший ответ ФРС на стратегию «дефицит». Выбор Конгрессом стратегии «баланс» был бы началом неравновесного пути. Он ведет к узлу, в котором разыгрывается довольно простая подыгра, а именно решение принимает ФРС. Предполагаемая равновесная стратегия ФРС «высокие ставки всегда» подразумевает, что ФРС в этой подыгре применит стратегию «высокие ставки». Однако это неоптимально: второе равновесие определяет неоптимальный выбор в случае неравновесной подыгры.
Напротив, равновесный путь в равновесии Нэша в левом верхнем углу состоит в выборе Конгрессом стратегии «баланс», а ФРС — «низкие ставки». ФРС выбирает оптимальный ответ на равновесном пути. Неравновесный путь состоял бы в выборе Конгрессом стратегии «дефицит», а ФРС с учетом своей стратегии «Н, если Б; В, если Д» применила бы стратегию «высокие ставки». Для ФРС выбор стратегии «высокие ставки» в ответ на стратегию Конгресса «дефицит» оптимален, а значит, эта стратегия остается оптимальной и на неравновесном пути игры.
Требование о том, что продолжение стратегии должно оставаться оптимальным при любых обстоятельствах, действительно важно, поскольку сам равновесный путь — это результат стратегических рассуждений игроков о том, что бы произошло, если бы они сделали нечто иное. Игрок, которому предстоит ходить следующим, может попробовать обеспечить предпочтительный для себя исход, пригрозив игроку, делающему первый ход, что его определенные действия встретят серьезный отпор, или, наоборот, пообещав, что определенные действия получат одобрение. Однако игрок, делающий первый ход, скептически отнесется к достоверности таких угроз и обещаний. Единственный способ развеять сомнения — проверить, действительно ли заявленные ответные действия будут оптимальны в случае, если в них возникнет необходимость. Если они неоптимальны, то угрозы и обещания недостоверны, а соответствующие ответные ходы не будут присутствовать на равновесном пути игры.
Равновесие, найденное методом обратных рассуждений, называется совершенным равновесием подыгры и представляет собой совокупность стратегий (исчерпывающих планов действий), по одной на каждого игрока, при которой в каждом узле дерева игры, независимо от того, лежит ли он на ее равновесном пути, продолжение одной и той же стратегии в подыгре, начинающейся в данном узле, будет оптимальным для игрока, совершающего там действие. Проще говоря, совершенное равновесие подыгры требует, чтобы игроки использовали стратегии, образующие равновесие Нэша в каждой подыгре более крупной игры.
Как правило, в играх с конечными деревьями и совершенной информацией, в которых участники могут наблюдать все предыдущие действия, предпринятые всеми игроками, а значит, нет нескольких узлов, входящих в одно информационное множество, анализ методом обратных рассуждений позволяет найти единственное (за исключением элементарных и уникальных случаев равного распределения выигрышей) совершенное равновесие подыгры. Подумайте вот о чем: если проанализировать любую подыгру, которая начинается в последнем узле принятия решений последним игроком, делающим ход, то его наилучший выбор — стратегия, обеспечивающая ему самый высокий выигрыш. Но это и есть действие, выбранное в ходе обратных рассуждений. По мере перемещения игроков по дереву игры в обратном направлении обратные рассуждения исключают все нецелесообразные стратегии, в том числе недостоверные угрозы или обещания, в результате чего совокупность действий, предпринятых в конечном счете, представляет собой совершенное равновесие подыгры. Следовательно, в контексте данной книги совершенное равновесие подыгры — это просто еще одно замысловатое название равновесия обратных рассуждений. На более продвинутых уровнях теории игр, где игры включают в себя сложные структуры данных и информационные множества, совершенное равновесие подыгры имеет более глубокий смысл.
4. Игры с тремя участниками
До сих пор мы обсуждали в данной главе только игры с двумя участниками, каждый из которых делает по два хода. Однако эти же методы применимы и к более крупным и общим играм. Мы проиллюстрируем это на примере игры . В частности, 1) изменим правила игры с последовательного на одновременное выполнение ходов, а также 2) сохраним последовательные ходы, но покажем и проанализируем игру в стратегической форме. Сначала мы воспроизведем дерево игры с последовательными ходами () на рис. 6.10 и напомним вам о равновесии обратных рассуждений.
Рис. 6.10. Игра «уличный сад» с последовательными ходами
Равновесная стратегия Эмили, делающей первый ход, — просто «не вносить вклад». Участница игры, которая ходит второй, выбирает из четырех возможных стратегий (выбор из двух ответных ходов в двух узлах) и останавливается на стратегии «не вносить вклад» (Н), если Эмили выбрала стратегию «внести вклад», и на стратегии «внести вклад» (В), если Эмили выбрала стратегию «не вносить вклад», или в сокращенном виде «Н, если В; В, если Н», или даже просто «НВ». В распоряжении Талии 16 возможных стратегий (выбор из двух ответных ходов в каждом из четырех узлов), а ее равновесная стратегия — «Н после В Эмили и Н Нины, Н после их ВН, Н после их НВ и Н после их НН», или сокращенно «НВВН».
Не забывайте о причине такого выбора. У участницы игры, делающей ход первой, есть возможность выбрать вариант «не вносить вклад», зная, что две другие участницы поймут, что без их вклада сада не будет, а они хотят его достаточно сильно для того, чтобы инвестировать в его создание.
Теперь давайте изменим правила игры таким образом, чтобы сделать ее игрой с одновременными ходами. (В мы решили версию этой игры с одновременными ходами, получив несколько иные выигрыши; здесь мы используем выигрыши из .) Матрица выигрышей представлена на рис. 6.11. Анализ наилучших ответов позволяет без труда определить, что в этой игре четыре равновесия Нэша.
Рис. 6.11. Игра «уличный сад» с одновременными ходами
В трех равновесиях Нэша игры с одновременными ходами две ее участницы вносят вклад, тогда как третья нет. Эти равновесия аналогичны равновесию обратных рассуждений в игре с последовательными ходами. По существу, каждое из них соответствует равновесию обратных рассуждений в последовательной игре с определенным порядком выполнения ходов. Кроме того, любой заданный порядок ходов в последовательной версии игры дает одну и ту же таблицу выигрышей игры с одновременными ходами.
Но в данном случае есть и четвертое равновесие Нэша, при котором ни одна из участниц игры не вносит вклад в создание сада. Принимая во внимание выбор двух других участниц игры (а именно — «не вносить вклад»), один игрок не в силах создать красивый сад и по этой причине тоже останавливается на варианте «не вносить вклад». Таким образом, при переходе от последовательных к одновременным ходам преимущество первого хода утрачивается. При этом возникают несколько равновесий, но лишь в одном из них сохраняется высокий выигрыш участницы игры, сделавшей первый ход в самом начале.
Далее мы вернемся к версии игры с последовательными ходами (первой ходит Эмили, второй Нина, третьей Талия), но представим ее в нормальной или стратегической форме. В игре с последовательными ходами у Эмили две чистые стратегии, у Нины 4, а у Талии 16; это подразумевает построение таблицы выигрышей 2 на 4 на 16. При использовании тех же соглашений, что и при построении таблиц для игры с тремя участниками в , для отображения данной игры понадобилась бы таблица с 16 «страницами» таблиц выигрышей два на четыре. Это слишком громоздко, поэтому мы предпочли переставить участниц игры. Пусть Талии соответствуют строки, Нине столбцы, а Эмили страницы. Тогда все, что нужно для представления данной игры, — это таблица 16 на 4 на 2, показанная на рис. 6.12. Порядок отображения выигрышей по-прежнему соответствует нашему прежнему соглашению об их перечислении в таком порядке: строка, столбец, страница; то есть в нашем примере Талия, Нина, Эмили.
Рис. 6.12. Игра «уличный сад» в стратегической форме
Как и в игре с монетарно-фискальной политикой между ФРС и Конгрессом, в игре «уличный сад» с одновременными ходами множество равновесий Нэша (в мы предложим вам их найти) и только одно совершенное равновесие подыгры, соответствующее равновесию обратных рассуждений, найденное на . Хотя анализ наилучших ответов действительно позволяет отыскать все равновесия Нэша, итеративное исключение доминируемых стратегий может сократить совокупность равновесий до разумного количества, необходимого в данном случае. Такой процесс эффективен, поскольку позволяет определить стратегии, включающие недостоверные элементы (такие как «высокие ставки всегда» в случае ФРС в ). Оказывается, исключение стратегий способно в итоге привести к получению единственного совершенного равновесия подыгры.
На мы начинаем с Талии и исключаем все ее (слабо) доминируемые стратегии. В результате остается только указанная в одиннадцатой строке таблицы, НВВН, которую мы уже вычислили как равновесную, полученную методом обратных рассуждений. Далее мы можем перейти к исключению стратегий Нины, для чего понадобится сравнить исходы, полученные в ходе выбора стратегий, на обеих страницах таблицы. Например, для того чтобы сравнить стратегии Нины ВВ и ВН, необходимо посмотреть на выигрыши, связанные с ВВ на обеих страницах таблицы, и сравнить их с найденными аналогичным способом выигрышами от стратегии ВН. В случае Нины процесс исключения стратегий оставляет ей только стратегию НВ, она и есть равновесная, полученная методом обратных рассуждений выше. И наконец, Эмили нужно всего лишь сравнить две оставшиеся ячейки, связанные с ее выбором «не вносить вклад» и «внести вклад». Эмили получит самый высокий выигрыш, сыграв вариант «не вносить вклад», что она и делает. Как и раньше, мы нашли равновесную стратегию методом обратных рассуждений.
Таким образом, единственный исход в виде совершенного равновесия подыгры соответствует той ячейке таблицы игры на , которая связана со стратегиями равновесия обратных рассуждений каждого игрока. Обратите внимание, что процесс итеративного исключения стратегий, приводящий нас к совершенному равновесию подыгры, выполняется посредством анализа действий игроков в обратном порядке по сравнению с фактическим ходом игры. Этот порядок соответствует тому, в котором действия игроков анализируются в ходе применения метода обратных рассуждений, что позволяет нам исключать именно те стратегии каждого игрока, которые не согласуются с равновесием обратных рассуждений. При этом мы исключаем из рассмотрения все равновесия Нэша, не являющиеся совершенными равновесиями подыгры.
Резюме
Многие игры включают в себя множество различных элементов, одни подразумевают одновременное выполнение ходов, тогда как другие сводятся к их последовательному выполнению. Для иллюстрации двухэтапных (и многоэтапных) игр можно использовать своего рода «дом на дереве»: такая схема позволяет идентифицировать различные этапы игры и связи между ними. Полноценные игры, возникающие на более поздних этапах игры, называются подыграми полной игры.
Изменение правил игры в целях изменения времени выполнения ходов может повлиять (или нет) на равновесный исход игры. Игры с одновременными ходами, преобразованные таким образом, чтобы ходы выполнялись последовательно, могут иметь такой же исход (при наличии у обоих игроков доминирующих стратегий), преимущество первого или второго хода, и обеспечивать более благоприятный исход для обоих игроков. Как правило, в последовательной версии игры с одновременными ходами есть единственное равновесие обратных рассуждений, даже если в ее одновременной версии равновесий нет вообще или, наоборот, их множество. Точно так же в игре с последовательными ходами, имеющей единственное равновесие обратных рассуждений, может быть несколько равновесий Нэша, когда правила игры меняются таким образом, чтобы превратить ее в игру с одновременными ходами.
Игры с одновременными ходами можно представить в виде дерева игры, собрав узлы принятия решений в информационные множества, когда игроки принимают решения, не зная о том, в каком именно узле они окажутся. Точно так же игры с последовательными ходами можно проиллюстрировать с помощью таблицы игры, но при этом необходимо точно определить всю совокупность стратегий, имеющихся в распоряжении каждого игрока. В процессе решения игры с последовательными ходами, представленной в стратегической форме, можно найти множество равновесий Нэша. Их количество можно сократить, воспользовавшись критерием достоверности для исключения некоторых стратегий как потенциально равновесных. Данный процесс позволяет отыскать совершенное равновесие подыгры в игре с последовательными ходами. Все эти процедуры поиска решения применимы и к играм с участием большего количества игроков.
Ключевые термины
Достоверность
Информационное множество
Неравновесные подыгры
Неравновесные пути игры
Подыгра
Продолжение стратегии
Совершенное равновесие подыгры
Упражнения с решениями
S1. Рассмотрите игру с одновременными ходами с участием двух игроков, в которой нет равновесия Нэша в чистых стратегиях, представленную на . Если бы эта игра была преобразована в игру с последовательными ходами, вы бы ожидали появления в ней преимущества первого и второго хода или ни одного из них? Объясните логику своих рассуждений.
S2. Рассмотрите игру, представленную в виде дерева игры ниже. Игрок, делающий ход первым (Игрок 1), может выбрать ход либо «вверх», либо «вниз», после чего Игрок 2 может выбрать «налево» или «направо». Выигрыши в случае возможных исходов указаны в концевых узлах дерева. Изобразите эту игру в стратегической форме (в виде таблицы). Найдите все равновесия Нэша в чистых стратегиях. Если их несколько, укажите, какое из них представляет собой совершенное равновесие подыгры. Для равновесий, не являющихся таковыми, определите причину (источник отсутствия достоверности).
S3. Рассмотрите игру между Airbus и Boeing, описанную в . Представьте ее в стратегической форме и определите все равновесия Нэша. Какое из них представляет собой совершенное равновесие подыгры? Для равновесий, не являющихся таковыми, определите источник отсутствия достоверности.
S4. Вернитесь к дереву игры с двумя участниками, приведенному в .
a) Изобразите эту игру в стратегической форме, где Страшиле соответствуют строки, а Железному Дровосеку — столбцы.
b) Найдите равновесие Нэша.
S5. Вернитесь к дереву игры с двумя участниками, приведенному в .
a) Представьте эту игру в стратегической форме. (Подсказка: используйте решение .) Найдите все равновесия Нэша (их будет много).
b) Для равновесий, найденных в пункте а, которые не являются совершенными равновесиями подыгры, определите проблемы с достоверностью.
S6. Вернитесь к дереву игры с тремя участниками, приведенному в .
a) Составьте таблицу этой игры. Сделайте Страшилу игроком, которому соответствуют строки, Железному Дровосеку — столбцы, а Льву — страницы. (Подсказка: используйте решение .) Найдите все равновесия Нэша (их будет много).
b) Определите проблемы с достоверностью для равновесий, найденных в пункте а, которые не являются совершенными равновесиями подыгры.
S7. Рассмотрим упрощенную версию игры в бейсбол между питчером и бэттером. Питчер выбирает между такими типами подач, как фастбол (прямая подача с большой скоростью полета мяча) и керв (более медленная подача с сильным вращением), тогда как бэттер решает, какой подачи питчера ему следует ожидать. У бэттера есть преимущество, если он правильно определит тип подачи. В этой игре с нулевой суммой выигрыш бэттера — вероятность того, что он получит хит и достигнет первой базы. Выигрыш питчера — вероятность того, что бэттеру не удастся получить хит и добежать до базы, что равно единице минус выигрыш бэттера. Вот четыре возможных исхода игры:
3. Если питчер бросает фастбол, а бэттер ожидает фастбол, вероятность хита 0,300.
4. Если питчер бросает фастбол, а бэттер ожидает керв, вероятность хита 0,200.
5. Если питчер бросает керв, а бэттер ожидает керв, вероятность хита 0,350.
6. Если питчер бросит керв, а бэттер ожидает фастбол, вероятность хита 0,150.
Предположим, питчер «делает подсказки» относительно своих подач, то есть держит мяч, занимает позицию или что-то еще выполняет так, чтобы сообщить бэттеру, какую подачу он собирается сделать. В нашем контексте это означает, что игра между питчером и бэттером — это игра с последовательными ходами, в которой питчер объявляет о своем выборе подачи до выбора бэттером стратегии.
a) Представьте эту ситуацию в виде дерева игры.
b) Предположим, питчер знает, что делает подсказки по поводу подач, но не может удержаться от таких действий. Следовательно, питчер и бэттер играют в игру, дерево которой вы только что нарисовали. Найдите в ней равновесие обратных рассуждений.
c) Теперь измените время выполнения ходов в игре так, чтобы уже бэттеру пришлось раскрывать свои действия (возможно, меняя свою позицию отбивания), прежде чем питчер выберет тип подачи. Нарисуйте дерево игры для этой ситуации и найдите равновесие обратных рассуждений.
Теперь допустим, что каждый игрок делает подсказки настолько быстро, что ни один из них не успевает на них отреагировать, а значит, фактически это игра с одновременными ходами.
d) Нарисуйте дерево игры, представляющее ее как одновременную, отметив информационные множества там, где необходимо.
e) Составьте таблицу этой игры с одновременными ходами. Есть ли в ней равновесие Нэша в чистых стратегиях? Если да, назовите его.
S8. Игру «уличный сад», проанализированную в данной главы, можно отобразить в виде таблицы игры 16 на 4 на 2, если версия игры с последовательным выполнением ходов представлена в стратегической форме, как на . В этой таблице много равновесий Нэша.
a) Используйте анализ наилучших ответов, чтобы найти все равновесия Нэша в таблице игры на .
b) Определите совершенное равновесие подыгры во всей совокупности равновесий Нэша. Другие равновесные исходы игры напоминают совершенное равновесие подыгры (поскольку обеспечивают каждой из трех участниц игры те же выигрыши), однако появляются после различных комбинаций стратегий. Объясните, почему так происходит. Опишите проблемы с достоверностью, возникающие в случае равновесий, не являющихся совершенными равновесиями подыгры.
S9. На двухэтапная игра между компаниями CrossTalk и GlobalDialog представлена в виде сочетания таблиц и деревьев. Изобразите всю эту двухэтапную игру в виде одного большого дерева игры. Не забудьте указать, какой игрок в каждом узле принимает решение, и нарисуйте информационные множества между узлами там, где это необходимо.
S10. Вспомните последовательную игру с тремя участниками о размещении магазинов в торговых центрах, описанную в . Ее дерево напоминает дерево игры «уличный сад», показанное на .
a) Нарисуйте дерево игры с размещением магазинов в торговых центрах. Сколько стратегий есть в распоряжении каждого магазина?
b) Проиллюстрируйте игру в стратегической форме и найдите в ней все равновесия Нэша в чистых стратегиях.
c) Используйте итеративное доминирование для поиска совершенного равновесия подыгры. (Подсказка: перечитайте .)
S11. Согласно правилам игры с размещением магазинов в торговых центрах, проанализированной в упражнении S10, когда все три магазина запрашивают торговую площадь в торговом центре Urban Mall, два самых крупных (и самых престижных) из них получают ее. Кроме того, в исходной версии игры предусматривается, что компании, пытающиеся получить торговую площадь в торговых центрах, ходят последовательно.
a) Допустим, три компании подают запросы на предоставление торговой площади одновременно. Составьте таблицу выигрышей для этой версии игры и найдите все равновесия Нэша. Какие из них, по вашему мнению, скорее всего будут выбраны на практике? Обоснуйте свой вывод.
Теперь предположим, что все три магазина одновременно отправляют запрос в Urban Mall, а два имеющихся помещения распределяются посредством лотереи, что дает каждому магазину равные шансы на получение торговой площади в Urban Mall. При такой схеме вероятность каждого магазина попасть в Urban Mall составляла бы две трети (или 66,67 процента), если бы все три магазина отправили запросы, а вероятность оказаться в одиночестве в Rural Mall — одну треть (33,33 процента).
b) Постройте таблицу новой версии одновременной игры с размещением магазинов в торговых центрах. Найдите в ней все равновесия Нэша. Какие из них, по вашему мнению, будут выбраны на практике с наибольшей вероятностью? Обоснуйте свой вывод.
c) Сравните и проведите различие между равновесиями, найденными в пункте b и а. Вы получили одни и те же равновесия Нэша? Почему да или почему нет?
S12. Вернитесь к игре между Моникой и Нэнси из . Допустим, они выбирают количество усилий последовательно, а не одновременно. Моника делает выбор первой, а Нэнси, узнав об этом, также делает выбор.
a) Найдите совершенное равновесие подыгры, при котором общая прибыль определяется по формуле 4m + 4n + mn, затраты Моники и Нэнси, связанные с вложением усилий, составляют m2 и n2 соответственно, и Моника принимает решение о количестве усилий первой.
b) Сравните выигрыши Моники и Нэнси с выигрышами, вычисленными в . В этой игре присутствует преимущество первого или второго хода? Обоснуйте свой ответ.
S13. В расширенном варианте упражнения S12 Монике и Нэнси необходимо решить, кто из них выберет количество усилий в первую очередь. Для этого каждая из них пишет на листке бумаги, будет ли она делать это первой. Если обе напишут «да» или «нет», значит, им предстоит выбирать количество усилий одновременно, как в . Если Моника напишет «да», а Нэнси «нет», то Моника будет первой принимать решение о количестве усилий, как в упражнении S12. Если Моника напишет «нет», а Нэнси «да», тогда Нэнси первой примет решение.
a) На основании выигрышей Моники и Нэнси, полученных в упражнении S12 выше, а также в , постройте таблицу для первого этапа игры в принятие решений. (Подсказка: обратите внимание на симметричность игры.)
b) Найдите равновесия Нэша в чистых стратегиях на первом этапе игры.
Упражнения без решений
U1. Рассмотрим игру с участием двух игроков, А и Б. Игрок А ходит первым и выбирает либо «вверх», либо «вниз». Если игрок А выберет «вверх», игра завершится и каждый получит выигрыш 2. Если игрок А сыграет «вниз», наступит очередь игрока Б делать ход, выбрав один из двух вариантов — «налево» или «направо». Если Б выберет «налево», оба игрока получат выигрыш 0, если «направо», игрок А получит выигрыш 3, а игрок Б — выигрыш 1.
a) Нарисуйте дерево этой игры и найдите совершенное равновесие подыгры.
b) Представьте эту игру с последовательными ходами в стратегической форме и отыщите все равновесия Нэша. Какое из них будет совершенным равновесием подыгры? Если таковых нет, объясните почему.
c) Какой метод решения можно было бы использовать для поиска совершенного равновесия подыгры на основании стратегической формы игры? (Подсказка: перечитайте .)
U2. Вернитесь к дереву игры с двумя участниками в .
a) Опишите игру в стратегической форме, где Альбусу соответствуют строки, а Минерве — столбцы. Найдите все равновесия Нэша.
b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а данного упражнения, которые не будут совершенными равновесиями подыгры.
U3. Вернитесь к дереву игры с двумя участниками в .
a) Опишите игру в стратегической форме. Найдите все равновесия Нэша.
b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а данного упражнения, которые не будут совершенными равновесиями подыгры.
U4. Вернитесь к дереву игры с двумя участниками в .
a) Составьте таблицу этой игры, в которой Альбусу соответствуют строки, Минерве — столбцы, а Северусу — страницы. Найдите все равновесия Нэша.
b) Выявите проблемы с достоверностью для равновесий, найденных в пункте а, которые не будут совершенными равновесиями подыгры.
U5. Рассмотрим отрасль по производству колы, в которой Coke и Pepsi — две ведущие компании (для простоты анализа просто забудем об остальных). Объем рынка составляет 8 миллиардов долларов. Каждая компания решает, рекламировать ли ей свою продукцию; если да, то реклама обойдется в 1 миллиард долларов. Если одна компания будет размещать рекламу, а другая нет, то первая компания захватит весь рынок. Если обе компании будут рекламировать свою продукцию, они разделят рынок поровну и понесут расходы на рекламу. Если обе компании не будут размещать рекламу, они разделят рынок поровну без расходов на рекламу.
a) Составьте таблицу выигрышей для этой игры и найдите равновесие в случае, если обе компании ходят одновременно.
b) Постройте дерево игры исходя их предположения, что ходы в ней выполняются последовательно: первой ходит Coke, а затем Pepsi.
c) Будет ли любое из равновесий, найденных в пунктах а и b, более выгодным по сравнению с общей перспективой для Coke и Pepsi? Как обе компании могли бы добиться большего?
U6. На участке вдоль пляжа отдыхают 500 детей, разделенных на пять кластеров, по 100 детей в каждом. (Обозначим их А, Б, В, Г, Д.) Два торговца мороженым одновременно решают, где разместить свои торговые точки по его продаже. Они должны выбрать точное местоположение одного из кластеров.
Если в одном кластере есть один торговец, мороженое купят все 100 детей, входящие в состав этого кластера. Для кластеров без торговца мороженым 50 из 100 детей захотят пойти к торговой точке, находящейся на расстоянии в один кластер, 20 детей захотят пойти к точке, расположенной на расстоянии в два кластера, и никто не пожелает преодолевать ради мороженого расстояние в три и более кластеров. Мороженое быстро тает, поэтому дети, которые все же отправятся за ним, не смогут купить его и для тех, кто остался на месте.
Если оба торговца мороженым выберут один и тот же кластер, каждый получит 50 процентов доли от общего спроса на мороженое. Если они предпочтут разные кластеры, то те дети (остающиеся на месте или ушедшие за мороженым), к которым один торговец находится ближе, чем к другим, отправятся к нему, а дети, находящиеся на равном расстоянии от двух торговцев, разделятся между ними поровну. Каждый торговец стремится максимально увеличить объем продаж.
a) Составьте таблицу выигрышей пять на пять для игры в местоположение торговцев мороженым; приведенные ниже исходные данные помогут вам начать и проверить правильность своих расчетов:
• если оба торговца решают разместить свои торговые точки в кластере А, каждый из них продаст 85 единиц продукции;
• если первый торговец выберет кластер Б, а второй кластер В, первый продаст 150, а второй 170 единиц продукции;
• если первый торговец выберет кластер Д, а второй кластер Б, первый продаст 150, а второй 200 единиц продукции.
b) Исключите как можно больше доминируемых стратегий.
c) В оставшихся ячейках таблицы найдите все равновесия Нэша в чистых стратегиях.
d) Если преобразовать эту игру в игру с последовательными ходами, в которой первый торговец выбирает место первым, а второй вторым, то каким будет местоположение торговых точек и какой объем продаж будет получен в результате совершенного равновесия подыгры? Как изменение времени выполнения ходов помогает участникам игры решить проблему координации, о которой идет речь в пункте с?
U7. Вернитесь к игре между тремя львами в римском Колизее, представленной в .
a) Опишите ее в стратегической форме, где льву 1 соответствуют строки, льву 2 столбцы, а льву 3 страницы.
b) Найдите равновесия Нэша в этой игре. Сколько их вы нашли?
c) Вы должны были обнаружить равновесия Нэша, которые не будут совершенными равновесиями подыгры. Какой лев представляет недостоверные угрозы в случае каждого из этих равновесий? Объясните свою точку зрения.
U8. Предположим, что в игре с размещением магазинов в торговых центрах (из и в данной главе) ходы выполняются последовательно, но в другом порядке: Big Giant, затем Titan, а затем Frieda’s.
a) Нарисуйте новое дерево игры.
b) Найдите совершенное равновесие подыгры этой игры. Чем оно отличается от совершенного равновесия подыгры, полученного в ?
c) Опишите новую версию игры в стратегической форме.
d) Найдите все равновесия Нэша в этой игре. Сколько их? Как это соотносится с количеством равновесий, найденных в в данной главе?
U9. Вернитесь к игре между Моникой и Нэнси из . Допустим, они выбирают количество усилий последовательно, а не одновременно. Моника делает это первой, а Нэнси, узнав об этом решении, также выбирает количество усилий.
a) Найдите совершенное равновесие подыгры, при котором общая прибыль определяется по формуле 5m + 4n + mn, затраты Моники и Нэнси, связанные с вложением усилий, составляют m2 и n2 соответственно и Моника принимает решение о количестве усилий первой.
b) Сравните выигрыши Моники и Нэнси с выигрышами, вычисленными в . В этой игре есть преимущество первого или второго хода?
c) Воспользовавшись той же функцией общей прибыли, что и в пункте а, найдите совершенное равновесие подыгры для игры, в которой Нэнси первой принимает решение о количестве усилий.
U10. В расширенном варианте упражнения U9 Монике и Нэнси необходимо решить, кто из них выберет количество усилий в первую очередь. Для этого каждая пишет на листке бумаги, будет ли она принимать решение первой. Если обе напишут «да» или «нет», им предстоит выбирать количество усилий одновременно, как в . Если Моника напишет «да», а Нэнси «нет», то они сыграют в игру, представленную в пункте а упражнения U9. Если Моника напишет «нет», а Нэнси «да», то они сыграют в игру из пункта c.
a) На основании выигрышей Моники и Нэнси, полученных в упражнении U9 выше, а также в , составьте таблицу для первого этапа игры в принятие решений.
b) Найдите равновесия Нэша в чистых стратегиях на первом этапе игры.
U11. В отдаленном городке Сент-Джеймс две компании, Bilge и Chem, конкурируют на рынке безалкогольных напитков (Coke и Pepsi пока на этом рынке нет). Bilge и Chem продают идентичную продукцию, а так как их продукт — жидкость, у них есть возможность выпускать его в более мелких емкостях. Поскольку на данном рынке представлены только эти две компании, цена товара P (в долларах) определяется по формуле P = (30 — Q B — Q C ), где Q B — количество продукции, выпускаемой Bilge, а Q C — количество продукции Chem (в обоих случаях оно измеряется в литрах). В настоящее время обе компании рассматривают возможность инвестиций в новое оборудование для разлива напитков в бутылки, которое позволит сократить переменные издержки.
a) Если компания j решит не инвестировать, ее затраты составят C j = Q2j / 2, где j обозначает либо B (Bilge), либо C (Chem).
b) Если компания j решит инвестировать, ее затраты составят C j = 20 + Q2j / 6, где j обозначает либо B (Bilge), либо C (Chem). Эта новая функция издержек отображает фиксированную стоимость оборудования (20), а также более низкие переменные издержки.
Две компании принимают решения об инвестициях одновременно, но выигрыш в этой игре в инвестиции будет зависеть от игр в дуополию, которые возникнут впоследствии. Следовательно, игра состоит из двух этапов: сначала принять решение об инвестициях, а затем играть в дуополию.
a) Предположим, обе компании решают инвестировать. Запишите функции их прибыли, выраженные через QB и QC, и найдите с их помощью равновесия Нэша в игре с определением количества. Чему равны количество и прибыль обеих компаний при таком равновесии? Какова рыночная цена?
b) Допустим, обе компании решают не инвестировать. Чему равно количество продукции и прибыль обеих компаний при таком равновесии? Какова рыночная цена?
c) Теперь предположим, что компания Bilge решает инвестировать, а Chem — нет. Чему равно количество продукции и прибыль обеих компаний при таком равновесии? Какова рыночная цена?
d) Составьте таблицу два на два для игры в инвестиции между этими компаниями. В распоряжении каждой из них есть две стратегии: «инвестировать» и «не инвестировать». Выигрыши компаний — их прибыль, вычисленная в пунктах а, b и с. (Подсказка: обратите внимание на симметричность игры.)
e) Есть ли совершенное равновесие подыгры в этой двухэтапной игре в целом?
U12. Два французских аристократа, шевалье Шагрин и маркиз де Ренар, дерутся на дуэли. У каждого пистолет заряжен одной пулей. Находясь на расстоянии 10 шагов, они начинают идти навстречу друг другу, перемещаясь с одинаковой скоростью, по 1 шагу за один раз. После каждого шага один из них может выстрелить. Когда один из дуэлянтов стреляет, вероятность попасть в цель зависит от расстояния. После k шагов она составляет k/5, а значит, повышается с 0,2 после первого шага до 1 (определенность) после 5 шагов, когда соперники находятся напротив друг друга. Если один игрок выстрелит и промахнется, тогда как другому еще предстоит сделать выстрел, оба должны продолжать движение даже несмотря на то, что того, кто уже не может стрелять, ждет неминуемая смерть, — таковы правила кодекса чести аристократии. Каждый игрок получает выигрыш −1, если он сам будет убит, и 1, если будет убит его соперник. Если оба останутся живы или оба будут убиты, каждый получит выигрыш 0.
Это игра с пятью последовательными шагами и одновременными ходами (стрелять или не стрелять) на каждом шаге. Найдите совершенное равновесие подыгры в этой игре.
Подсказка: начните с шага 5, когда дуэлянты стоят прямо напротив друг друга. Составьте таблицу два на два для игры с одновременными ходами на этом этапе и найдите равновесие Нэша. Теперь перейдите к шагу 4, где вероятность попасть в цель составляет 4/5, или 0,8 для каждого игрока. Составьте таблицу два на два для игры с одновременными ходами на этом этапе, правильно указав в соответствующей ячейке, что произойдет в дальнейшем. Например, если один игрок стреляет и промахивается, а другой не стреляет, то другой подождет, пока сможет сделать пятый шаг, и точно попадет в цель. Если ни один из игроков не стреляет, тогда игра перейдет на следующий этап, по которому вы уже нашли равновесие. С помощью всей этой информации определите выигрыши в таблице два на два на шаге 4 и найдите равновесие Нэша на этом этапе. Для поиска равновесных стратегий всей игры проанализируйте оставшиеся шаги в обратном порядке.
U13. Опишите пример конкуренции между компаниями, аналогичный по своей структуре дуэли из упражнения U12.
Глава 7. Игры с одновременными ходами: смешанные стратегии
* * *
В ходе анализа игр с одновременными ходами в мы столкнулись с целым классом игр, нерешаемых посредством описанных там методов. Дело в том, что в играх этого класса нет равновесий Нэша в чистых стратегиях, и для того чтобы определить исход таких игр, необходимо расширить концепции стратегии и равновесий. Это можно сделать с помощью рандомизации ходов, которая и будет в центре внимания в данной главе.
Рассмотрим игру в . Это игра с нулевой суммой, в которой интересы двух теннисисток прямо противоположны. Эверт стремится направить обводящий удар в любую сторону — по линии (ПЛ) или по диагонали (ПД), — не прикрытую Навратиловой, тогда как Навратилова старается прикрыть именно ту сторону, в которую Эверт сделает удар. В мы отметили, что в такой ситуации Навратилова сможет использовать любой системный выбор Эверт себе на пользу, а значит, во вред Эверт. Со своей стороны, Эверт может использовать любой системный выбор Навратиловой. Для того чтобы этого избежать, каждая теннисистка пытается держать соперницу в неведении с помощью бессистемных или случайных действий.
Однако хаотичность действий не означает выбора каждого типа удара в половине случаев или их чередование. Чередование ударов уже само по себе было бы системным действием, которое можно использовать, поэтому случайная комбинация действий в соотношении 60 на 40 или 75 на 25 (в зависимости от ситуации) может быть лучше, чем 50 на 50. В данной главе мы рассмотрим методы расчета наилучшей комбинации ходов, а также обсудим, как эта теория поможет нам понять фактический ход таких игр.
Наш метод вычисления лучшей комбинации применим также к играм с ненулевой суммой. Однако в них интересы игроков частично совпадают, поэтому когда игрок Б использует системный выбор игрока А с выгодой для себя, это не всегда вредит игроку А. Следовательно, в играх с ненулевой суммой логика действий, согласно которой другого игрока следует держать в неведении, более слабая или вообще отсутствует. Мы поговорим о том, имеют ли равновесия в смешанных стратегиях смысл в таких играх и когда именно это происходит.
Начнем главу с анализа смешивания стратегий в играх два на два, а также с самого прямого метода поиска наилучших ответов и равновесия в смешанных стратегиях. Многие концепции и методы, которые мы сформулируем в , сохранят свою актуальность и в более общих играх, а в и их область применения распространится на игры, участники которых могут иметь свыше двух чистых стратегий. В конце мы выскажем ряд общих наблюдений по поводу смешивания стратегий на практике, а также приведем некоторые эмпирические данные о том, присутствует ли такое смешивание стратегий в реальной жизни.
1. Что такое смешанная стратегия
Когда игроки предпочитают действовать бессистемно, они делают случайный выбор из имеющихся чистых стратегий. В игре в розыгрыш очка в теннисе Навратилова и Эверт выбирают одну из двух заданных чистых стратегий, ПЛ или ПД. Мы называем случайную комбинацию этих двух стратегий смешанной стратегией.
Такие смешанные стратегии охватывают целый диапазон непрерывных значений. На одном его конце вариант ПЛ может быть выбран с вероятностью 1 (гарантированно), тогда как вариант ПД не будет выбран никогда (вероятность 0); эта комбинация представляет собой чистую стратегию ПЛ. На другом конце диапазона вариант ПЛ может быть выбран с вероятностью 0, а ПД — с вероятностью 1; данная комбинация представляет собой чистую стратегию ПД. В промежутке между ними находится целое множество возможностей: ПЛ выбирается с вероятностью 75 % (0,75), а ПД — 25 % (0,25); или оба варианта выбираются с вероятностью 50 % (0,5) каждый; или вариант ПЛ выбирается с вероятностью 1/3 (33,33…%), а ПД — 2/3 (66,66…%) и т. д.
Выигрыши, полученные в результате применения смешанной стратегии, определяются как соответствующие значения взвешенного по вероятности среднего выигрышей от чистых стратегий, входящих в состав данной смешанной стратегии. Например, в игре в теннис из (против стратегии ПЛ Навратиловой) выигрыш Эверт от стратегии ПЛ равен 50, а от стратегии ПД 90. Следовательно, ее выигрыш от смешанной стратегии (0,75 ПЛ, 0,25 ПД) в игре против стратегии ПЛ Навратиловой составит 0,75 × 50 + 0,25 × 90 = 37,5 + 22,5 = 60. Это и есть ожидаемый выигрыш Эверт от данной смешанной стратегии.
Вероятность выбора той или иной чистой стратегии — это непрерывная переменная с диапазоном значений от 0 до 1. Стало быть, смешанные стратегии — просто особый тип непрерывно меняющихся стратегий наподобие тех, которые мы изучали в . Каждая чистая стратегия — это предельный частный случай, в котором вероятность ее выбора равна 1.
Понятие равновесия Нэша также можно расширить, включив в него смешанные стратегии. Равновесие Нэша определяется как совокупность стратегий (по одной на каждого игрока), при которой выбор каждого игрока для него наилучший с точки зрения обеспечения его максимального ожидаемого выигрыша с учетом смешанных стратегий других игроков. Допустимость использования в игре смешанных стратегий автоматически и практически полностью решает проблему возможного отсутствия равновесия Нэша, с которой мы столкнулись в случае чистых стратегий. Знаменитая теорема Нэша показывает, что при самых общих условиях (достаточно широких, чтобы охватывать все игры, рассматриваемые в данной книге, и многие другие) равновесие Нэша в смешанных стратегиях существует всегда.
Таким образом, на самом обобщенном уровне включение смешанных стратегий в наш анализ не подразумевает ничего выходящего за пределы общей теории непрерывных стратегий, сформулированной в . Тем не менее частный случай смешанных стратегий действительно поднимает ряд особых концептуальных и методологических вопросов, поэтому заслуживает специального изучения.
2. Смешивание ходов
Начнем с примера игры в теннис из , в которой не было равновесия Нэша в чистых стратегиях, и покажем, как расширение этой концепции на смешанные стратегии позволяет устранить данный недостаток, а также объясним полученное в итоге равновесие как равновесие, при котором каждый игрок держит соперника в неведении.
А. Преимущество смешивания ходов
На рис. 7.1 воспроизведена матрица выигрышей, представленная на . В этой игре, если Эверт будет всегда выбирать удар по линии (ПЛ), Навратилова будет прикрывать ПЛ и удерживать выигрыш Эверт на уровне 50. Точно так же, если Эверт будет всегда выбирать удар по диагонали (ПД), Навратилова будет удерживать выигрыш Эверт на уровне 20. Если Эверт может выбирать только одну из двух базовых (чистых) стратегий, а Навратилова — спрогнозировать ее выбор, то более подходящая (или менее неподходящая) стратегия Эверт — ПЛ, обеспечивающая ей выигрыш 50.
Рис. 7.1. Отсутствие равновесия в чистых стратегиях
Но допустим, Эверт не ограничена выбором только чистых стратегий и может применить смешанную стратегию, возможно, именно ту, в соответствии с которой вероятность того, что она выберет ПЛ в каком бы то ни было случае, составляет 75 %, или 0,75, что означает, что вероятность того, что она выберет ПД, равна 25 %, или 0,25. С помощью метода, представленного в , можно рассчитать ожидаемый выигрыш Навратиловой при выборе Эверт такой комбинации стратегий. Он составляет:
0,75 × 50 + 0,25 × 10 = 37,5 + 2,5 = 40, если она прикроет ПЛ,
0,75 × 20 + 0,25 × 80 = 15 + 20 = 35, если она прикроет ПД.
Если Эверт выберет комбинацию стратегий 75 на 25, ожидаемые выигрыши показывают, что Навратилова может использовать эту комбинацию с максимальной выгодой для себя, прикрыв удар ПЛ.
Когда Навратилова выбирает ПЛ, чтобы наилучшим образом использовать комбинацию Эверт 75 на 25, это наносит Эверт ущерб, поскольку перед нами игра с нулевой суммой. Ожидаемые выигрыши Эверт составляют:
0,75 × 50 + 0,25 × 90 = 37,5 + 22,5 = 60, если Навратилова прикроет ПЛ,
0,75 × 80 + 0,25 × 20 = 60 + 5 = 65, если Навратилова прикроет ПД.
Выбрав ПЛ, Навратилова удержит выигрыш Эверт на уровне 60, а не 65. Но заметьте, что выигрыш Эверт при такой комбинации стратегий все равно лучше выигрыша 50 в случае использования чистой стратегии ПЛ или 20 при выборе чистой стратегии ПД.
Комбинация стратегий в соотношении 75 на 25 позволяет Эверт повысить выигрыш по сравнению с выигрышем в чистых стратегиях, однако все же оставляет стратегию Эверт в какой-то степени открытой для того, чтобы Навратилова использовала ее с выгодой для себя. Решив прикрывать удар ПЛ, она может добиться того, что Эверт получит более низкий выигрыш, чем при выборе стратегии ПД. Эверт хотела бы найти комбинацию стратегий, защищенную от использования, то есть такую, при которой у Навратиловой не было бы очевидного варианта чистой стратегии, которую можно было бы применить против данной стратегии Эверт. Комбинация стратегий Эверт, защищенная от использования, должна обладать свойством, обеспечивающим Навратиловой один и тот же ожидаемый выигрыш, какой бы удар она ни прикрывала, ПЛ или ПД: Навратиловой должно быть безразлично, какую из двух имеющихся чистых стратегий выбрать. Мы называем это свойством безразличия соперника, и, как мы увидим ниже в данной главе, это ключ к равновесиям в смешанных стратегиях в ненулевых играх.
Для поиска комбинации стратегий, защищенной от использования соперником, необходимо применить более общий подход к описанию смешанной стратегии Эверт, чтобы алгебраическим путем рассчитать вероятности чистых стратегий, входящих в соответствующую смешанную стратегию. Обозначим вероятность выбора Эверт ПЛ алгебраическим символом p, тогда вероятность выбора ПД будет 1 — p. Для краткости назовем такую совокупность p-комбинацией.
Если Эверт выберет р-комбинацию, ожидаемые выигрыши Навратиловой составят:
50 p + 10(1 — p ), если она прикроет ПЛ,
20 p + 80(1 — p ), если она прикроет ПД.
Для стратегии Эверт, чтобы ее р-комбинация была защищена от использования, два выигрыша Навратиловой должны быть равны, то есть 50p + 10(1 — p) = 20p + 80(1 — p), или 30p = 70(1 — p), или 100p = 70, или p = 0,7. Таким образом, в комбинации стратегий Эверт, защищенной от использования, стратегия ПЛ применяется в 70 % случаев, а ПД — в 30 % случаев. При таких вероятностях, заданных смешанной стратегией, Навратилова получит один и тот же ожидаемый выигрыш за счет каждой из своих чистых стратегий, а значит, не сможет использовать ни одну из них с выгодой для себя (или в ущерб Эверт в игре с нулевой суммой). Ожидаемый выигрыш Эверт от смешанной стратегии составит:
50 × 0,7 + 90 × 0,3 = 35 + 27 = 62, если Навратилова прикроет ПЛ,
80 × 0,7 + 20 × 0,3 = 56 + 6 = 62, если Навратилова прикроет ПД.
Этот ожидаемый выигрыш лучше выигрыша 50, который Эверт получила бы при использовании чистой стратегии ПЛ, и выигрыша 60, полученного в случае комбинации 75 на 25. Теперь мы знаем, что эта смешанная стратегия защищена от использования, но является ли она оптимальной или равновесной стратегией Эверт?
Б. Наилучшие ответы и равновесие
Для того чтобы найти равновесную комбинацию стратегий в этой игре, вернемся к методу анализа наилучших ответов, описанному в , и расширим его на игры с непрерывными стратегиями наподобие тех, которые представлены в . Наша первоочередная задача — определить наилучший ответ Эверт (ее наилучший выбор вероятности p) на каждую из возможных стратегий Навратиловой. Поскольку эти стратегии также могут быть смешанными, их можно описать посредством вероятности того, что она прикроет ПЛ. Обозначим эту вероятность как q; тогда 1 — q — вероятность того, что Навратилова прикроет ПД. Назовем смешанную стратегию Навратиловой «q-комбинация» и попытаемся найти наилучший ответ Эверт p в случае выбора Навратиловой каждого возможного значения q.
Из таблицы выигрышей на следует, что р-комбинация Эверт обеспечивает ей такой ожидаемый выигрыш:
50 p + 90(1 — p ), если Навратилова выберет ПЛ,
80 p + 20(1 — p ), если Навратилова выберет ПД.
Стало быть, в случае q-комбинации Навратиловой ожидаемый выигрыш Эверт составит:
[50 p + 90(1 — p )] q + [80 p + 20(1 — p )](1 — q ).
Перегруппировав члены выражения, получаем следующую формулу вычисления ожидаемого выигрыша Эверт:
[50 q + 80(1 — q )] p + [90 q + 20(1 — q )] (1 — p ) = [90 q + 20(1 — q )] + [50 q + 80(1 — q ) — 90 q — 20(1 — q )] p = [20 + 70 q ] + [60 — 100 q ] p .
Используем этот ожидаемый выигрыш для поиска значений наилучших ответов p Эверт.
Мы пытаемся определить значение p, максимизирующее выигрыш Эверт при каждом значении q, поэтому основной вопрос состоит в том, как формула расчета ожидаемого выигрыша зависит от p. Здесь важную роль играет коэффициент перед p: [60 –100 q]. В частности, имеет значение положительный он (тогда ожидаемый выигрыш Эверт увеличивается по мере увеличения p) или отрицательный (тогда ожидаемый выигрыш Эверт уменьшается по мере увеличения p). Очевидно, что знак этого коэффициента зависит от значения q, причем q имеет критическое значение в случае, когда 60 — 100q = 0; то есть q равно 0,6.
Когда при q < 0,6 Навратиловой коэффициент [60 — 100q] имеет положительное значение, ожидаемый выигрыш Эверт увеличивается по мере повышения значения p и ее наилучший выбор p = 1, или чистая стратегия ПЛ. Аналогичным образом при q > 0,6 Навратиловой наилучший выбор Эверт — p = 0, или чистая стратегия ПД. Если q = 0,6, Эверт получит один и тот же ожидаемый выигрыш независимо от значения p; при этом любая комбинация стратегий ПЛ и ПД так же эффективна, как и любая другая: любое значение p в диапазоне от 0 до 1 может быть наилучшим ответом. Кратко сформулируем эти выводы, для того чтобы использовать их в будущем.
Если q < 0,6, наилучший ответ p = 1 (чистая стратегия ПЛ).
Если q = 0,6, любая p -комбинация будет наилучшим ответом.
Если q > 0,6, наилучший ответ p = 0 (чистая стратегия ПД).
Для быстрого подтверждения этих интуитивных выводов заметим, что при низком значении q (Навратилова с достаточно низкой вероятностью будет прикрывать удар ПЛ) Эверт следует выбрать ПЛ, а при высоком значении q (Навратилова с достаточно высокой вероятностью будет прикрывать удар ПЛ) — ПД. Точное значение этой «достаточности», а значит, и точка перехода на другую стратегию q = 0,6 зависят от конкретных выигрышей в данном примере.
Мы уже говорили о том, что смешанные стратегии — это просто особый тип непрерывной стратегии, в которой вероятность играет роль непрерывной переменной. Теперь мы нашли наилучшее значение p Эверт, соответствующее каждому значению q, выбранному Навратиловой. Иными словами, определили правило наилучших ответов Эверт, которое можно отобразить на графике так же, как мы это делали в .
Этот график расположен в левом фрагменте рисунка 7.2, где значения q показаны на горизонтальной оси, а значения p — на вертикальной. Обе вероятности ограничены диапазоном от 0 до 1. Если q меньше 0,6, p имеет максимальное значение 1; если q больше 0,6, p имеет минимальное значение 0. При q = 0,6 все значения p от 0 до 1 в равной степени наилучшие для Эверт, поэтому наилучший ответ — вертикальная линия, находящаяся между 0 и 1. Этому графику наилучших ответов присуща своя особенность: в отличие от непрерывно восходящих или нисходящих прямых или кривых линий в , данный график плоский в двух интервалах значений q и опускается за один шаг в точке сопряжения этих интервалов. Тем не менее в концептуальном смысле он ничем не отличается от любого другого графика наилучших ответов.
Рис. 7.2. Наилучшие ответы и равновесие в игре в теннис
Аналогичным образом можно вычислить правило наилучших ответов Навратиловой (ее наилучшую q-комбинацию, соответствующую каждой из p-комбинаций Эверт). Мы предлагаем вам сделать это самостоятельно, чтобы закрепить понимание самой концепции и алгебраических вычислений. Кроме того, вы должны проверить правильность интуитивных выводов в отношении выбора Навратиловой так, как мы это делали для Эверт. Мы же просто приведем здесь полученный результат.
Если p < 0,7, наилучший ответ q = 0 (чистая стратегия ПД).
Если p = 0,7, любая q -комбинация будет наилучшим ответом.
Если p > 0,7, наилучший ответ q = 1 (чистая стратегия ПЛ).
График этого правила наилучших ответов Навратиловой расположен в среднем фрагменте .
В правом фрагменте объединены графики из двух соседних фрагментов, причем левый график отражен по диагонали (линия p = q) с тем, чтобы значения p оказались на горизонтальной оси, а значения q — на вертикальной, после чего совмещен со средним графиком. Теперь серые и черные линии пересекаются в одной точке, где p = 0,7, а q = 0,6. В этой точке выбор смешанной стратегии каждым игроком будет наилучшим ответом на выбор другого игрока, поэтому данная пара образует равновесие Нэша в смешанных стратегиях.
В таком представлении правил наилучших ответов чистые стратегии — особые случаи, соответствующие предельным значениям переменных p и q. Как видим, графики наилучших ответов не имеют общих точек на любой из сторон квадрата, где каждое значение p и q равно либо 0, либо 1. Это говорит об отсутствии в игре равновесий в чистых стратегиях, как и было показано в . В этом примере равновесие в смешанных стратегиях — единственное равновесие Нэша в данной игре.
С помощью метода, примененного нами в для поиска защищенного от использования значения p для Эверт, вы также можете вычислить выбор Навратиловой значения q, защищенного от использования. Выполнив соответствующие расчеты, получите значение q = 0,6. Таким образом, две выбранные участницами игры смешанные стратегии, защищенные от использования, на самом деле и наилучшие ответы друг на друга, которые представляют собой смешанные стратегии двух игроков, образующие равновесие Нэша.
В действительности, чтобы найти равновесие в смешанных стратегиях в игре с нулевой суммой, каждый участник которой располагает двумя чистыми стратегиями, не нужно проходить весь процесс определения правил наилучших ответов, построения соответствующих графиков и поиска точки их пересечения. Вы можете просто записать уравнения защищенности от использования из по комбинации каждого игрока, а затем решить их. Если в полученном решении обе вероятности попадают в диапазон от 0 до 1, вы нашли то, что нужно. Если одна из вероятностей имеет отрицательное значение или значение больше 1, значит, в данной игре нет равновесия в смешанных стратегиях и вам необходимо снова поискать его в чистых стратегиях. В и представлен анализ методов решения игр, участники которых имеют более двух чистых стратегий.
3. Равновесие Нэша как система убеждений и ответов
При одновременном выполнении ходов ни один из игроков не может отреагировать на фактический выбор другого игрока. Вместо этого каждый участник игры предпринимает свое наилучшее действие, исходя из представлений о том, какой именно ход выбирает в данный момент соперник. В мы назвали такие представления убеждениями игрока относительно выбора стратегии другим игроком, затем интерпретировали равновесие Нэша как конфигурацию стратегий, при которой эти убеждения верны, а значит, каждый игрок выбирает свой наилучший ответ на фактические действия другого игрока. Эта концепция оказалась весьма полезной для понимания структуры и исхода многих важных типов игр, особенно таких, как дилемма заключенных, координационные игры и игра в труса.
Однако в мы рассматривали исключительно равновесия Нэша в чистых стратегиях. По этой причине осталось почти незамеченным одно скрытое предположение: каждый игрок твердо убежден, что другой игрок выберет определенную чистую стратегию. Теперь, когда мы анализируем более общие смешанные стратегии, концепция убеждения требует новой интерпретации.
Порой игроки не уверены в предполагаемых действиях других участников игры. Так, в , в которой Гарри хочет встретиться с Салли, Гарри не уверен в том, куда отправится Салли — в Starbucks или Local Latte, и его убеждение может сводиться к тому, что она окажется в любом из этих кафе с вероятностью 50 на 50. А в Эверт могла осознавать, что Навратилова пытается держать ее в неведении, а значит, она (Эверт) не может быть уверена в том, какое из доступных действий выберет Навратилова. В мы обозначили такую ситуацию термином «стратегическая неопределенность», а в указали, что такая неопределенность приводит к формированию равновесий в смешанных стратегиях. Теперь же рассмотрим эту идею более подробно.
Однако важно различать неуверенность и неправильные убеждения. Скажем, в примере с игрой в теннис Навратилова не может быть уверена в том, что выберет Эверт в каждом конкретном случае. Тем не менее у нее могут быть правильные убеждения относительно комбинации стратегий Эверт, а именно вероятности, с которой она выбирает между своими двумя чистыми стратегиями. Наличие правильных убеждений по поводу смешанных действий означает знание, или вычисление, или догадки в отношении правильных вероятностей, с которыми другой игрок делает выбор между своими базовыми или чистыми стратегиями. Что касается равновесия в нашем примере, оказалось, что равновесная комбинация стратегий Эверт составила 70 % для ПЛ и 30 % для ПД. Если Навратилова убеждена в том, что Эверт выберет ПЛ с вероятностью 70 % и ПД с вероятностью 30 %, то ее убеждения в данном равновесии будут правильными, хотя и неопределенными.
Таким образом, у нас есть альтернативный и математически эквивалентный способ определения равновесия Нэша в категориях убеждений: каждый игрок формирует убеждения о вероятностях в той комбинации стратегий, которую применяет другой игрок, и выбирает на нее собственный наилучший ответ. Равновесие Нэша в смешанных стратегиях наблюдается в случае правильности этих убеждений в указанном нами смысле.
В следующем разделе мы рассмотрим смешанные стратегии и соответствующие равновесия Нэша в играх с ненулевой суммой. В таких играх нет общих оснований для того, чтобы стремление другого игрока удовлетворить собственные интересы противоречило вашим интересам. Следовательно, в таких играх вам далеко не всегда нужно скрывать свои намерения от другого игрока, а также нет причин держать его в неведении. Тем не менее из-за одновременного выполнения ходов каждый игрок может испытывать субъективную неуверенность относительно действий другого игрока, поэтому у него могут быть неопределенные убеждения, вынуждающие его сомневаться в целесообразности собственных действий. Все это может привести к формированию равновесий в смешанных стратегиях, а их интерпретация в категориях субъективно неопределенных, но правильных убеждений играет особенно важную роль.
4. Смешивание стратегий в играх с ненулевой суммой
Методы поиска равновесий в смешанных стратегиях в играх с нулевой суммой (такие как защищенность от использования соперником или свойство безразличия соперника) применимы и к играм с ненулевой суммой, причем в некоторых из них действительно позволяют найти равновесия в смешанных стратегиях. Однако в таких играх интересы игроков могут в определенной степени совпадать. Следовательно, тот факт, что другой игрок использует ваш системный выбор стратегий с выгодой для себя, необязательно означает, что это нанесет ущерб вам, как в случае игр с нулевой суммой. Например, в , игроки способны лучше координировать свои действия, если каждый из них может полагаться на системные действия другого, поскольку случайный выбор действий только повышает риск неудачи с их координацией. Именно поэтому в играх с ненулевой суммой равновесия в смешанных стратегиях имеют слабое логическое обоснование или не имеют его вообще. Ниже мы проанализируем равновесия в смешанных стратегиях в контексте некоторых известных игр с ненулевой суммой, а также обсудим их значимость или отсутствие таковой.
А. Встретятся ли Гарри и Салли? Доверие, чистая координация и битва полов
Проиллюстрируем смешивание стратегий в играх с ненулевой суммой на примере игры «встреча», основанной на игре в доверие. Для вашего удобства мы воспроизводим таблицу этой игры (см. ) на рис. 7.3. Сначала проанализируем игру с точки зрения Салли. Если она уверена в том, что Гарри отправится в Starbucks, ей тоже следует туда пойти. Если она уверена, что Гарри выберет Local Latte, то же самое нужно сделать и ей. Но если Салли сомневается в выборе Гарри, то каким должен быть ее наилучший выбор?
Рис. 7.3. Игра в доверие
Чтобы ответить на этот вопрос, мы должны дать более четкую трактовку неопределенности в понимании Салли. (В теории вероятностей и статистике есть специальный термин для обозначения такой неопределенности — субъективная неопределенность. В контексте неопределенности относительно действий другого игрока это стратегическая неопределенность; вспомните о различиях, которые мы анализировали в ). Для большей точности укажем, с какой вероятностью Гарри выберет то или иное кафе, по мнению Салли. Вероятность того, что это будет Local Latte, может быть выражена любым вещественным числом от 0 до 1 (то есть от 0 % до 100 %). Мы охватим все возможные варианты с помощью алгебраических формул, обозначив символом p вероятность того, что Гарри (по мнению Салли) выберет Starbucks; переменная p может иметь любое вещественное значение в диапазоне от 0 до 1. Тогда (1 — p) — это вероятность (снова по мнению Салли) того, что Гарри предпочтет Local Latte. Иными словами, мы описываем стратегическую неопределенность Салли следующим образом: она считает, что Гарри использует смешанную стратегию, применив совокупность двух чистых стратегий (Starbucks и Local Latte) в пропорциях или с вероятностью p и (1 — p) соответственно. Назовем эту смешанную стратегию p-комбинацией Гарри, хотя на данный момент это всего лишь идея, существующая в сознании Салли.
С учетом этой неопределенности Салли может вычислить ожидаемые выигрыши от своих действий, предпринятых на основании убежденности в отношении р-комбинации Гарри. Если Салли выберет Starbucks, это даст ей 1 × p + 0 × (1 — p) = p, если Local Latte, это даст 0 × p + 2 × (1 — p) = 2 × (1 — p). Когда p имеет высокое значение, p > 2(1 — p), то есть Салли достаточно уверена в том, что Гарри отправится в Starbucks, ей лучше пойти туда же. Точно так же, когда p имеет низкое значение, p < 2(1 — p), а значит, Салли достаточно уверена в том, что Гарри отправится в Local Latte, ей тоже нужно пойти в это кафе. При p = 2(1 — p), или 3p = 2, или p = 2/3 эти два варианта выбора обеспечивают Салли один и тот же выигрыш. Следовательно, если она убеждена в том, что p = 2/3, она может быть не уверена в собственном выборе и колебаться между этими двумя вариантами.
Понимание этого факта может вызвать у Гарри неуверенность в выборе Салли. Следовательно, Гарри также испытывает субъективную стратегическую неопределенность. Предположим, он считает, что Салли выберет Starbucks с вероятностью q, а Local Latte с вероятностью (1 — q). Аналогичные рассуждения показывают, что Гарри следует выбрать Starbucks, если q > 2/3, и Local Latte, если q < 2/3. В случае если q = 2/3, ему будет безразлично, какое из этих двух действий предпринять, и у него возникнет неуверенность в собственном выборе.
Теперь у нас есть основа для равновесия в смешанных стратегиях с p = 2/3 и q = 2/3. При таком равновесии данные значения p и q одновременно являются и фактическими вероятностями чистых стратегий, входящих в соответствующую смешанную стратегию, и субъективными убеждениями каждого игрока относительно вероятностей чистых стратегий в смешанной стратегии другого игрока. Правильность этих убеждений поддерживает собственное безразличие каждого игрока в отношении выбора между двумя чистыми стратегиями, а значит, и готовность каждого смешать их. Это полностью соответствует концепции равновесия Нэша как системы самоисполняющихся убеждений и ответных действий, описанной в .
Ключ к поиску равновесия в смешанных стратегиях состоит в том, что Салли готова смешать две чистые стратегии только тогда, когда ее субъективная неопределенность в отношении выбора Гарри правильна, то есть если правильно значение р в р-комбинации Гарри. Алгебраически это утверждение можно обосновать посредством вычисления равновесного значения р с помощью уравнения р = 2(1 — р), которое гарантирует, что Салли получит такой же ожидаемый выигрыш от двух своих чистых стратегий при сопоставлении каждой из них с р-комбинацией Гарри. Если данное равенство справедливо в случае равновесия, вероятности чистых стратегий в смешанной стратегии Гарри как будто поддерживают безразличие Салли. Мы особо подчеркиваем сочетание «как будто», поскольку в этой игре у Гарри нет причин поддерживать безразличие Салли, поэтому полученный результат — просто свойство данного равновесия. Тем не менее общая идея такова: в равновесии Нэша в смешанных стратегиях вероятности чистых стратегий, входящих в смешанную стратегию каждого игрока, поддерживают безразличие другого игрока в отношении выбора между его чистыми стратегиями. Мы вывели свойство безразличия соперника выше в ходе обсуждения игр с нулевой суммой, а теперь видим, что оно актуально и для игр с ненулевой суммой.
Однако в игре в доверие равновесие в смешанных стратегиях имеет ряд весьма нежелательных свойств. Во-первых, оно обеспечивает обоим игрокам достаточно низкие ожидаемые выигрыши. Формулы расчета ожидаемых выигрышей Салли от двух ее действий, р и 2 (1 — р), в обоих случаях равны 2/3 при р = 2/3. Точно так же ожидаемые выигрыши Гарри в случае равновесной q-комбинации Салли при q = 2/3 также одинаковы и составляют 2/3. Следовательно, при равновесии в смешанных стратегиях каждый игрок получает выигрыш 2/3. В мы нашли в этой игре два равновесия в чистых стратегиях, причем даже худшее из них (оба выбирают Starbucks) обеспечивает каждому игроку выигрыш 1, а лучшее (оба выбирают Local Latte) — выигрыш 2.
Причина, по которой в случае равновесия в смешанных стратегиях два игрока получают такие плохие результаты, состоит в следующем: при выборе игроками своих действий независимо и бессистемно достаточно высока вероятность того, что они отправятся в разные места и в результате не встретятся и оба получат выигрыш 0. Гарри и Салли не увидятся, если один из них пойдет в Starbucks, а другой в Local Latte или наоборот. Вероятность такого развития событий при использовании обоими равновесных комбинаций составляет 2 × (2/3) × (1/3) = 4/9. Аналогичная проблема наблюдается в равновесиях в смешанных стратегиях в большинстве игр с ненулевой суммой.
Второе нежелательное свойство равновесия в смешанных стратегиях — его неустойчивость. Если любой из игроков хотя бы немного отклонится от точных значений р = 2/3 или q = 2/3, наилучшим выбором другого игрока станет одна из чистых стратегий. И как только он ее применит, другой игрок получит более высокий выигрыш при выборе той же чистой стратегии, а значит, в игре наступит одно из двух равновесий в чистых стратегиях. Такая неустойчивость равновесий в смешанных стратегиях присуща многим играм с ненулевой суммой. Тем не менее в некоторых играх с ненулевой суммой все же есть более устойчивые равновесия в смешанных стратегиях. Один из примеров, описанный ниже в данной главе и в , — это равновесие в смешанных стратегиях в игре в труса, в отношении которой существует интересная эволюционная интерпретация.
С учетом результатов анализа равновесия в смешанных стратегиях в версии игры во встречу, основанной на игре в доверие, вы, по всей вероятности, теперь можете оценить равновесия в смешанных стратегиях в других вариантах игры во встречу с ненулевой суммой. В ее версии, построенной на чистой координации (см. ), выигрыш от встречи в двух кафе один и тот же, а значит, в равновесии в смешанных стратегиях значения p и q будут такими: p = 1/2 и q = 1/2. В варианте этой игры, представляющем собой битву полов (см. ), Салли предпочитает встретиться с Гарри в Local Latte, поскольку так она получит выигрыш 2 вместо 1 в случае встречи в Starbucks. Решение Салли зависит от того, больше или меньше 2/3 ее субъективная вероятность, что Гарри отправится в Starbucks. (В этом случае выигрыши Салли аналогичны выигрышам в версии игры в доверие, поэтому критическое значение p не меняется.) Гарри предпочитает встретиться в Starbucks, поэтому его решение зависит от того, больше или меньше 1/3 его субъективная вероятность, что Салли пойдет в Starbucks. Таким образом, при равновесии Нэша в смешанных стратегиях p = 2/3, а q = 1/3.
Б. Встретит ли Джеймс Дина? Игра в труса
В игре в труса с ненулевой суммой также существует равновесие в смешанных стратегиях, которое можно найти с помощью описанных выше методов, хотя у этой игры несколько иная интерпретация. Если вы помните, ее участники — Джеймс и Дин, пытающиеся избежать встречи. Таблица игры, первоначально представленная на , воспроизведена здесь на рис. 7.4.
Рис. 7.4. Игра в труса
Если применить в этой игре смешанные стратегии, то в p-комбинации Джеймса вероятность того, что он свернет в сторону, будет равна p, а вероятность того, что он поедет прямо, составит 1 — p. При такой p-комбинации Дин получит выигрыш 0 × p — 1 × (1 — p) = p — 1, выбрав вариант «свернуть», и 1 × p — 2 × (1 — p) = 3p — 2, предпочтя вариант «ехать прямо». При сравнении этих уравнений видно, что Дин получит более высокий выигрыш при выборе «свернуть», когда p — 1 > 3p — 2, или когда 2p < 1, или когда p < 1/2 — иными словами, когда p имеет малое значение и Джеймс с большей вероятностью выберет «ехать прямо». Напротив, когда у p высокое значение и Джеймс с большей вероятностью выберет «свернуть», Дину лучше «ехать прямо». Если в p-комбинации Джеймса значение p в точности равно 1/2, то Дину безразлично, какую из двух чистых стратегий применить; следовательно, он в равной мере готов их смешивать. Аналогичный анализ игры с точки зрения Джеймса в плане оценки его вариантов в игре против q-комбинации Дина дает те же результаты. Таким образом, p = 1/2 и q = 1/2 и есть равновесие в смешанных стратегиях в этой игре.
В свойствах этого равновесия присутствуют общие черты и различия с равновесиями в смешанных стратегиях в игре «встреча». Здесь ожидаемый выигрыш каждого игрока достаточно низкий: (−1/2). Это плохо, как и в случае игры во встречу, но в отличие от нее выигрыш при равновесии в смешанных стратегиях не хуже для обоих игроков, чем выигрыш при двух равновесиях в чистых стратегиях. В действительности, поскольку в данной игре интересы игроков в какой-то степени противоположны, каждый непременно получит более высокий выигрыш от равновесия в смешанных стратегиях, чем от равновесия в чистых стратегиях, подразумевающего выбор варианта «свернуть».
Однако такое равновесие в смешанных стратегиях тоже неустойчиво. Если Джеймс повысит вероятность применения варианта «ехать прямо» до значения чуть больше 1/2, это приведет к выбору Дином чистой стратегии «свернуть». В результате сочетание стратегий «ехать прямо» / «свернуть» становится равновесием в чистых стратегиях. Если Джеймс, наоборот, снизит вероятность выбора варианта «ехать прямо» до значения чуть меньше 1/2, Дин выберет вариант «ехать прямо» и игра снова перейдет к другому равновесию в чистых стратегиях.
В данном разделе мы нашли равновесия в смешанных стратегиях в нескольких играх с ненулевой суммой путем решения уравнений, вытекающих из свойства безразличия соперника. Из мы уже знаем, что в таких играх есть и равновесия в чистых стратегиях. Кривые наилучших ответов позволяют составить исчерпывающую картину, отобразив все равновесия Нэша одновременно. Поскольку вы уже ознакомились с ними в двух отдельных фрагментах книги, мы не будем тратить время и место на построение графиков, а просто подчеркнем, что при наличии двух равновесий в чистых стратегиях и одного в смешанных стратегиях (как в приведенных выше примерах) кривые наилучших ответов пересекаются в трех разных местах, по одному на каждое равновесие Нэша. В конце этой главы мы предложим вам самостоятельно построить графики наилучших ответов для аналогичных игр.
5. Общий анализ равновесий в смешанных стратегиях
Теперь, узнав, как найти равновесия в смешанных стратегиях в играх с нулевой и ненулевой суммой, целесообразно проанализировать дополнительные свойства этих равновесий. В частности, в данном разделе мы отметим ряд общих свойств равновесий в смешанных стратегиях, а также ознакомим вас с некоторыми результатами, которые поначалу покажутся вам парадоксальными, но лишь до тех пор, пока вы полностью не проанализируете рассматриваемую игру.
А. Равновесие в слабом смысле
Свойство безразличия соперника, о котором шла речь в , подразумевает, что в случае равновесия в смешанных стратегиях каждый игрок получает один и тот же ожидаемый выигрыш от каждой из двух своих чистых стратегий, а значит, получит один и тот же ожидаемый выигрыш и от любой их комбинации. Следовательно, равновесия в смешанных стратегиях — это равновесия Нэша только в слабом смысле. Когда один игрок выбирает свою равновесную комбинацию стратегий, у другого нет явных оснований отступать от своей равновесной комбинации. С другой стороны, этот игрок ничего бы не потерял, выбрав другую смешанную стратегию или даже одну из своих чистых стратегий. Каждому игроку безразлично, какую из чистых стратегий или их комбинацию выбрать, до тех пор, пока другой игрок разыгрывает свою правильную (равновесную) комбинацию.
На первый взгляд это сводит на нет принцип использования равновесия Нэша в смешанных стратегиях в качестве концепции решения игр. Зачем игроку выбирать соответствующую комбинацию стратегий, когда другой игрок применяет свою комбинацию? Почему бы не поступить проще, выбрав одну из чистых стратегий? Ведь ожидаемый выигрыш в обоих случаях тот же. Ответ состоит в том, что это не будет равновесием Нэша; такой исход игры не будет устойчивым, поскольку тогда другой игрок отклонится от своей комбинации стратегий. Предположим, Эверт говорит себе: «Когда Навратилова применит свою наилучшую комбинацию (q = 0,6), я получу один и тот же выигрыш от ПЛ, ПД или их любого сочетания. Так зачем же их смешивать? Почему бы просто не использовать ПЛ?» В таком случае Навратиловой выгоднее перейти к чистой стратегии прикрытия удара ПЛ. Аналогичным образом, если Гарри выберет чистую стратегию Starbucks в игре во встречу, основанной на доверии, то Салли может получить более высокий выигрыш в равновесии 1 вместо 2/3 благодаря переходу с комбинации 50 на 50 на чистую стратегию Starbucks.
Б. Парадоксальное изменение вероятностей чистых стратегий в смешанной стратегии в играх с нулевой суммой
Игры с равновесиями в смешанных стратегиях порой демонстрируют свойства, которые на первый взгляд могут казаться противоречащими здравому смыслу. Самое интересное из них — это изменение вероятностей чистых стратегий в равновесной смешанной стратегии, приводящее к изменению структуры выигрышей в соответствующей игре. Чтобы проиллюстрировать это, вернемся к Эверт и Навратиловой и их игре с розыгрышем очка в теннисе.
Предположим, Навратилова усовершенствует навыки прикрытия удара по линии до уровня, при котором результативность Эверт в использовании стратегии ПЛ против стратегии Навратиловой по прикрытию ПЛ сокращается с 50 до 30 %. Такое улучшение мастерства Навратиловой обусловливает изменение таблицы выигрышей, в том числе смешанных стратегий каждой участницы игры, представленной на . Новая таблица игры отображена на рис. 7.5.
Рис. 7.5. Измененные выигрыши в игре в теннис
Единственное отличие от таблицы на наблюдается в верхней левой ячейке, где выигрыш Эверт 50 теперь составляет 30, а выигрыш Навратиловой 50 равен 70. Это изменение не приводит к игре с равновесием в чистых стратегиях, поскольку у ее участниц по-прежнему противоположные интересы: Навратилова все так же хочет, чтобы их выбор совпадал, а Эверт все так же необходимо, чтобы их выбор отличался. Так что мы все еще имеем игру, подразумевающую смешивание стратегий.
Но чем эти равновесные комбинации стратегий отличаются от рассчитанных в ? Многие могли бы заявить, что теперь, научившись очень хорошо прикрывать ПЛ, Навратилова должна делать это чаще. В основе таких рассуждений лежит предположение о том, что равновесная q-комбинация Навратиловой должна быть в большей степени смещена в сторону ПЛ, а ее равновесное значение q должно превышать рассчитанное значение 0,6.
Но при вычислении q-комбинации Навратиловой на основании условия о безразличии Эверт в отношении выбора между двумя чистыми стратегиями мы получим 30q + 80(1 — q) = 90q + 20(1 — q), или q = 0,5. Фактическое равновесное значение q (50 %) связано с исходным значением q (60 %) в прямо противоположном смысле по сравнению с интуитивными прогнозами многих людей.
Хотя на первый взгляд подобные интуитивные выводы кажутся вполне обоснованными, в них упущен один важный аспект теории стратегий: взаимодействие между двумя игроками. После изменения выигрышей Эверт также будет пересматривать свою равновесную комбинацию, а Навратилова должна учитывать как новую структуру выигрышей, так и поведение Эверт при определении своей новой комбинации стратегий. В частности, поскольку теперь Навратилова гораздо лучше прикрывает ПЛ, Эверт в своей смешанной стратегии чаще использует ПД. И чтобы противодействовать этому, Навратилова тоже чаще прикрывает ПД.
Это станет более очевидным после того, как мы вычислим новую комбинацию Эверт. Ее равновесное значение p должно обеспечивать равенство между ожидаемым выигрышем Навратиловой от прикрытия ПЛ, 30p + 90(1 — p), и ее ожидаемым выигрышем от прикрытия ПД, 80р + 20(1 — p). Таким образом, мы имеем уравнение 30p + 90(1 — p) = 80p + 20(1 — p), или 90–60p = 20 + 60p, или 120p = 70. Следовательно, значение p Эверт должно составлять 7/12, или 0,583 (58,3 %). Сравнение этого нового равновесного значения p с рассчитанным в первоначальным значением 70 % показывает, что Эверт существенно сократила количество использования ПЛ в ответ на повышение мастерства Навратиловой. С учетом такого поведения Эверт Навратиловой также лучше сократить частоту применения стратегии ПЛ. Теперь Эверт будет использовать с выгодой для себя любой другой выбор комбинации стратегий Навратиловой, особенно той, в которой предпочтительна стратегия ПЛ.
Означает ли это, что Навратилова совершенствовала навыки зря? Нет, но мы должны судить об этом не по частоте применения той или иной стратегии, а по итоговым выигрышам. Когда Навратилова использует свою новую равновесную комбинацию с q = 0,5, процент успеха Эверт при выборе любой из ее чистых стратегий составляет (30 × 0,5) + (80 × 0,5) = (90 × 0,5) + (20 × 0,5) = 55. Это меньше, чем процент успеха Эверт 62 в исходном примере. Следовательно, средний выигрыш Навратиловой также возрастает с 38 до 45, а значит, улучшение навыков прикрытия удара ПЛ действительно принесло ей пользу.
В отличие от парадоксального результата, который мы наблюдали при анализе стратегического ответа Навратиловой на изменение в структуре выигрышей, здесь мы видим, что этот ответ полностью соответствует интуитивным представлениям, если рассматривать его в свете ожидаемого выигрыша Навратиловой. На самом деле с точки зрения ожидаемых выигрышей ответы игроков на изменение структуры выигрышей просто не могут противоречить здравому смыслу, хотя стратегические ответы, как мы уже убедились, могут. Самый интересный аспект такого парадоксального результата стратегических ответов игроков — это сигнал, который он подает теннисистам и, в более общем плане, участникам стратегических игр. Этот результат эквивалентен утверждению, что Навратилова должна усовершенствовать навыки прикрытия удара по линии с тем, чтобы ей не пришлось использовать такое прикрытие слишком часто.
Далее мы представим еще более общий и неожиданный результат, обусловленный изменениями вероятностей применения чистых стратегий в смешанной стратегии. Условие безразличия соперника означает, что равновесные вероятности чистых стратегий в смешанной стратегии каждого игрока зависят исключительно от выигрышей другого игрока, а не от его собственных. Рассмотрим игру в доверие на . Предположим, выигрыш Салли от встречи в Local Latte увеличивается с 2 до 3, тогда как все остальные выигрыши не меняются. Теперь в случае p-комбинации Гарри Салли получит выигрыш 1 × p + 0 × (1 — p) = p, если выберет Starbucks, и 0 × p + 3 × (1 — p) = 3–3p, если Local Latte. Условие безразличия Салли выглядит так: p = 3–3p, или 4p = 3, или p = 3/4 по сравнению со значением 2/3, вычисленным нами выше для p-комбинации Гарри в исходной игре. Расчет условия безразличия Гарри остается прежним и дает результат q = 2/3 в случае равновесной стратегии Салли. Изменение выигрышей Салли меняет вероятности применения чистых стратегий в смешанной стратегии Гарри, а не Салли! В у вас будет возможность доказать истинность этого вывода в общей формулировке: доли чистых стратегий в равновесной смешанной стратегии игрока меняются не вследствие изменения его выигрышей, а только в случае изменения выигрышей его соперника.
В. Рискованный и безопасный выбор в играх с нулевой суммой
В спорте некоторые стратегии сравнительно безопасны; они не приводят к полной катастрофе, даже если соперник предвидит такой выбор, но и не позволяют добиться сверхрезультатов, если оказываются неожиданными для соперника. Другие стратегии достаточно рискованны; они обеспечивают блестящие результаты, если другая сторона к ним не готова, но терпят полное поражение, когда другая сторона готова. В американском футболе на третьем дауне, когда остается пройти один ярд, пробежка на середину поля — это безопасная стратегия, а длинный пас — рискованная. Здесь возникает интересный вопрос, поскольку порой в ситуациях «третий даун, один ярд» на кону стоит больше, чем в других подобных ситуациях. Например, начало игры с 10-ярдовой линии соперника гораздо сильнее влияет на возможное количество заработанных очков, чем ее старт с вашей собственной 20-ярдовой линии. Вопрос в том, следует ли вам чаще или реже прибегать к рискованным стратегиям в случае более высоких ставок, чем низких.
Для того чтобы представить это в более конкретном виде, проанализируйте вероятности успеха, представленные на рис. 7.6. (Обратите внимание, что тогда как в теннисе мы использовали проценты от 0 до 100, здесь мы используем вероятности от 0 до 1.) Безопасная игра команды нападения — пробежка; вероятность успешного первого дауна составляет 60 %, если команда защиты ожидает пробежки, и 70 %, если защита полагает, что будет пас. Рискованная игра команды нападения — пас, поскольку вероятность успеха в куда большей степени зависит от действий команды защиты; вероятность успеха равна 80 %, если защита ожидает пробежки, и всего 30 %, если защита рассчитывает на пас.
Рис. 7.6. Вероятность успеха команды нападения в игре «третий даун, один ярд»
Допустим, в случае успешной игры команда защиты получает выигрыш, равный V, а неудачной — выигрыш 0. Выигрыш V может представлять собой то или иное количество очков, скажем, три очка за гол в ворота или семь очков за тачдаун. Кроме того, выигрыш V может отображать определенный уровень статуса или количество денег, заработанных командой; например, V = 100 за успешную игру в обычном матче или V = 1 000 000 за победу в Суперкубке по американскому футболу.
В фактической таблице игры между командами нападения и защиты, представленной на рис. 7.7, отображены ожидаемые выигрыши каждой команды. Они представляют собой среднее между выигрышем V при успешной игре и 0 при неудачной. Например, ожидаемый выигрыш команды нападения, использующей стратегию «пробежка» в случае, если команда защиты ожидает стратегии «пробежка», составляет 0,6 × V + 0,4 × 0 = 0,6V. Поскольку данная игра относится к категории игр с нулевой суммой, выигрыш команды защиты в этой ячейке равен –0,6V. Аналогичным образом вы можете рассчитать выигрыши во всех остальных ячейках таблицы, чтобы убедиться, что значения, приведенные ниже, правильные.
Рис. 7.7. Игра «третий даун, один ярд»
При равновесии в смешанных стратегиях вероятность p того, что команда нападения выберет стратегию «пробежка», определяется свойством безразличия соперника. Стало быть, правильное значение p удовлетворяет следующему условию:
p [–0,6 V ] + (1 — p )[–0,8 V ] = p [–0,7 V ] + (1 — p )[–0,3 V ].
Обратите внимание, что мы можем разделить обе стороны этого равенства на V, чтобы полностью исключить V из процесса вычисления p. Тогда упрощенное уравнение будет выглядеть так: –0,6p — 0,8(1 — p) = –0,7p — 0,3(1 — p), или 0,1p = 0,5(1 — p). Решив его, получим p = 5/6; следовательно, команда нападения с высокой вероятностью применит стратегию «пробежка» в своей комбинации стратегий. Такую безопасную игру часто называют «процентной игрой», потому что это нормальный ход игры в подобных ситуациях. Рискованная игра (стратегия «пас») разыгрывается лишь изредка, чтобы держать соперника в неведении или, говоря на языке футбольных комментаторов, «не давать защите расслабиться».
Интересный аспект этого результата состоит в том, что выражение для вычисления p совершенно не зависит от V. То есть, согласно теории, процентную и рискованную игру следует смешивать в равных пропорциях как в очень важных, так и во второстепенных ситуациях. Но этот результат противоречит интуитивным выводам многих людей, которые считают, что в более важных ситуациях рисковать следует реже. Длинный пас на третьем дауне с одним оставшимся ярдом приемлем в обычный октябрьский воскресный день, но делать такой пас во время Суперкубка слишком рискованно.
Так кто же прав: теория или интуиция? По всей вероятности, мнения читателей по этому вопросу разделятся. Некоторые будут утверждать, что спортивные комментаторы ошибаются, и с радостью обнаружат, что теоретические аргументы опровергают их заявления. Другие примут сторону комментаторов и будут доказывать, что важные матчи требуют более безопасной игры. Есть и те, кто считает, что ради более крупных призов следует больше рисковать, однако даже они не находят поддержки данной идеи в теории, а это говорит о том, что размер приза или ущерба вряд ли оказывает какое-либо влияние на вероятности чистых стратегий в смешанной стратегии.
Во многих предыдущих случаях возникновения расхождений между теорией и интуицией мы утверждали, что они кажущиеся и являются результатом неспособности сделать теорию настолько общей или глубокой, чтобы она охватывала все аспекты ситуации, в отношении которой делаются интуитивные выводы, и что улучшение теории позволяет устранить такие расхождения. В данном случае ситуация иная: проблема имеет фундаментальное значение для вычисления выигрышей от смешанных стратегий как взвешенных по вероятности средних значений, или ожидаемых выигрышей. И это отправная точка почти всех научных работ в современной теории игр.
6. Смешивание стратегий при наличии трех или более чистых стратегий у одного игрока
Наше обсуждение игр со смешанными стратегиями до сих пор ограничивалось только играми, в которых у каждого участника было по две чистые стратегии, а также их комбинации. Однако во многих стратегических ситуациях каждый игрок располагает большим количеством чистых стратегий, поэтому мы должны подготовиться к вычислению равновесных смешанных стратегий и в подобных случаях. Но уровень сложности таких расчетов стремительно повышается. В поистине сложных играх для поиска равновесия в смешанных стратегиях нам пришлось бы прибегнуть к помощи компьютера. Тем не менее в некоторых небольших играх найти такое равновесие вручную не составит труда. И этот процесс вычислений позволит лучше понять, как работает равновесие, чем при анализе решения, сгенерированного компьютером. По этой причине в данном и следующем разделах мы поищем решение более крупных игр.
В этом разделе мы остановимся на играх с нулевой суммой, в которых у одного из игроков всего две чистые стратегии, тогда как у другого — больше. Как мы заметили, в таких играх игрок, имеющий три (или более) чистые стратегии, как правило, использует в равновесии только две. Остальные просто не входят в эту комбинацию стратегий, то есть вероятность их применения равна нулю. Мы должны лишь определить, какие стратегии используются в равновесии, а какие нет.
В качестве примера рассмотрим игру в розыгрыш очка в теннисе, включив в число стратегий Эверт третий тип возврата подачи. Помимо удара по линии и удара по диагонали теперь она может использовать свечу (более медленный, но и более высокий и длинный удар). Равновесие зависит от выигрышей в случае применения свечи против каждой из двух оборонительных стратегий Навратиловой. Начнем с самого вероятного случая, а затем перейдем к анализу особого случая.
А. Общий случай
Теперь в распоряжении Эверт три чистые стратегии: ПЛ (по линии), ПД (по диагонали) и СВ (свеча), а у Навратиловой только две: прикрывать удар ПЛ или прикрывать удар ПД. Таблица выигрышей этой новой игры представлена на рис. 7.8. Мы исходили из предположения, что выигрыши Эверт от стратегии СВ находятся в диапазоне между максимальным и минимальным выигрышами, которые она может получить от стратегий ПЛ и ПД, а также что они не слишком отличаются в случаях, когда Навратилова прикрывает ПЛ или ПД. В таблице отображены выигрыши не только от чистых стратегий, но и от трех чистых стратегий Эверт против q-комбинации Навратиловой. (Мы не показываем строку для p-комбинации Эверт, поскольку в этом нет необходимости. Для этого понадобились бы две вероятности, скажем, p1 в случае стратегии ПЛ и p2 в случае стратегии ПД; тогда вероятность стратегии СВ составила бы (1 — p1 — p2). В следующем разделе мы расскажем, как найти равновесные комбинации стратегий такого типа.)
Рис. 7.8. Таблица выигрышей в игре с розыгрышем очка с использованием стратегии «свеча»
Строго говоря, прежде чем приступать к поиску равновесия в смешанных стратегиях, мы должны убедиться в том, что в игре отсутствует равновесие в чистых стратегиях. Однако сделать это достаточно легко, поэтому оставляем эту задачу вам и переходим к смешанным стратегиям.
Мы проанализируем оптимальный выбор q Навратиловой с помощью логики наилучших ответов. На рис. 7.9 показаны ожидаемые выигрыши Эверт (проценты успеха) в случае выбора каждой из чистых стратегий — ПЛ, ПД и СВ, тогда как значение q в q-комбинации Навратиловой меняется в интервале от 0 до 1. На данном рисунке изображены графики формул расчета выигрышей, представленных в правом столбце таблицы на . По каждому значению q при выборе Навратиловой данной q-комбинации в равновесии наилучшим ответом Эверт был бы выбор стратегии, обеспечивающей ей (Эверт) самый высокий выигрыш. На рис. 7.9 совокупность наилучших исходов для Эверт выделена более жирной линией, называемой на языке математики верхней огибающей трех линий выигрышей. Навратилова стремится выбрать свое наилучшее значение q, которое бы позволило ей получить как можно более высокий выигрыш (тем самым понизив выигрыш Эверт, насколько возможно) из этой совокупности наилучших ответов Эверт.
Рис. 7.9. Поиск q-комбинации Навратиловой графическим способом
Для более точного определения оптимального выбора q Навратиловой мы должны вычислить координаты точек излома линии, соответствующей ее наихудшему исходу (и наилучшему исходу для Эверт). Значение q в крайней левой точке излома линии означает безразличие Эверт в отношении выбора между ПЛ и СВ. Это значение q должно равняться двум выигрышам от использования стратегий ПЛ и СВ против данной q-комбинации. Приравняв эти два выражения, получим 50q + 80(1 — q) = 70q + 60(1 — q), или q = 20/40 = 1/2 = 50 %. Ожидаемый выигрыш Эверт в этой точке составит 50 × 0,5 + 80 × 0,5 = 70 × 0,5 + 60 × 0,5 = 65. Во второй (крайней правой) точке излома Эверт безразлично, какую стратегию выбрать, ПД или СВ. Таким образом, значение q в этой точке приравнивает выражения для вычисления выигрышей от стратегий ПД и СВ. Установив равенство 90q + 20(1 — q) = 70q + 60(1 — q), находим значение q = 40/60 = 2/3 = 66,7 %. В этом случае ожидаемый выигрыш Эверт составляет 90 × 0,667 + 20 × 0,333 = 70 × 0,667 + 60 × 0,333 = 66,67. Следовательно, наилучший (или наименее неблагоприятный) выбор q Навратиловой находится в крайней левой точке излома, то есть q = 0,5. При этом ожидаемый выигрыш Эверт равен 65, а Навратиловой, соответственно, 35.
Когда Навратилова выбирает q = 0,5, Эверт безразлично, какую стратегию применить, ПЛ или СВ, а значит, выбор любой из них обеспечивает ей более высокий выигрыш, чем стратегия ПД. Поэтому Эверт не станет включать стратегию ПД в равновесие, и она станет неиспользуемой в равновесной комбинации стратегий Эверт.
Теперь продолжим анализ равновесия так, как если бы это была игра с двумя чистыми стратегиями у каждой из ее участницы: ПЛ и ПД у Навратиловой и ПЛ и СВ у Эверт. Итак, мы вернулись на знакомую почву, поэтому предоставляем вам возможность выполнить необходимые расчеты самостоятельно и приводим здесь только результат. Оптимальная комбинация стратегий Эверт в данной игре подразумевает выбор стратегии ПЛ с вероятностью 0,25 и стратегии СВ с вероятностью 0,75. Ожидаемый выигрыш Эверт от этой комбинации стратегий, использованных в игре против ПЛ и ПД Навратиловой соответственно, составляет 50 × 0,25 + 70 × 0,75 = 80 × 0,25 + 60 × 0,75 = 65, как, разумеется, и должно быть.
Мы не могли начать этот анализ с игры два на два, поскольку не знали заранее, какую из трех стратегий Эверт не будет использовать. Однако мы не сомневаемся, что в общем случае обязательно будет одна такая стратегия. Когда три линии ожидаемых выигрышей занимают самые общие положения, они пересекаются попарно, а не все в одной точке. При этом верхняя огибающая имеет форму как на . Самая нижняя точка огибающей задается пересечением линий выигрышей, соответствующих двум из трех стратегий. Выигрыш от третьей стратегии находится ниже пересечения в этой точке, а значит, игрок, выбирающий между тремя стратегиями, не будет использовать именно третью стратегию.
Б. Особые случаи
Положения и пересечения трех линий на зависят от выигрышей, указанных для чистых стратегий. Для данной игры мы выбирали выигрыши, позволяющие проиллюстрировать общую конфигурацию линий. Однако, если выигрыши находятся в весьма своеобразной зависимости друг от друга, мы можем получить особые конфигурации с различными результатами. Мы проанализируем здесь такие варианты, а возможность построить новые графики для этих случаев предоставляем вам.
Во-первых, если выигрыши от стратегии СВ, применяемой Эверт против стратегий ПЛ и ПД Навратиловой, равны, прямая СВ будет горизонтальной; при этом весь диапазон значений q делает комбинацию стратегий Навратиловой защищенной от использования. Например, если каждый из двух выигрышей в строке СВ таблицы на равен 70, то нетрудно определить, что левая точка излома на обновленном находилась бы в точке, соответствующей значению q = 1/3, а правая точка излома — в точке q = 5/7. При любом значении q в диапазоне от 1/3 до 5/7 наилучший ответ Эверт — СВ, а значит, мы получаем необычное равновесие, в котором Эверт выбирает чистую стратегию, а Навратилова чистые стратегии смешивает. Более того, вероятности чистых стратегий в равновесной смешанной стратегии Навратиловой имеют неопределенное значение в диапазоне от q = 1/3 до q = 5/7.
Во-вторых, если выигрыши Эверт при использовании стратегии СВ против стратегий ПЛ и ПД Навратиловой на определенную величину ниже выигрышей, представленных в таблице на (или если выигрыши от оставшихся двух стратегий на определенную величину выше указанных в таблице), все три прямые могут пересекаться в одной точке. Например, если выигрыши Эверт от стратегии СВ против стратегий ПЛ и ПД Навратиловой составляют не 70 и 60, а 66 и 56 соответственно, то при q = 0,6 ожидаемый выигрыш Эверт от стратегии СВ равен 66 × 0,6 + 56 × 0,4 = 39,6 + 22,6 = 62, то есть такой же, как и выигрыш от стратегий ПЛ и ПД при q = 0,6. В таком случае Эверт безразлично, какую из трех имеющихся стратегий выбрать при q = 0,6, и она готова смешивать все три.
В этом особом случае вероятности чистых стратегий в равновесной комбинации стратегий Эверт не могут быть полностью определенными. Напротив, целый диапазон комбинаций (в том числе и использующих все три стратегии) может выполнять задачу по поддержанию безразличия Навратиловой в отношении выбора между стратегиями ПЛ и ПД, а значит, и готовности их смешивать. Тем не менее Навратилова должна применить комбинацию со значением q = 0,6. Если она этого не сделает, наилучшим ответом Эверт будет переход к одной из чистых стратегий в ущерб Навратиловой. Мы не станем подробно останавливаться на определении точного диапазона, в котором могут меняться равновесные смешанные стратегии Эверт, поскольку такая ситуация может сложиться лишь при особых комбинациях выигрышей и, стало быть, это не столь важно.
Обратите внимание, что выигрыши Эверт от использования стратегии СВ против стратегий ПЛ и ПД Навратиловой могут быть даже ниже значения, при котором все три прямые пересекаются в одной точке (например, если бы выигрыши от СВ равнялись 75 и 30 вместо 70 и 60, как на ). Тогда стратегия СВ не может быть наилучшим ответом Эверт, хотя она не является ни доминируемой стратегией ПЛ, ни доминируемой стратегией ПД. Случай, когда стратегия СВ доминируема по отношению к комбинации стратегий ПЛ и ПД, рассматривается в онлайн-приложении в данной главе.
7. Смешивание стратегий при наличии трех стратегий у обоих игроков
При рассмотрении игр, в которых у обоих игроков есть по три чистые стратегии с возможностью смешивания всех трех, необходимы две переменные, чтобы задать каждую комбинацию стратегий. В комбинации игрока, данные которого отображаются в строках, его первой чистой стратегии соответствует вероятность p1, а второй — вероятность p2. Тогда вероятность использования третьей чистой стратегии должна составлять 1 минус сумма вероятностей остальных двух стратегий. То же самое касается комбинации игрока, которому соответствуют столбцы. Таким образом, когда каждый игрок имеет по три чистые стратегии, найти равновесие в смешанных стратегиях без выполнения алгебраических операций с двумя переменными нельзя. Тем не менее зачастую такие алгебраические расчеты вполне выполнимы.
А. Полная комбинация всех стратегий
Рассмотрим упрощенное представление пенальти в футболе. Предположим, выполняющий его игрок, бьющий правой ногой, имеет три чистые стратегии: удар влево, вправо или в центр (налево или направо по отношению к вратарю; для игрока-правши было бы логично отправить мяч направо от вратаря), и может смешивать их с вероятностями, обозначенными как pл, pп, pц соответственно. Любые две из этих вероятностей можно принять как независимые переменные, а третью выразить через них. Если pл и pп — независимые переменные, то pц = 1 — pл — pп. Вратарь также располагает тремя чистыми стратегиями, а именно двигаться налево от бьющего игрока (направо от самого вратаря), направо от бьющего игрока (налево от вратаря) или оставаться в центре. Кроме того, вратарь может их смешивать с вероятностями qл, qп, qц, две из которых могут быть выбраны в качестве независимых переменных.
Как и в , график наилучших ответов для этой игры потребовал бы более двух размерностей. (Точнее говоря, четыре. Вратарь выбрал бы свои две независимые переменные, скажем (qл, qп), как свой наилучший ответ на две независимые переменные игрока, выполняющего пенальти (pл, pп), и наоборот.) Вместо этого мы снова воспользуемся свойством безразличия соперника, чтобы сфокусироваться на вероятностях чистых стратегий в смешанной стратегии по одному игроку за один раз. В случае каждого игрока вероятности должны быть такими, чтобы другому игроку было безразлично, какую стратегию из имеющихся в его комбинации стратегий выбрать. Это дает нам систему уравнений, которая позволит найти вероятности применения чистых стратегий в смешанной стратегии. В примере с футболом переменные (pл, pп) удовлетворяли бы двум уравнениям, выражающим требование о том, что ожидаемый выигрыш вратаря от использования стратегии «налево» должен быть равен ожидаемому выигрышу от применения стратегии «направо», а также что ожидаемый выигрыш вратаря от выбора стратегии «направо» должен равняться ожидаемому выигрышу от выбора стратегии «в центре». (В таком случае равенство ожидаемых выигрышей от применения стратегий «налево» и «в центре» определяется автоматически и не требует отдельного уравнения.) При большем количестве стратегий число вероятностей, подлежащих вычислению, и уравнений, которым они должны удовлетворять, тоже увеличивается.
На рис. 7.10 показана таблица взаимодействия между игроком, выполняющим пенальти, и вратарем, где в качестве выигрышей каждого игрока указаны проценты успешных действий. (В этой таблице для упрощения расчетов приведены не фактические данные европейского футбола, представленные чуть ниже, а аналогичные округленные числа.) Поскольку игрок, бьющий пенальти, хочет максимально увеличить выраженную в процентах вероятность того, что он забьет гол, а вратарь стремится минимизировать вероятность того, что он его пропустит, мы имеем дело с игрой с нулевой суммой. Например, в ситуации, когда бьющий игрок отправит мяч налево от себя, а вратарь сделает движение налево от бьющего игрока (ячейка в верхнем левом углу), мы исходим из предположения, что бьющему игроку все равно удастся забить гол в 45 % случаев, стало быть, вратарь сможет отразить удар в 55 % случаев. Однако если бьющий игрок отправит мяч направо от себя, а вратарь сделает движение налево от него, то у бьющего есть возможность забить гол с вероятностью 90 %; мы исходим из того, что он с вероятностью 10 % может ударить мимо или выше ворот, а значит, вратарь может добиться успеха в 10 % случаев. Вы можете поэкспериментировать с другими, более приемлемыми, на ваш взгляд, значениями выигрышей.
Рис. 7.10. Игра в пенальти в футболе
Легко убедиться, что в этой игре нет равновесия в чистых стратегиях. Поэтому допустимя, что игрок, выполняющий пенальти, смешивает стратегии с вероятностями pл, pп и pц = 1 — pл — pп. По каждой чистой стратегии вратаря эта комбинация обеспечивает ему следующие выигрыши:
«Налево»: 55 p л + 15 p ц + 5 p п = 55 p л + 15(1 — p л — p п ) + 5 p п .
«В центр»: 10 p л + 100 p ц + 5 p п = 10 p л + 100(1 — p л — p п ) + 5 p п .
«Направо»: 10 p л + 15 p ц + 40 p п = 10 p л + 15(1 — p л — p п ) + 40 p п .
Правило безразличия соперника гласит, что бьющий игрок должен выбрать pл и pп, с тем чтобы в равновесии все три выражения были эквивалентны.
Приравняв выражения, соответствующие стратегиям «налево» и «направо», и упростив полученное равенство, имеем 45pл = 35pп, или pп = (9/7)pл. Далее приравниваем выражения, соответствующие стратегиям «в центре» и «направо», и упрощаем полученное равенство с помощью только что выведенного соотношения между pп. Это дает 10pл + 100[1 — pл — (9pл / 7)] + 5(9pл / 7) = 10pл + 15[1 — pл — (9pл / 7)] + 40 (9pл / 7), или [85 + 120(9/7)] pл = 85, что дает pл = 0,355. Далее получаем pп = 0,355(9/7) = 0,457 и, наконец, pц = 1–0,355 — 0,457 = 0,188. Затем вычисляем с помощью представленных выше трех строк выигрышей выигрыш вратаря от любой из его трех стратегий против этой комбинации стратегий; результат — 24,6.
Вероятности чистых стратегий в смешанной стратегии вратаря можно определить, записав и решив уравнения безразличия бьющего игрока в отношении его выбора из трех чистых стратегий в игре против комбинации стратегий вратаря. Мы будем это делать в ходе анализа несколько измененного варианта этой игры в , поэтому здесь опускаем детали и просто приводим полученный результат: qл = 0,325, qп = 0,561 и qц = 0,113. Выигрыш бьющего игрока от любой из его чистых стратегий в игре против равновесной комбинации стратегий вратаря составляет 75,4. Разумеется, он согласуется с выигрышем вратаря 24,6, который мы вычислили выше.
Теперь можем разъяснить эти выводы. Игрок, выполняющий пенальти, получит более высокий выигрыш от своей чистой стратегии «направо», чем от чистой стратегии «налево», как в случае, если вратарь правильно угадает его ход (60 > 45), так и если он ошибется (95 > 90). (Предположительно игрок будет бить левой, а значит, может сделать более сильный удар направо.) Таким образом, бьющий игрок выберет с самой высокой вероятностью стратегию «направо», и чтобы противостоять этому, вратарь также с высокой вероятностью выберет стратегию «направо»; однако при таком раскладе выигрыш бьющего в итоге составит всего 60, то есть меньше выигрыша 75,4, который он получит при равновесии в смешанных стратегиях.
Б. Равновесные комбинации, в которых используются не все стратегии
В равновесии из предыдущего примера вероятность применения стратегии «в центре» в смешанной стратегии достаточно низкая для каждого игрока. Комбинация «в центр» / «в центре» привела бы к гарантированному отражению пенальти, и бьющий игрок получил бы поистине низкий выигрыш, то есть ноль. В связи с чем данный игрок присваивает этому выбору низкую вероятность. Но тогда вратарь также должен присвоить выбору этой стратегии низкую вероятность, сосредоточившись на противодействии более вероятным стратегиям бьющего игрока. Но если последний получит достаточно высокий выигрыш от выбора стратегии «в центр», когда вратарь применит «налево» или «направо», то он будет выбирать «в центр» с определенной положительной вероятностью. Если бы выигрыши бьющего игрока в строке, соответствующей стратегии «в центр», были ниже, то он мог бы использовать стратегию «в центр» с нулевой вероятностью; тогда вратарь также присвоил бы нулевую вероятность стратегии «в центре». При таком развитии событий данная игра превратилась бы в игру с двумя базовыми чистыми стратегиями, «налево» и «направо», находящимися в распоряжении каждого игрока.
Этот вариант игры в футбол показан на рис. 7.11. Единственное различие между выигрышами в данной и первоначальной версии игры () состоит в том, что выигрыши бьющего игрока от комбинации стратегий «в центр» / «слева» и «в центр» / «справа» сократились еще больше, с 85 до 70. Это могло произойти потому, что бьющему игроку свойственно посылать мяч слишком высоко, а значит, он часто промахивается, целясь в центр. Попробуем вычислить равновесие в этой игре, воспользовавшись тем же методом, что и в . На этот раз сделаем это с позиции вратаря, попытавшись найти вероятности применения чистых стратегий qл, qп и qц в смешанной стратегии с помощью условия безразличия бьющего игрока в отношении выбора между тремя чистыми стратегиями в игре против данной комбинации стратегий.
Рис. 7.11. Вариант игры в пенальти в футболе
Выигрыши бьющего игрока от его чистых стратегий составляют:
«Налево»: 45 q л + 90 q ц + 90 q п = 45 q л + 90(1 — q л — q п ) + 90 q п = 45 q л + 90(1 — q л ).
«В центре»: 70 q л + 0 q ц + 70 q п = 70 q л + 70 q п .
«Направо»: 95 q л + 95 q ц + 60 q п = 95 q л + 95(1 — q л — q п ) + 60 q п = 95(1 — q л ) + 60 q п .
Приравняв выражения, соответствующие стратегиям «налево» и «направо», и упростив полученное равенство, имеем 90–45qл = 95–35qп, или 35qп = 5 + 45qл. Далее приравниваем выражения, соответствующие стратегиям «налево» и «в центр», и упрощаем их, что дает 90–45qл = 70qл + 70qп, или 115qл + 70qп = 90. Подставив qп из первого уравнения (сначала умножив все члены уравнения на 2, чтобы вышло 70qп = 10 + 90qл) во второе, получаем 205qл = 80, или qл = 0,390. Затем, подставив это значение qл в любое из уравнений, получим qп = 0,644. И наконец, используем эти оба значения, чтобы получить qц = 1–0,390 — 0,644 = –0,034. Поскольку значение вероятности не может быть отрицательным, что-то явно пошло не так.
Чтобы понять, что происходит в данном примере, для начала обратите внимание на то, что теперь для бьющего пенальти игрока стратегия «в центр» хуже этой же стратегии в первоначальной версии игры, где вероятность ее выбора уже была достаточно низкой. Однако логика безразличия соперника, выраженная в виде уравнений, приведших к данному решению, означает, что бьющий игрок должен быть готов использовать эту плохую стратегию. Это может произойти только тогда, когда вратарь достаточно редко применяет свою наилучшую стратегию противодействия стратегии бьющего игрока «в центр», а именно стратегию «в центре». В данном примере такую логику рассуждений необходимо продолжать до тех пор, пока вероятность применения вратарем стратегии «в центре» не станет отрицательной.
С сугубо алгебраической точки зрения полученное решение вполне приемлемо, однако оно нарушает требование теории вероятностей и свойственной реальной жизни рандомизации в отношении того, что значение вероятности не может быть отрицательным. Лучшее, что здесь можно сделать, — снизить вероятность выбора вратарем стратегии «в центре» до минимального значения, то есть до нуля. Но в этом случае бьющий игрок не склонен к выбору стратегии «в центр». Иными словами, мы получаем ситуацию, в которой каждый игрок не использует одну из своих чистых стратегий в смешанной стратегии или использует ее с нулевой вероятностью.
Но тогда может ли существовать равновесие, в котором каждый игрок смешивает две оставшиеся стратегии — «налево» и «направо»? Если рассматривать эту сокращенную игру два на два саму по себе, можно без труда найти ее равновесие в смешанных стратегиях. Учитывая, что к настоящему моменту вы уже накопили достаточно большой опыт, мы оставляем детали поиска равновесия вам и приводим только полученный результат.
Вероятности применения чистых стратегий в смешанной стратегии бьющего игрока: p л = 0,4375, p л = 0,5625.
Вероятности применения чистых стратегий в смешанной стратегии вратаря: q л = 0,3750, q п = 0,6250.
Ожидаемый выигрыш бьющего игрока (процент успеха): 73,13.
Ожидаемый выигрыш вратаря (процент успеха): 26,87.
Мы получили этот результат, просто исключив стратегии двух игроков «в центр» и «в центре», руководствуясь интуицией. Но мы должны проверить, действительно ли это равновесие будет таковым в полной игре три на три, то есть должны убедиться, что ни один игрок не сочтет нужным применить третью стратегию в случае комбинации двух стратегий, выбранных другим игроком.
При выборе вратарем той или иной комбинации стратегий выигрыш бьющего игрока от применения чистой стратегии «в центр» составляет 0,375 × 70 + 0,625 × 70 = 70, что меньше выигрыша 73,13, который он получит от любой из своих чистых стратегий «налево» и «направо» или от любой их комбинации, а значит, бьющему игроку нет необходимости применять стратегию «в центр». Когда бьющий игрок выбирает комбинацию из двух стратегий с указанными выше вероятностями, выигрыш вратаря от использования чистой стратегии «в центре» составляет 0,4375 × 10 + 0,5625 × 50 = 7,2. И он существенно ниже выигрыша 26,87, который вратарь получил бы в случае применения любой из своих чистых стратегий «налево» и «направо» или от любой их комбинации. Таким образом, вратарю также не имеет смысла применять стратегию «в центре». Следовательно, равновесие, которое мы нашли для игры два на два, актуально и для игры три на три.
Чтобы предусмотреть вероятность того, что некоторые стратегии могут остаться незадействованными в равновесной комбинации стратегий, следует уточнить или расширить принцип безразличия соперника. Равновесная комбинация каждого игрока должна быть такой, чтобы другому игроку было безразлично, какую именно стратегию выбрать из тех, которые действительно используются в его равновесной комбинации, то есть другому игроку не безразличен выбор между ними и неиспользованными стратегиями и он отдает предпочтение выбранным стратегиям перед невыбранными. Иными словами, в игре против равновесной комбинации соперника все стратегии, вошедшие в состав вашей равновесной комбинации, должны обеспечивать вам один и тот же ожидаемый выигрыш, а он, в свою очередь, должен превышать выигрыш, который бы вы получили от любой из неиспользованных стратегий.
Какие именно стратегии останутся неиспользованными в равновесии? Ответ на этот вопрос требует применения метода проб и ошибок, как в приведенных выше вычислениях, либо выполнения соответствующих расчетов с помощью компьютерной программы. Как только вы поймете саму концепцию, можете приступать ко второму. Описание общей теории равновесий в смешанных стратегиях в случаях, когда в распоряжении игроков есть любое количество возможных стратегий, ищите в онлайн-приложении к данной главе.
8. Как использовать смешанные стратегии на практике
При поиске или выборе смешанной стратегии в игре с нулевой суммой следует помнить о нескольких важных моментах. Во-первых, для эффективного использования смешанной стратегии в такой игре ее участникам нужно сделать нечто большее, чем просто вычислить выраженные в процентах равновесные вероятности применения каждого из своих действий. На самом деле в игре с розыгрышем очка в теннисе Эверт не может просто выбирать стратегию ПЛ в семи из десяти случаев и стратегию ПД в трех из десяти случаев, механически чередуя семь ударов по линии и три удара по диагонали. Почему? Потому что смешивание стратегий должно помочь вам в полной мере воспользоваться элементом неожиданности в игре против соперника. Если вы задействуете узнаваемую схему игры, соперник наверняка это выявит и обернет себе на пользу.
Отсутствие закономерности означает, что после любой последовательности выбранных стратегий вероятность выбора стратегии ПЛ или ПД в следующий раз остается такой же, как всегда. Скажем, если стратегия ПЛ случайно используется несколько раз подряд, это отнюдь не означает, что ее «обязательно» должна сменить стратегия ПД. На практике многие ошибочно рассуждают совсем иначе, поэтому слишком часто чередуют варианты выбора по сравнению с тем, какой была бы их истинная случайная последовательность, и крайне редко используют несколько идентичных вариантов подряд. Тем не менее обнаружение закономерности в наблюдаемых действиях требует сложных статистических расчетов, которые соперники зачастую не в состоянии выполнять во время игры. Как мы увидим в , анализ результатов финальных матчей турниров Большого шлема привел к выводу, что подающие игроки слишком часто чередовали свои подачи, но принимающие не смогли обнаружить и воспользоваться этим отклонением от истинного вероятностного выбора действий.
Важность предотвращения предсказуемости наиболее очевидна в случае непрерывного взаимодействия в играх с нулевой суммой. Поскольку в таких играх интересы игроков диаметрально противоположны, ваш соперник всегда стремится использовать ваш выбор действий с максимальной выгодой для себя. Таким образом, если вы регулярно ведете против друг друга одну и ту же игру, соперник будет постоянно искать способ взломать код, используемый вами для рандомизации своих ходов. И если ему это удастся, у него появится шанс увеличить свой выигрыш в следующих раундах игры. Однако даже в случае однократных игр с нулевой суммой смешивание стратегий приносит пользу благодаря тактической неожиданности.
Победитель Мировой серии покера Дэниел Харрингтон, написавший в соавторстве с Биллом Роберти ряд замечательных книг об игре в разновидность покера под названием «техасский холдем», отмечает важность рандомизации стратегии в покере, позволяющей помешать сопернику угадать, какие карты у вас на руках, и использовать ваше поведение с выгодой для себя. Поскольку людям зачастую трудно вести себя непредсказуемо, Харрингтон дает следующий совет относительно того, как применять комбинацию таких чистых стратегий, «поднять ставку» и «ответить»:
Очень трудно точно вспомнить, что ты делал в последних четырех или пяти случаях при возникновении похожей ситуации. К счастью, это и не надо. Просто используй тот маленький генератор случайных чисел, который ты носишь в течение дня с собой. Что это? Ты и не знаешь, что у тебя такое есть? Да это секундная стрелка на твоих часах. Если ты знаешь, что в ранней позиции и при наличии на руках старшей пары ты должен повышать ставку в 80 % случаев и отвечать в остальных 20 %, то просто посмотри на часы и обрати внимание на положение секундной стрелки. Поскольку 80 % от 60 составляют 48, ты должен повышать ставку, если секундная стрелка находится между делениями от 0 до 48, и только отвечать, если между 48 и 60. Этот метод хорош тем, что даже если бы кто-то точно знал, что ты делаешь, он бы все равно не смог предсказать твоих дальнейших действий! [102]
Безусловно, при использовании секундной стрелки часов для реализации смешанной стратегии важно, чтобы ваши часы не были слишком точными, иначе соперник сможет использовать такие же часы и предугадает ваши намерения!
До сих пор мы исходили из предположения, что вы заинтересованы в применении смешанной стратегии, чтобы предотвратить возможное использование соперником ваших действий в своих интересах. Однако если он не придерживается равновесной стратегии, вы можете попытаться воспользоваться его ошибкой. В качестве иллюстрации приведем пример из эпизода мультсериала «Симпсоны», в котором Барт и Лиза играют друг с другом в игру «камень, ножницы, бумага». (В дано полное описание этой игры три на три; вам предстоит вычислить равновесную комбинацию стратегий каждого игрока.) Перед выбором стратегий Барт думает: «Конечно, камень. Он самый сильный». В то же время Лиза думает: «Бедный предсказуемый Барт. Он всегда выбирает камень». Как и следовало ожидать, наилучший ответ Лизы — стратегия «бумага» против своего незадачливого соперника; ей нет необходимости применять равновесную комбинацию стратегий.
Более тонкий пример использования действий соперника в своих интересах можно наблюдать в разыгрываемой парами студентов версии игры в теннис под названием «лучший из 100». Как и профессиональные теннисисты, наши студенты слишком часто переключаются с одной стратегии на другую, по всей видимости, считая, что выбор ПЛ пять раз подряд выглядит не таким уж «случайным». Для того чтобы извлечь из этого поведения выгоду для себя, игрок в роли Навратиловой смог предвидеть, что после выбора стратегии ПЛ три раза подряд игрок в роли Эверт, по всей вероятности, перейдет к стратегии ПД, и это можно обернуть себе на пользу, также переключившись на стратегию ПД. Этому игроку следовало бы поступать так чаще, чем в случае рандомизации каждого раунда игры в отдельности, но в идеале не так часто для того, чтобы игрок в роли Эверт заметил это и не научился повторять одну и ту же стратегию большее количество раз.
И наконец, игроки должны понять и принять тот факт, что применение смешанных стратегий защищает вас от использования соперником ваших действий в своих интересах и обеспечивает вам максимально возможный ожидаемый выигрыш в игре с соперником, который делает свой лучший выбор, но это не более чем математическое ожидание. В особых случаях игра может закончиться для вас неблагоприятным исходом. Например, длинный пас на третьем дауне с одним оставшимся ярдом, сделанный, чтобы держать защиту в напряжении, может завершиться неудачей в любом конкретном случае. Если вы выбираете смешанную стратегию в ситуации, за которою несете ответственность перед руководством, вы должны предусмотреть такой вариант. Вам следует заранее объяснить целесообразность использования вашей стратегии, скажем, своему тренеру или боссу. Они должны понять, почему вы ее выбрали и почему считаете, что она обеспечит вам наилучший выигрыш в среднем, хотя иногда и чревата достаточно низким выигрышем. Однако даже такое заблаговременное планирование не всегда способно защитить вашу «репутацию», поэтому вы должны быть готовы к критике при нежелательном исходе игры.
9. Эмпирические данные о смешивании стратегий
А. Игры с нулевой суммой
Первые исследователи, проводившие лабораторные эксперименты в области теории игр, как правило, пренебрегали смешанными стратегиями. Дуглас Дэвис и Чарльз Холт сказали по этому поводу следующее: «Участников экспериментов редко (если вообще когда-либо) можно было увидеть за подбрасыванием монеты, а когда впоследствии им говорили, что равновесие подразумевает рандомизацию, это вызывало у них удивление и скептицизм». Когда ожидаемое равновесие подразумевает смешивание двух или более чистых стратегий, результаты экспериментов показывают, что некоторые участники группы придерживаются одной чистой стратегии, тогда как остальные — другой, но это не истинное смешивание стратегий одним игроком. При многократной игре участников эксперимента в игры с нулевой суммой отдельные игроки часто со временем выбирают другие чистые стратегии. Тем не менее создается впечатление, что они ошибочно принимают чередование за случайный выбор, то есть переключаются между стратегиями чаще, чем того требует истинная рандомизация.
В ходе последующих исследований были получены несколько более достоверные данные в пользу смешивания в играх с нулевой суммой. Когда участники лабораторных экспериментов имеют возможность накопить большой опыт, они действительно осваивают навыки смешивания стратегий в играх с нулевой суммой. Тем не менее отклонения от равновесных прогнозов остаются весьма существенными. Усредненные по всем участникам эксперимента эмпирические вероятности, как правило, достаточно близки к вероятностям, рассчитанным посредством равновесия, но многие игроки все же выбирают стратегии в пропорциях, далеких от предсказанных равновесием. Колин Камерер сказал об этом следующее: «Общая картина такова, что смешанные равновесия в среднем не приводят к неверным догадкам в отношении поведения людей».
Один случай практического применения рандомизации произошел в Малайе в конце 1940-х годов. Британская армия сопровождала продовольственные конвои, чтобы защитить их от нападений коммунистов-террористов. Последние могли либо организовать масштабное нападение, либо провести мелкий снайперский обстрел, чтобы напугать водителей грузовиков, дабы те отказались от выполнения такой работы в следующий раз. Британское сопровождение могло либо группироваться в одном месте, либо рассредоточиться по всему конвою. Для армии сосредоточение позволяло эффективнее противостоять масштабной атаке, а рассредоточение было действенно против снайперов. Для террористов масштабное нападение было лучше при рассредоточенном сопровождении, а снайперский обстрел — при концентрации военных. В этой игре с нулевой суммой есть только одно равновесие в смешанных стратегиях. Командир отряда сопровождения, даже не слышавший о теории игр, решил проблему следующим образом. Каждое утро во время формирования конвоя он брал травинку в одну из рук и прятал руки за спиной, предлагая солдатам угадать, в какой руке травинка. В зависимости от ответа солдата командир выбирал тот или иной тип сопровождения конвоя. Хотя о точных показателях выигрышей в этой игре судить трудно, поэтому мы не можем сказать, было ли верным смешивание стратегий в соотношении 50 на 50, этот офицер правильно оценил необходимость рандомизации и важности использования новой процедуры рандомизации каждый день, чтобы избежать формирования закономерности или слишком частого чередования вариантов выбора.
Самые убедительные данные в поддержку смешанных стратегий в играх с нулевой суммой связаны со спортом, особенно его профессиональными видами, в которых игроки накапливают большой опыт, а присущее им стремление к победе подкрепляет крупное материальное вознаграждение при ее достижении.
Марк Уокер и Джон Вудерс проанализировали игру «подача — возврат подачи» между теннисистами высшего уровня во время матчей Уимблдонского турнира и представили это взаимодействие как игру с двумя участниками (подающим и принимающим), в которой каждый игрок имеет две чистые стратегии. Подающий может делать подачу под правую или левую руку принимающего, а принимающий может делать предположения о том, в какую сторону отправит подачу подающий, и двигаться именно туда. Поскольку во время турниров высшего уровня в мужском одиночном разряде подачи выполняются очень быстро, принимающий не может предпринять ответное действие после того, как увидит фактическое направление подачи, поэтому ему приходится двигаться в соответствии со своей оценкой возможного направления. Таким образом, это игра с одновременными ходами. Кроме того, так как принимающий стремится правильно угадать действия подающего, а подающий старается ввести в заблуждение принимающего, в этой игре мы видим равновесие в смешанных стратегиях. Отследить стратегию принимающего на видеозаписи невозможно (разве можно увидеть, на какую ногу он переносит вес?), поэтому полную матрицу выигрышей для проверки, смешивают ли игроки свои чистые стратегии в соответствии с равновесными прогнозами, воссоздать нельзя. Тем не менее правильность важного теоретического прогноза можно проверить, рассчитав частоту, с которой подающий выигрывает очко в случае каждой из имеющихся в его распоряжении стратегий подачи.
Если теннисисты используют равновесные комбинации стратегий в игре «подача — возврат подачи», подающий должен выигрывать очко с одинаковой вероятностью независимо от того, делает ли он подачу под правую или под левую руку принимающего. В реальном теннисном матче два игрока разыгрывают не менее сотни очков; следовательно, это предоставляет достаточно данных, чтобы проверить, выполняется ли это условие в каждом матче. Уокер и Вудерс составили таблицу результатов подач в 10 матчах. В каждом матче используются четыре типа комбинаций «подача — возврат подачи»: игрок А делает подачу игроку Б и наоборот в сочетании с подачей с правой или с левой стороны корта. Таким образом, Уокер и Вудерс проанализировали данные о 40 ситуациях с розыгрышем подачи и обнаружили, что в 39 из них показатели результативности подающего в случае подачи под правую и под левую руку попадали в допустимые пределы статистической погрешности.
По всей вероятности, теннисисты высшего уровня накопили достаточно большой общий опыт игры в теннис и ее ведения против различных соперников, для того чтобы усвоить общий принцип смешивания стратегий в правильном соотношении в игре против конкретных противников. Тем не менее, чтобы добиться необходимого уровня непредсказуемости, в любой последовательности подач не должно быть никакой закономерности: выбор стороны при каждой подаче не должен зависеть от предыдущего выбора. Как уже отмечалось в контексте применения смешанных стратегий на практике, игроки могут слишком часто чередовать чистые стратегии, не осознавая того, что чередование — такая же закономерность, как и неоднократное повторение одного и того же действия. И данные действительно подтверждают тот факт, что подающие чередовали свои стратегии слишком часто. Однако, согласно тем же данным, такое отклонение от истинного смешивания стратегий оказалось не настолько большим, чтобы соперники его заметили и использовали с выгодой для себя.
Как было показано в , пенальти в футболе — еще один подходящий контекст для изучения смешанных стратегий. Преимущество анализа штрафных ударов состоит в том, что это действительно позволяет отслеживать стратегии, используемые как игроком, выполняющим пенальти, так и вратарем, то есть видеть не только, куда бьющий игрок собирается послать мяч, но и в какую сторону бросается вратарь. Это означает, что мы можем вычислить фактические вероятности смешивания стратегий и сравнить их с теоретическими прогнозами. Недостаток этого контекста по сравнению с теннисом состоит в том, что два игрока сталкиваются друг с другом не более чем несколько раз за сезон. Для того чтобы собрать достаточно данных, вместо анализа конкретных случаев противоборства между игроками необходимо проанализировать показатели всех вратарей и игроков, выполняющих пенальти. По результатам двух исследований, основанных именно на таких данных, было получено убедительное подтверждение теоретических прогнозов.
Проанализировав большой объем данных, предоставленных профессиональными футбольными лигами Европы, Игнасио Уэрта составил таблицу выигрышей, соответствующих средней вероятности успешных ударов бьющего игрока (рис. 7.12). Поскольку в эти данные включены показатели бьющих игроков как с правой, так и с левой ноги, а значит, у них разное естественное направление удара, здесь естественной считается стратегия «направо». (Игроки, выполняющие пенальти, обычно бьют по мячу внутренней стороной стопы. Для игрока, бьющего с правой ноги, естественным является удар направо от вратаря, а с левой — удар налево от вратаря.) Каждый игрок располагает двумя вариантами стратегий — «налево» и «направо». Когда вратарь выбирает стратегию «направо», это означает, что он будет прикрывать естественное направление удара бьющего игрока.
Рис. 7.12. Вероятности успешного выполнения пенальти в европейских высших лигах
Воспользовавшись свойством безразличия соперника, можно легко определить, что бьющий игрок должен выбирать стратегию «налево» в 38,3 % случаев, а стратегию «направо» в 61,7 % случаев. Такая комбинация стратегий обеспечивает показатель результативности ударов 79,6 % независимо от того, какую стратегию выберет вратарь. Вратарь, со своей стороны, должен выбирать стратегии «налево» и «направо» в 41,7 и 58,3 процентах случаев соответственно; эта комбинация стратегий позволит ему удержать показатель результативности ударов бьющего игрока на уровне 79,6 %.
Что же происходит на самом деле? Игроки, выполняющие пенальти, применяли стратегию «налево» в 40,0 % случаев, а вратари — в 41,3 % случаев. Эти показатели максимально близки к теоретическим прогнозам. Выбранные комбинации стратегий почти полностью защищены от использования соперником в своих интересах. Смешанная стратегия бьющего игрока обеспечивает показатель результативности ударов 79 % против стратегии вратаря «налево» и 80 % против стратегии вратаря «направо». Смешанная стратегия вратаря удерживает показатель результативности бьющих игроков на уровне 79,3 % при выборе ими стратегии «налево», а при тратегии «направо» в 79,7 % случаев.
В ранее опубликованной работе Пьер-Андре Кьяппори, Тимоти Гроусклоуз и Стивен Левитт использовали аналогичные данные и получили аналогичные результаты. Кроме того, они проанализировали всю последовательность выбора стратегий каждым игроком, бьющим пенальти, и каждым вратарем и не нашли случаев чрезмерного чередования. Это можно объяснить тем, что большинство одиннадцатиметровых штрафных ударов представляют собой единичные события, происходящие на протяжении многих матчей, в отличие от многократно повторяющихся розыгрышей очка в теннисе, поэтому в случае пенальти игроки чаще не учитывают то, что происходило во время предыдущих пенальти. Тем не менее все эти данные говорят о том, что действия игроков во время выполнения пенальти в футболе даже ближе к истинному смешиванию стратегий, чем в игре «подача — возврат подачи» в теннисе.
При столь убедительном эмпирическом подтверждении теории было бы резонно спросить, эффективны ли навыки смешивания стратегий, приобретенные игроками в футболе, в других игровых контекстах. Результаты одного исследования подтвердили, что да (испанские профессиональные футболисты играли в точном соответствии с равновесными прогнозами во время лабораторных экспериментов в матричных играх с нулевой суммой два на два и четыре на четыре). Тем не менее в ходе другого исследования воспроизвести эти результаты не удалось. В его рамках анализировались показатели игроков американской Высшей лиги футбола, а также участников Мировой серии покера (у которых, как говорилось в , также есть профессиональные причины для предотвращения использования их действий соперниками с выгодой для себя посредством смешивания стратегий) и было установлено, что поведение профессиональных игроков во время абстрактных матричных игр так же далеко от равновесия, как и поведение студентов. Как и в случае исследований с участием профессиональных шахматистов, о которых шла речь в , при наличии опыта профессиональные игроки смешивают стратегии в соответствии с теорией равновесия в своей профессиональной сфере, но этот опыт не приводит их автоматически к равновесию в новых и незнакомых играх.
Б. Игры с ненулевой суммой
Лабораторные эксперименты со смешиванием стратегий в играх с ненулевой суммой дают еще более отрицательные результаты, чем аналогичные эксперименты в играх с нулевой суммой. И это неудивительно. Как мы уже убедились, в таких играх свойство, в соответствии с которым равновесная комбинация стратегий каждого игрока становится причиной безразличия соперника в отношении выбора между чистыми стратегиями, — логическое свойство самого равновесия. В отличие от игр с нулевой суммой, у каждого участника игры с ненулевой суммой зачастую нет положительных или целевых причин добиваться безразличия других игроков. В таком случае игрокам труднее понять и освоить логику рассуждений, лежащую в основе вычисления вероятностей применения чистых стратегий в смешанной стратегии, что проявляется в их поведении.
В группе участников эксперимента, играющих в игру с ненулевой суммой, можно увидеть, как одни игроки придерживаются одной чистой стратегии, тогда как другие — другой. Этот тип смешивания в группе не согласуется с теорией равновесий в смешанных стратегиях, хотя у такого смешивания есть интересная эволюционная интерпретация, которую мы проанализируем в .
Как мы говорили выше в , вероятности применения чистых стратегий в смешанной стратегии каждого игрока не должны меняться при изменении его выигрышей. Однако на самом деле именно это и происходит: как правило, игроки выбирают то или иное действие чаще, если их собственный выигрыш от этого увеличивается. Игроки действительно меняют свои действия в ходе повторных раундов игры с разными партнерами, но не в соответствии с равновесными прогнозами.
Общий вывод таков: в играх с ненулевой суммой следует интерпретировать и применять равновесия в смешанных стратегиях как минимум с большой осторожностью.
Резюме
Игры с нулевой суммой, в которых один игрок предпочитает совмещение действий, а другой наоборот, зачастую не имеют равновесия Нэша в чистых стратегиях. В таких играх каждый игрок стремится действовать непредсказуемо и поэтому использует смешанную стратегию с определенным распределением вероятностей на своем множестве чистых стратегий. Вероятности применения чистых стратегий в смешанной стратегии каждого игрока вычисляются с помощью свойства безразличия соперника, которое гласит, что в игре против равновесной смешанной стратегии данного игрока соперник должен получать равные ожидаемые выигрыши от всех своих чистых стратегий. Графики кривых наилучших ответов можно использовать для отображения всех равновесий в смешанных стратегиях (а также в чистых стратегиях) той или иной игры.
В играх с ненулевой суммой также могут присутствовать равновесия в смешанных стратегиях, которые можно рассчитать на основании свойства безразличия соперника и проиллюстрировать с помощью кривых наилучших ответов. Но мотивация к поддержанию безразличия соперника в этих играх слабее или отсутствует вообще, поэтому такие равновесия менее привлекательны для игроков и обычно неустойчивы.
Смешанные стратегии — это частный случай непрерывных стратегий, но им свойственны дополнительные аспекты, заслуживающие специального изучения. Равновесия в смешанных стратегиях можно интерпретировать как исходы игры, в которых каждый игрок имеет правильные убеждения в отношении вероятностей, с которыми другой игрок выбирает среди своих базовых чистых стратегий. Кроме того, при изменении выигрышей игроков равновесия в смешанных стратегиях могут иметь ряд свойств, противоречащих здравому смыслу.
Если в распоряжении одного игрока три стратегии, а другого — только две, первый, как правило, использует в равновесной смешанной стратегии всего две чистые стратегии. Если у обоих игроков по три (или более) чистые стратегии, в равновесных комбинациях стратегий может быть указана положительная вероятность применения их всех или только их подмножества. Все стратегии, активно используемые в смешанной стратегии, обеспечивают игроку равный ожидаемый выигрыш в игре против равновесной смешанной стратегии соперника; все неиспользованные стратегии гарантируют более низкий ожидаемый выигрыш. В крупных играх такого рода бывают случаи, когда равновесная комбинация стратегий остается неопределенной.
При применении смешанных стратегий игрокам нельзя забывать, что их система рандомизации ни в коем случае не должна быть предсказуемой. Крайне важно избегать чрезмерного чередования действий. Лабораторные эксперименты обеспечивают только слабую поддержку применения смешанных стратегий. Тем не менее равновесия в смешанных стратегиях позволяют получить достоверные прогнозы во многих играх с нулевой суммой с участием опытных профессиональных спортсменов.
Ключевые термины
Ожидаемый выигрыш
Свойство безразличия соперника
Упражнения с решениями
S1. Рассмотрим следующую игру:
a) Какую игру она больше всего напоминает: розыгрыш очка в теннисе, игру в доверие или игру в труса?
b) Найдите все равновесия Нэша в этой игре.
S2. В следующей таблице представлены выраженные в денежных суммах выигрыши в игре с одновременными ходами с двумя участниками:
a) Найдите равновесие Нэша в смешанных стратегиях в этой игре.
b) Определите ожидаемые выигрыши игроков в этом равновесии.
c) Ровена и Колин вместе получают максимальную сумму денег, когда Ровена выбирает «вниз». Тем не менее в равновесии она не всегда применяет эту стратегию. Почему? Можете ли вы придумать способы получения более согласованного исхода игры?
S3. Вспомните , где говорилось о пожилой даме, которой нужно было перейти улицу, а два игрока одновременно решали, предлагать ли ей помощь. Если вы выполнили это упражнение, значит, нашли все равновесия Нэша в чистых стратегиях. Теперь найдите равновесие в смешанных стратегиях.
S4. Просмотрите описание игры в теннис в данной главы. Вспомните, что, согласно равновесию Нэша в смешанных стратегиях, найденному в этом разделе, Эверт выбирает стратегию ПЛ с вероятностью 0,7, а Навратилова с вероятностью 0,6. Предположим, что чуть позже во время матча Эверт получает травму, из-за чего ее удары по линии становятся гораздо медленнее, а значит, Навратиловой их легче отражать. Выигрыши в этой игре представлены в следующей таблице.
a) По сравнению с игрой до получения травмы (см. ) стратегия ПЛ кажется теперь менее привлекательной для Эверт. Как думаете, в новом равновесии в смешанных стратегиях Эверт будет выбирать ее чаще, реже или так же, как раньше? Обоснуйте свой вывод.
b) Найдите равновесную комбинацию стратегий каждой участницы игры. Какова ожидаемая ценность данной игры для Эверт?
c) Чем отличаются равновесные комбинации, найденные в пункте b, от равновесных комбинаций в исходной игре и от вашего ответа на вопрос в пункте а? Объясните, почему изменилась или не изменилась каждая комбинация.
S5. В представлена упрощенная версия игры в бейсбол, а в пункте с указано, что в этой игре с одновременными ходами отсутствует равновесие Нэша в чистых стратегиях. Это объясняется тем, что у питчеров и бэттеров противоположные цели: питчеру нужно бросить мяч мимо бэттера, а бэттеру необходимо отбить этот мяч. Таблица игры выглядит так:
a) Найдите равновесие Нэша в смешанных стратегиях в этой упрощенной версии игры в бейсбол.
b) Определите ожидаемые выигрыши каждого игрока в этом равновесии.
c) Предположим, питчер попытается улучшить ожидаемый выигрыш в равновесии в смешанных стратегиях, замедлив свой фастбол таким образом, что это делает его похожим на керв. В итоге выигрыш бэттера в ячейке «ожидать фастбол — бросить фастбол» изменится с 0,30 до 0,25, а выигрыш питчера скорректируется соответственно. Может ли такое изменение улучшить ожидаемый выигрыш питчера? Тщательно обоснуйте свой ответ. Кроме того, объясните, почему замедление фастбола может (или не может) улучшить ожидаемый выигрыш питчера в этой игре.
S6. Несмотря на опасность игры в труса (см. ), Джеймс и Дин решают повысить ее эмоциональный накал (и ставки), стартуя на автомобилях с большего расстояния друг от друга. Так они смогут дольше держать зрителей в напряжении и сильнее разогнаться, прежде чем дело дойдет (или не дойдет) до серьезного столкновения. В связи с этим в новой таблице игры указан более высокий штраф за столкновение.
a) Найдите равновесие Нэша в смешанных стратегиях для этой более опасной версии игры в труса. Джеймс и Дин выбирают стратегию «ехать прямо» чаще или реже по сравнению с игрой, таблица которой представлена на ?
b) Определите ожидаемый выигрыш каждого игрока в случае равновесия в смешанных стратегиях, найденного в пункте a.
c) Джеймс и Дин решают разыгрывать игру в труса многократно (например, в присутствии разных групп зрителей из числа безрассудной молодежи). Более того, дабы избежать столкновения, они вступают в сговор и чередуют два равновесия в чистых стратегиях. Каким будет средний выигрыш ткаждого из них в случае такого сговора, если они сыграют четное количество игр? Он лучше или хуже выигрыша, на который они могут рассчитывать при равновесии в смешанных стратегиях? Почему?
d) После того как Джеймс и Дин несколько недель не играли в вариант игры в труса, описанный в пункте с, они договариваются сыграть снова. Однако к этому времени оба совершенно забывают, какое равновесие Нэша в чистых стратегиях разыгрывали в последний раз, и ни один из них этого не осознает, пока не взревут двигатели автомобилей перед самым началом игры. Вместо того чтобы играть в соответствии с равновесием Нэша в чистых стратегиях, каждый из них подбрасывает монету, чтобы решить, какую стратегию выбрать. Чему равен ожидаемый выигрыш Джеймса и Дина, если каждый из них смешивает стратегии в пропорции 50 на 50 таким способом? Как он соотносится с ожидаемыми выигрышами в случае равновесной комбинации стратегий? Объясните, почему эти выигрыши остаются неизменными или отличаются от выигрышей, вычисленных в пункте с.
S7. В продемонстрировано, как построить график кривых наилучших ответов в игре с розыгрышем очка в теннисе. В отмечено, что при наличии множества равновесий их можно определить по пересечениям кривых наилучших ответов. Для игры «битва полов», представленной на , постройте графики наилучших ответов Гарри и Салли на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша.
S8. Рассмотрите следующую игру:
a) При каких значениях x в этой игре есть единственное равновесие Нэша? Найдите его.
b) При каких значениях x в этой игре есть равновесие Нэша в смешанных стратегиях? С какой вероятностью, выраженной через x, каждый игрок будет выбирать стратегию «да» в равновесии в смешанных стратегиях?
c) Можно ли назвать эту игру при значениях x, найденных в пункте а, примером игры в доверие, игры в труса или игры наподобие тенниса? Обоснуйте свой ответ.
d) Пусть x = 3. Постройте график кривых наилучших ответов Ровены и Колина на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша в чистых и смешанных стратегиях.
e) Пусть x = 1. Постройте график кривых наилучших ответов Ровены и Колина на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша в чистых и смешанных стратегиях.
S9. Рассмотрите следующую игру:
a) Постройте график ожидаемых выигрышей от каждой из стратегий профессора Плама как функции р-комбинации миссис Пикок.
b) При каком диапазоне значений p стратегия «револьвер» обеспечивает профессору Пламу более высокий ожидаемый выигрыш, чем стратегия «нож»?
c) При каком диапазоне значений p стратегия «револьвер» обеспечивает ему более высокий ожидаемый выигрыш, чем стратегия «гаечный ключ»?
d) Какие чистые стратегии профессор Плам использует в своей равновесной комбинации? Почему?
e) Найдите равновесие Нэша в смешанных стратегиях в этой игре.
S10. Многие из вас наверняка знакомы с детской игрой «камень, ножницы, бумага». В ней два игрока одновременно выбирают свой «камень», «ножницы» или «бумагу», складывая ладони так, чтобы их форма напоминала один из этих вариантов. Счет в игре ведется следующим образом. Игрок, выбравший «ножницы», побеждает игрока, выбравшего «бумагу» (потому что ножницы режут бумагу). Игрок, выбравший «бумагу», побеждает игрока, выбравшего «камень» (поскольку бумага обертывает камень). Игрок, выбравший «камень», побеждает игрока, выбравшего «ножницы» (потому что камень разбивает ножницы). Допустим, в каждом отдельном розыгрыше игры на кону стоят 10 очков. Возможные исходы игры представлены в следующей таблице выигрышей:
a) Найдите равновесие в смешанных стратегиях в этой игре.
b) Предположим, Лиза объявила, что применит комбинацию стратегий, в которой вероятность выбора стратегии «камень» составляет 40 %, «ножницы» — 30 % и «бумага» — 30 %. Определите наилучший ответ Барта на такой выбор стратегий. Объясните, почему ваш ответ резонный, основываясь на ваших знаниях о смешанных стратегиях.
S11. Вспомните игру между торговцами мороженым на пляже из . В ней мы нашли два асимметричных равновесия в чистых стратегиях. В данной игре есть также симметричное равновесие в смешанных стратегиях.
a) Составьте таблицу этой игры пять на пять.
b) Исключите доминируемые стратегии и объясните, почему их не следует применять в равновесии.
c) Используйте ответ, полученный в части (b), чтобы найти равновесие в смешанных стратегиях в этой игре.
S12. Допустим, в игре в пенальти из данной главы в распоряжении бьющего игрока шесть стратегий: бить высоко и налево (ВЛ), низко и налево (НЛ), высоко и в центр (ВЦ), низко и в центр (НЦ), высоко и направо (ВП), а также низко и направо (НП). Вратарь по-прежнему располагает тремя стратегиями: двигаться налево от бьющего игрока (Л), двигаться направо (П) и оставаться в центре (Ц). Проценты успешных действий игроков приведены в следующей таблице:
Ваша задача — подтвердить, что в равновесии в смешанных стратегиях данной игры вратарь использует каждую из стратегий Л и П в 42,2 % случаев, а стратегию Ц в 15,6 % случаев, тогда как бьющий игрок применяет каждую из стратегий НЛ и НП в 37,8 % случаев, а стратегию ВЦ в 24,4 % случаев.
a) С учетом предложенной смешанной стратегии вратаря вычислите ожидаемый выигрыш бьющего игрока от каждой из его шести чистых стратегий и с учетом предложенной смешанной стратегии бьющего игрока ожидаемый выигрыш вратаря от каждой из его трех стратегий. (Для простоты используйте только три значащие цифры.)
b) На основании ответа, полученного в пункте а, объясните, почему смешанная стратегия вратаря — наилучший ответ на предложенную смешанную стратегию бьющего игрока и наоборот.
c) Воспользовавшись полученными выше ответами, объясните, почему предложенные стратегии образуют равновесие Нэша.
d) Вычислите равновесный выигрыш игрока, выполняющего пенальти.
S13 (дополнительное упражнение). В в контексте игры в доверие мы показали, что изменение выигрышей Салли не меняет пропорций, в которых она смешивает чистые стратегии в равновесии, — ее равновесная комбинация зависит только от выигрышей Гарри. В данном упражнении вам предстоит доказать, что это общий результат для всех равновесий в смешанных стратегиях в играх два на два. Рассмотрим общий случай игры с ненулевой суммой два на два, таблица выигрышей которой представлена ниже.
a) Предположим, в этой игре есть равновесие в смешанных стратегиях. Определите вероятность того, что Ровена выберет в равновесии стратегию «вверх» как функцию приведенных в таблице выигрышей.
b) Определите вероятность того, что Колин выберет стратегию «налево» в равновесии.
c) Объясните, как полученные вами результаты показывают, что равновесные комбинации каждого игрока зависят только от выигрышей другого игрока.
d) Каким условиям должны удовлетворять выигрыши, чтобы в данной игре действительно присутствовало равновесие в смешанных стратегиях?
S14 (дополнительное упражнение). Вспомните , основанное на сцене в баре из фильма «Игры разума». Здесь мы проанализируем равновесия в смешанных стратегиях в этой игре, когда в нее играют n > 2 молодых людей.
a) Начните с рассмотрения симметричного случая, когда каждый из n молодых людей самостоятельно пытается привлечь внимание одинокой блондинки с вероятностью P, зависящей от условия, согласно которому каждому молодому человеку должно быть безразлично, какую из двух чистых стратегий выбрать — «блондинка» или «брюнетка», с учетом того, что все остальные игроки смешивают стратегии. Какое условие гарантирует безразличие каждого игрока? Найдите равновесное значение P в этой игре.
b) В данной игре есть также ряд асимметричных равновесий в смешанных стратегиях. В них каждый из m < n молодых людей пытается привлечь внимание блондинки с вероятностью Q, а остальные n — m игроков добиваются расположения брюнеток. Какое условие гарантирует безразличие m молодых людей с учетом действий остальных игроков? Какое условие должно выполняться, чтобы оставшиеся n — m игроков не отказались от применения чистой стратегии выбора брюнетки? Чему равно равновесное значение Q в случае асимметричного равновесия?
Упражнения без решений
U1. В американском футболе команда нападения может либо совершать пробежку с мячом, либо делать пас, тогда как команда защиты может ожидать (и подготовиться) либо пробежку, либо пас. Предположим, ожидаемые выигрыши обеих команд (в ярдах) за каждый отдельно взятый даун составляют:
a) Докажите, что в этой игре нет равновесия Нэша в чистых стратегиях.
b) Найдите в ней единственное равновесие Нэша в смешанных стратегиях.
c) Объясните, почему комбинация стратегий команды нападения отличается от комбинации стратегий команды защиты.
d) Сколько ярдов предположительно может набрать команда нападения в случае равновесия?
U2. Накануне крайнего срока сдачи работ профессор получает электронное письмо от одного из студентов, который утверждает, что застрял с решением одной из задач, просидев над ней больше часа. Профессор не против помочь студенту, если тот действительно работает, но отказал бы в помощи, зная, что тот просто пытается выудить подсказку. Учитывая время получения письма, профессор мог бы просто сделать вид, что прочитал его значительно позже. Очевидно, что студент предпочел бы получить помощь независимо от того, решал он задачу или нет. Но если так ее и не дождется, то предпочтет не усугублять проблему и приступит к работе, поскольку задачи необходимо сдать завтра. Предположим, участники этой игры получат следующие выигрыши:
a) Найдите равновесие Нэша в смешанных стратегиях в этой игре.
b) Вычислите ожидаемый выигрыш каждого из игроков.
U3. В описывается игра «чет или нечет», в которой нет равновесия Нэша в чистых стратегиях. Однако в ней есть равновесие в смешанных стратегиях.
a) Если Анна выберет 1 (выбросит один палец) с вероятностью p, каков ожидаемый выигрыш Брюса от выбора 1, выраженный через p? Чему равен его ожидаемый выигрыш от выбора 2?
b) При каком уровне p Брюсу будет безразлично, какую стратегию выбрать — 1 или 2?
c) Если Брюс сыграет 1 с вероятностью q, при каком уровне q Анне будет безразлично, какую стратегию выбрать — 1 или 2?
d) Запишите равновесие в смешанных стратегиях этой игры. Чему равен в ней ожидаемый выигрыш каждого игрока?
U4. Вернемся снова к соперничеству между теннисистками Эверт и Навратиловой, о котором шла речь в . Через много месяцев они опять встречаются на очередном турнире. Эверт восстановилась после травмы (см. ), а Навратилова в это же время усердно улучшала навыки защиты против подач по линии. Ниже представлена таблица выигрышей в этой игре.
a) Найдите равновесную комбинацию каждого игрока в этой игре.
b) Что произошло с р-комбинацией Эверт по сравнению с игрой, представленной в ? Почему?
c) Какова ожидаемая ценность данной игры для Эверт? Почему она отличается от ожидаемой ценности первоначальной игры, рассматриваемой в ?
U5. В данной главы шла речь о смешивании стратегий в контексте «битвы полов» между Гарри и Салли.
a) Как думаете, что произойдет с равновесными значениями p и q, вычисленными в этой главе, если Салли решит, что Local Latte ей действительно нравится гораздо больше, чем Starbucks, поэтому теперь в ячейке Local Latte, Local Latte указаны выигрыши 1, 3? Объясните логику своих рассуждений.
b) Найдите новые равновесные значения p и q. Чем они отличаются от равновесных значений p и q в исходной игре?
c) Определите ожидаемый выигрыш каждого игрока в случае нового равновесия в смешанных стратегиях.
d) Как вы считаете, могли бы Гарри и Салли разыграть равновесие в смешанных стратегиях в новой версии игры? Обоснуйте свой ответ.
U6. Рассмотрим следующий вариант игры в труса, в котором выигрыш Джеймса от стратегии «ехать прямо» при условии, что Дин выбирает стратегию «свернуть», равен 2, а не 1.
a) Найдите равновесие в смешанных стратегиях в этой игре, в том числе ожидаемые выигрыши игроков.
b) Сравните полученные результаты с результатами в исходной игре в данной главы. Вероятность того, что Дин выберет «ехать прямо», повысилась? А как насчет вероятности того, что Джеймс «поедет прямо»?
c) Что произошло с ожидаемыми выигрышами двух игроков? Эти различия между равновесными исходами парадоксальны с точки зрения новой структуры выигрышей? Объясните, как можно трактовать ваши выводы в контексте принципа безразличия соперника.
U7. Постройте графики наилучших ответов Джеймса и Дина для игры в труса, представленной на , на координатной плоскости с осями p и q. Обозначьте все равновесия Нэша.
U8. a) Найдите все равновесия Нэша в чистых стратегиях в следующей игре:
b) Найдите равновесие в смешанных стратегиях в этой игре. Чему равны ожидаемые выигрыши игроков в этом равновесии?
U9. Рассмотрите измененную версию игры из .
a) Постройте график ожидаемых выигрышей от каждой из стратегий профессора Плама как функции р-комбинации миссис Пикок.
b) Какие чистые стратегии использует профессор Плам в своей равновесной комбинации? Почему?
c) Найдите равновесие Нэша в смешанных стратегиях в этой игре.
d) Обратите внимание, что данная версия игры незначительно отличается от игры, представленной в . В чем различие между этими двумя играми? Объясните, почему интуиция подсказывает вам, что равновесный исход игры изменился по сравнению с исходом игры в .
U10. Рассмотрите измененную версию игры «камень, ножницы, бумага», в которой Барт получает приз, когда выигрывает, применив стратегию «камень». Если Барт выберет «камень», а Лиза — «ножницы», он получит в два раза больше очков по сравнению с тем, что оба получили бы при любом ином подходе. Новая матрица выигрышей выглядит так:
a) Найдите равновесие в смешанных стратегиях в этой версии игры.
b) Сравните полученный результат с равновесием в смешанных стратегиях из упражнения S10. Как вы можете объяснить различия между ними?
U11. Рассмотрите следующую игру.
a) Есть ли в ней равновесие в чистых стратегиях? Если да, то какое?
b) Найдите равновесие в смешанных стратегиях в этой игре.
c) В действительности в этой игре два равновесия в смешанных стратегиях. Найдите то, которое вы не нашли в пункте b. (Подсказка: в одном из этих равновесий один из игроков выбирает смешанную стратегию, тогда как другой — чистую.)
U12. Упрямые Джеймс и Дин снова играют в более опасный вариант игры в труса (см. ). Они заметили, что их выигрыш («храбрец») зависит от количества зрителей. Чем их больше, тем больше славы и похвал получает тот, кто едет прямо. Безусловно, в случае меньшего количества зрителей наблюдается противоположный эффект. Пусть k > 0 — это выигрыш игрока, который показал себя «храбрецом». Теперь эту игру можно представить так:
a) С какой вероятностью, выраженной через k, каждый водитель выбирает стратегию «свернуть» в равновесии Нэша в смешанных стратегиях? Применяют ли Джеймс и Дин эту стратегию чаще или реже по мере увеличения значения k?
b) Чему равна ожидаемая ценность игры для каждого игрока, выраженная через k, в равновесии Нэша в смешанных стратегиях, найденном в пункте а?
c) При каком значении k и Джемс, и Дин смешивают в данном равновесии стратегии в соотношении 50 на 50?
d) Насколько большим должно быть значение k, чтобы средний выигрыш был положительным при схеме чередования, о которой шла речь в ?
U13 (дополнительное упражнение). Вспомните игру из , где Ларри, Мо и Керли могут покупать билеты с возможностью получить приз в размере 30 долларов. Мы нашли в ней шесть равновесий Нэша в чистых стратегиях. В данном упражнении вам предстоит найти симметричное равновесие в смешанных стратегиях.
a) Исключите слабо доминируемую стратегию каждого игрока. Объясните, почему игрок никогда не использовал бы ее в своей равновесной комбинации стратегий.
b) Найдите равновесие в смешанных стратегиях.
U14 (дополнительное упражнение). В и показано, что в играх с нулевой суммой, таких как соперничество Эверт и Навратиловой в теннисе, изменение выигрышей одного игрока иногда приводит к неожиданным или парадоксальным изменениям в равновесной комбинации стратегий. Но что происходит при этом с ожидаемой ценностью игры? Рассмотрим следующую общую форму игры с нулевой суммой с участием двух игроков:
Предположим, в этой игре нет равновесия Нэша в чистых стратегиях, а значения a, b, c и d больше или равны 0. Может ли увеличение значения одной из переменных a, b, c и d обусловить снижение ценности игры для Ровены? Если нет, докажите это. Если да, приведите пример.
Приложение. Вероятность и ожидаемая полезность
При вычислении ожидаемых выигрышей и равновесий в смешанных стратегиях в данной главе мы должны были выполнить ряд простых действий с вероятностями. Для этого существует несколько несложных правил. Возможно, многие из вас с ними знакомы, но мы дадим здесь краткое описание и объяснение основных понятий, чтобы вы могли в случае необходимости восстановить или восполнить свои знания. Кроме того, мы также покажем, как вычислить математическое ожидание случайных числовых величин.
Основные алгебраические действия с вероятностями
Базовое интуитивное представление вероятности наступления того или иного события формируется в процессе размышлений о частоте, с которой оно происходит случайно в рамках более крупного множества возможных событий. Как правило, любой элемент более крупного множества столь же вероятен, как и любой другой элемент. Следовательно, поиск вероятности интересующего нас события сводится к подсчету числа элементов, соответствующих этому событию, и их делению на общее количество элементов в крупном множестве.
Например, в любой стандартной колоде из 52 игральных карт четыре масти (трефы, бубны, червы и пики), по 13 карт разного достоинства в каждой: сначала туз, затем номерные карты от 2 до 10 и фигурные карты — валет, дама, король. Мы можем задать массу разных вопросов о том, с какой вероятностью из данной колоды карт можно извлечь карту определенной масти или достоинства (или масти и достоинства): с какой вероятностью можно вытащить карту пиковой масти? А черную карту? А десятку? А даму пик? И так далее. Чтобы ответить на эти вопросы, необходимо обладать определенными знаниями о вычислении вероятностей и о действиях с ними. Если бы у нас было две колоды карт (одна с синими рубашками, а другая с зелеными), мы могли бы задать еще более сложные вопросы («С какой вероятностью можно вытащить по одной карте из каждой колоды так, чтобы обе карты оказались валетом бубен?»), но для получения ответа на них по-прежнему использовали бы все те же алгебраические действия с вероятностями.
В широком смысле вероятность — это степень возможности наступления определенного события или совокупности событий. Возможность того, что вы извлечете карту пиковой масти из колоды карт, — просто вероятность наступления события «вытащить пику». В данном случае крупное множество содержит 52 элемента (общее количество в равной степени вероятных возможностей), а событие «вытащить пику» соответствует подмножеству, состоящему из 13 конкретных элементов. Таким образом, у вас есть 13 шансов из 52 вытащить пику, а значит, вероятность сделать это за один раз равна 13/52 = 1/4 = 25 %. Данную ситуацию можно представить себе иначе: у вас есть четыре масти по 13 карт в каждой, следовательно, ваш шанс извлечь карту определенной масти составляет один к четырем, или 25 %. Если бы вы тащили карту несколько раз (каждый раз из полной колоды карт), то из 52 попыток вы не всегда вытаскивали бы пику в точности 13 раз; по воле случая вы порой вытаскивали бы на несколько больше, а иногда на несколько меньше пик. Однако когда извлечение карт из колоды выполняется многократно, существуют разные множества из 52 попыток и этот шанс усредняется. В таком случае вероятность 25 % представляет собой среднее значение частоты вытаскивания карты пиковой масти в большом количестве наблюдений.
В алгебре вероятностей все эти идеи сформулированы в общих терминах и выражены формулами, которые вы сможете использовать автоматически вместо того, чтобы каждый раз анализировать все с нуля. Мы обсудим эти формулы вычисления вероятностей в контексте вопросов, которые можно задать в случае вытаскивания карт из стандартной колоды (или из двух колод — с синими и зелеными рубашками). Этот метод позволит нам предоставить вам как конкретные, так и общие формулы, которые вы сможете применить в будущем. Аналогия с извлечением карт поможет вам проанализировать другие вопросы, касающиеся вероятностей, возникающие в иных контекстах. Обратите внимание на следующее: в обычном языке принято выражать вероятности в процентах, но в алгебраических формулах их следует записывать в виде простых или десятичных дробей, то есть вместо 25 % должно быть 13/52, или 0,25. Мы будем использовать разные способы представления вероятностей в зависимости от ситуации, но вы должны отдавать себе отчет, что во всех этих случаях смысл один и тот же.
А. Правило сложения вероятностей
Первый наш вопрос будет звучать так: если бы нам понадобилось вытянуть одну карту из синей колоды, с какой вероятностью мы извлекли бы карту пиковой масти? И какова вероятность того, что она была бы не пикой? Мы уже знаем, что вероятность вытащить пику составляет 25 % (мы определили это ранее). Но какова вероятность вытащить не пику? Она равна вероятности извлечь трефу, черву или бубну вместо пики. Очевидно, что интересующая нас вероятность должна быть больше любой из отдельных вероятностей, из которых она состоит; на самом деле эта вероятность равна 13/52 (трефы) + 13/52 (бубны) + 13/52 (червы) = 0,75. Слово «или» в нашей вербальной формулировке ответа на вопрос указывает на то, что эти вероятности необходимо суммировать, поскольку мы хотим знать шансы вытащить карту из всех этих трех мастей.
Существует и более простой способ ответить на второй вопрос: отметить, что вытаскивание карты не пиковой масти происходит в оставшихся 75 % случаев. Таким образом, вероятность вытащить не пику составляет 75 % (100 % минус 25 %) или, в более формальном виде, 1 − 0,25 = 0,75. Как часто бывает при вычислении вероятностей, в данном примере один и тот же результат можно получить двумя разными путями, требующими разных размышлений о событии, вероятность которого мы пытаемся найти. Чуть ниже в данном приложении мы увидим и другие примеры, показывающие, что разные методы вычисления вероятностей порой требуют совершенного разного количества усилий. По мере накопления опыта вы откроете для себя и запомните легкие способы или более короткие пути. А пока утешайте себя тем, что каждый из этих путей, если ему неукоснительно следовать, ведет к получению одного и того же конечного результата.
Обобщим наши предыдущие вычисления. Если разделить множество событий Х на ряд подмножеств Y, Z, …, которые не перекрываются (на языке математики они называются непересекающимися), то сумма вероятностей наступления каждого подмножества равна вероятности полного множества событий; если полное множество событий включает в себя все возможные исходы, то его вероятность равна 1. Иными словами, если наступление события Х требует наступления каждого из нескольких непересекающихся событий, то вероятность Х равна сумме вероятностей отдельных событий Y, Z, …. Обозначив вероятность наступления Х как Prob(X) и запомнив предостережения в отношении Х (это событие требует наступления каждого из событий), а также в отношении Y, Z, … (эти события должны быть непересекающимися), можем записать правило сложения вероятностей в математических обозначениях как Prob(X) = Prob(Y) + Prob(Z) + ….
Упражнение. С помощью правила сложения вероятностей найдите вероятность вытаскивания двух одинаковых карт из двух колод (по одной из каждой колоды).
Б. Правило умножения вероятностей
Теперь давайте поставим вопрос так: какова вероятность того, что две извлеченные (по одной из каждой колоды) нами карты окажутся пиковой масти? Это событие наступит в случае, если мы вытащим пику из синей колоды и пику из зеленой. Переход от «или» к «и» в формулировке ответа на вопрос указывает на переход от математической операции сложения к умножению. Таким образом, вероятность вытащить две пики (по одной из каждой колоды) равна произведению вероятностей вытягивания одной пики из каждой колоды, или (13/52) × (13/52) = 1/16 = 0,0625, или 6,25 %. Как и следовало ожидать, мы получим две пики с гораздо меньшей вероятностью, чем одну пику в предыдущем разделе. (Всегда проверяйте, соответствуют ли ваши расчеты интуитивной оценке исхода игры.)
Подобно тому как правило сложения требует, чтобы события были непересекающимися, правило умножения требует, чтобы они были независимыми: если разделить множество событий X на ряд подмножеств Y, Z, …, эти подмножества будут независимыми, если наступление одного из них не влияет на вероятность другого. Наши события (карта пиковой масти из синей колоды и карта пиковой масти из зеленой) удовлетворяют этому условию; иными словами, вытягивание пики из синей колоды не приводит к изменению вероятности вытягивания пики из зеленой колоды. Однако если бы мы извлекли обе карты из одной колоды, то после вытаскивания пики (с вероятностью 13/52) вероятность вытащить еще одну пику больше не составляла бы 13/52 (на самом деле она равнялась бы 12/51); следовательно, такие события, как вытаскивание одной, а затем второй карты пиковой масти из одной колоды, не относятся к независимым событиям.
Строгая формулировка правила умножения вероятностей гласит, что если наступление события X требует одновременного наступления всего ряда независимых событий Y, Z, …, то вероятность наступления события X равна произведению вероятности наступления отдельных событий Y, Z, …: Prob(X) = Prob(Y) × Prob(Z) × ….
Упражнение. С помощью правила умножения вероятностей найдите вероятность вытаскивания двух карт (по одной из каждой колоды), среди которых была бы одна красная карта из синей колоды и одна фигурная из зеленой колоды.
В. Математическое ожидание
Если количественная величина (такая как денежный выигрыш или количество атмосферных осадков) носит случайный характер и может принимать одно из n возможных значений X 1 , X 2 , …, X n с соответствующими вероятностями p 1 , p 2 , …, p n , то математическое ожидание представляет собой взвешенное по вероятности среднее всех возможных значений этой величины: p 1 X 1 + p 2 X 2 + … + p n X n . Например, предположим, вы заключаете пари на подбрасывание двух монет. Если выпадут два орла, вы получите 5 долларов, если один орел и одна решка — 1 доллар, а если две решки, то ничего. Воспользовавшись правилами выполнения действий с вероятностями, о которых шла речь выше, вы можете определить, что вероятность наступления этих событий составляет 0,25, 0,50 и 0,25 соответственно. Следовательно, ваш ожидаемый выигрыш составит (0,25 × 5) + (0,50 × 1) + (0,25 × 0) = 1,75 доллара.
В теории игр в качестве числовых величин, которые необходимо привести к среднему значению таким способом, выступают выигрыши, выраженные в виде численных показателей, или денег, или, как мы увидим в , в виде полезности. В каждом контексте мы будем обозначать математическое ожидание соответствующими терминами, такими как ожидаемый выигрыш или ожидаемая полезность.
Резюме
Вероятность события — это возможность его случайного наступления в рамках более крупного множества возможных событий. Вероятности можно вычислять на основании определенных правил. Правило сложения вероятностей гласит, что вероятность наступления любого количества непересекающихся событий равна сумме вероятностей этих событий. Согласно правилу умножения вероятностей, вероятность наступления ряда независимых событий равна произведению их вероятностей. Для вычисления ожидаемых выигрышей в игре используются взвешенные по вероятности средние значения.
Ключевые термины
Вероятность
Математическое ожидание
Независимые события
Непересекающиеся множества
Правило сложения вероятностей
Правило умножения вероятностей
Часть III. Большие классы игр и стратегий
Глава 8. Неопределенность и информация
* * *
В мы уже упоминали о различных способах возникновения в игре неопределенности (внешняя и стратегическая) и о том, что игроки могут располагать ограниченной информацией (несовершенной и неполной, симметричной и асимметричной) о разных аспектах игры: с некоторыми из них мы уже сталкивались и анализировали. В частности, в играх с одновременными ходами присутствует стратегическая неопределенность, поскольку каждый игрок не знает, какие действия предпринимает другой игрок. В мы говорили о том, что стратегическая неопределенность порождает асимметричную и несовершенную информацию, потому что различные действия, предпринимаемые одним игроком, необходимо объединить в одно информационное множество другого игрока. В и мы рассказывали, как решить проблему стратегической неопределенности посредством формирования у каждого игрока определенных убеждений в отношении действий другого игрока (в том числе убеждений о вероятности выполнения различных действий в случае использования смешанной стратегии) и применения концепции равновесия Нэша, в котором эти убеждения находят подтверждение. В данной главе мы сфокусируемся на других способах возникновения неопределенности и информационных ограничений в играх.
Начнем с анализа различных стратегий, позволяющих отдельным людям и обществам в целом справляться с несовершенством информации, возникающим в результате внешней неопределенности или риска. Напомним, что внешняя неопределенность обусловлена причинами, неподконтрольными игрокам, но при этом влияющими на их выигрыши; погода — один из простых примеров. Мы представим вам ряд базовых идей, лежащих в основе диверсификации или распределения риска отдельным игроком или объединения рисков несколькими игроками. Эти стратегии способны принести пользу всем игрокам, хотя распределение общего выигрыша между участниками может быть неравномерным, из-за чего в ситуациях такого рода наблюдается смешение общих интересов и конфликта.
Далее рассмотрим информационные ограничения в ситуациях со стратегической взаимозависимостью. Информация в игре считается полной только тогда, когда все правила игры (стратегии игроков и выигрыши каждого из них как функции стратегий всех игроков) полностью известны всем игрокам и, более того, являются их общим знанием. При столь строгом стандарте в большинстве игр присутствует неполная информация. Кроме того, зачастую неполнота информации асимметрична: каждый игрок знает собственные возможности и выигрыши гораздо лучше, чем возможности других игроков. Как отмечалось в , манипулирование информацией — важный аспект стратегий в таких играх. В этой главе мы обсудим, когда информацию можно или нельзя передать в устной форме достоверным способом. Кроме того, проанализируем другие стратегии, предназначенные для передачи или сокрытия игроком своей информации, а также ее получения от другого игрока. В и вкратце анализировались некоторые из таких стратегий (скрининг и сигнализация), сейчас же мы остановимся на них более подробно.
Безусловно, участники многих игр хотели бы иметь возможность манипулировать действиями других игроков. Руководители хотели бы, чтобы подчиненные усердно трудились и качественно выполняли свою работу; страховые компании хотели бы, чтобы держатели страховых полисов проявляли осторожность, чтобы снизить страховой риск. Если бы информация была совершенной, действия игроков поддавались бы наблюдению. Оплату труда сотрудников можно было бы поставить в зависимость от качества и количества их усилий; страховое возмещение держателям страховых полисов можно было бы выплачивать только в случае, если они предпринимают необходимые меры предосторожности. Но в действительности все эти действия трудно отслеживать, что создает ситуацию с несовершенной асимметричной информацией, обычно обозначаемую термином моральный риск. В связи с этим участники таких игр вынуждены изобретать различные непрямые способы создания стимулов, позволяющих влиять на действия других игроков в нужном направлении.
Исследования по теме информации и манипулирования ею в играх очень активизировались в последние десятилетия и пролили свет на многие ранее не совсем понятные аспекты экономики, в частности природу стимулирующих контрактов, организационную структуру компаний, рынки труда и товаров длительного пользования, государственное регулирование бизнеса и множество других аспектов. Не так давно политологи применили эти же концепции для объяснения зависимости изменений в налоговой и бюджетной политике от выборов, а также делегирования законодательных полномочий комитетам. Эти идеи распространились и в биологии, где эволюционная теория игр рассматривает такие отличительные характеристики, как большой невероятно красивый хвост павлина в качестве сигнала. Пожалуй, еще более важно, чтобы вы поняли, насколько значимы скрининг и сигнализирование в вашем повседневном взаимодействии с членами семьи, друзьями, учителями, коллегами и прочими людьми, что позволит вам совершенствовать свои стратегии в подобных играх.
Хотя изучение информации явно выходит за рамки анализа внешней неопределенности и базовых концепций сигнализирования и скрининга, тем не менее мы сфокусируемся в данной главе только на этих темах. К анализу информации и манипулирования ею мы вернемся в , где используем описанные в данной главе методы для разработки механизмов создания стимулов и получения конфиденциальной информации от других игроков.
1. Несовершенная информация: преодоление риска
Представьте, что вы фермер и ваша работа зависит от прихотей погоды. Если погода способствует хорошему урожаю, вы получите доход 160 000 долларов. Если сложатся неблагоприятные метеорологические условия, ваш доход составит всего 40 000 долларов. Эти две возможности в равной степени вероятны (вероятность каждой из них: 1/2, или 0,5, или 50 %). Следовательно, ваш средний, или ожидаемый, доход равен 100 000 долларов 100 000 = 1/2 × 160 000 + 1/2 × 40 000, однако это среднее значение сопряжено со значительным риском.
Что вы можете сделать, чтобы уменьшить имеющийся риск? Попробовать выращивать культуру, которая менее подвержена капризам погоды. Но предположим, что вы уже сделали все от вас зависящее. В таком случае вы могли бы попытаться снизить риск еще больше, предложив кому-то принять на себя его часть. Безусловно, в обмен вам придется что-то этому человеку дать. Такой равноценный обмен обычно принимает две формы: денежный платеж или взаимный обмен либо разделение риска.
А. Разделение риска
Сначала проанализируем возможность взаимовыгодного разделения риска. Предположим, ваш приятель сталкивается с аналогичным риском, но в то время, когда у вас плохая погода, на его ферме погода хорошая и наоборот. (Допустим, вы живете на противоположных концах острова и дождевые облака приходят либо на одну, либо на другую его сторону, но не на обе сразу.) Корреляция — это зависимость между двумя любыми неопределенными величинами (в данном примере между риском одного фермера и риском другого). Следовательно, можно сказать, что между риском вашего приятеля и вашим риском существует полная отрицательная корреляция. Ваш с приятелем совокупный доход составляет 200 000 долларов, какой бы ни была погода, то есть он совершенно безрисковый. Вы можете заключить между собой контракт, по условиям которого каждый из вас получит гарантированных 100 000 долларов: вы обещаете выплачивать приятелю 60 000 долларов в те годы, когда вам сопутствует удача, а он — в те годы, когда ему сопутствует удача. Объединив свои риски, вы их устраняете.
Валютные свопы — еще один показательный пример отрицательной корреляции рисков в реальной жизни. Американская компания, экспортирующая продукцию в Европу, получает доход в евро, но ее интересует прибыль в долларах, зависящая от колебаний обменного курса евро — доллар. Со своей стороны, европейская компания, экспортирующая продукцию в США, сталкивается с аналогичной неопределенностью в отношении прибыли, выраженной в евро. Когда курс евро по отношению к доллару падает, доход американской компании в евро составляет меньшую сумму в долларах, а долларовый доход европейской компании — более крупную сумму в евро. Когда курс евро по отношению к доллару повышается, складывается противоположная ситуация. Таким образом, колебания обменного курса создают отрицательно коррелированные риски для обеих компаний. Следовательно, обе могут их снизить, заключив контракт о соответствующем обмене доходами.
Даже при отсутствии отрицательной корреляции разделение рисков имеет свои преимущества. Вернемся к вашей роли фермера и допустим, что вы с приятелем сталкиваетесь с рисками, не зависящими друг от друга, как если бы тучи подбрасывали монету, чтобы решить, на какую сторону острова отправиться. В таком случае существуют четыре возможных исхода, каждый с вероятностью 1/4. Ваш с приятелем доход при этих четырех исходах представлен в левой части рис. 8.1. Но предположим, вы должны заключить контракт о разделении риска поровну; тогда ваш доход будет отображен в правой части рис. 8.1. Ваш средний (ожидаемый) доход в каждой таблице составляет 100 000 долларов, однако без договора о разделении риска каждый из вас получил бы 160 000 долларов, или 40 000 долларов с вероятностью 1/2 каждый. При наличии контракта вы оба получили бы по 160 000 долларов с вероятностью 1/4, по 100 000 долларов с вероятностью 1/2 и 40 000 долларов с вероятностью 1/4. Таким образом, контракт о разделении риска позволяет каждому из вас снизить вероятность двух крайних исходов с 1/2 до 1/4 и повысить вероятность среднего исхода с 0 до 1/2. Иными словами, контракт уменьшил риск каждого из вас.
Рис. 8.1. Разделение риска в связи с получением дохода
В действительности вы с приятелем можете уменьшать свои риски посредством их разделения при условии, что между вашими доходами нет полной положительной корреляции (то есть до тех пор, пока удача не улыбнется вам обоим). А группе более двух человек, риски которых в определенной мере независимы друг от друга, закон больших чисел позволяет еще сильнее снизить риск каждого участника. Именно так и поступают страховые компании: объединив подобные, но независимые риски многих людей, они могут выплатить страховое возмещение каждому, кто понесет существенные убытки. Этот же принцип лежит в основе диверсификации инвестиционного портфеля: вкладывая средства во много разных активов с разными типами и степенями риска, вы тем самым уменьшаете общий уровень подверженности риску.
Однако такие механизмы разделения рисков зависят от публичной наблюдаемости результатов и возможности контролировать выполнение условий контракта. В противном случае у каждого фермера возникает соблазн сделать вид, что ему не повезло, или просто нарушить условия договора о разделении риска, когда ему сопутствует удача. Точно так же страховая компания может безо всяких оснований отказать в выплате страхового возмещения, но желание сохранить репутацию может удержать ее от этого шага.
Теперь рассмотрим еще один вопрос. В обсуждении выше мы исходили из того, что разделение риска осуществляется в равных долях. Это кажется естественным, поскольку вы и ваш приятель-фермер находитесь в одинаковых ситуациях. Но у вас могут быть разные стратегические навыки и возможности, и один из вас умеет лучше вести переговоры и, соответственно, добиваться большего при заключении контрактов.
Для того чтобы это понять, мы должны признать, что фермеры стремятся заключать договоренности о разделении рисков по причине их нерасположенности к риску. Как объясняется в , отношение к риску можно определить путем использования нелинейной шкалы для перевода денежного дохода в показатели полезности. Функция квадратного корня — простой пример такой шкалы, отображающей нерасположенность к риску, и мы применим ее здесь.
Когда вы несете полный риск получения 160 000 долларов или 40 000 долларов с вероятностью 1/2 в каждом случае, ваша ожидаемая полезность (взвешенное по вероятности среднее) составляет
Безрисковый доход, обеспечивающий вам такую же полезность, — это число, квадратный корень которого равен 300, то есть 90 000 долларов, что меньше вашего среднего денежного дохода в размере 100 000 долларов. Разность в 10 000 долларов — максимальная сумма денег, которую вы будете готовы заплатить в качестве цены за полное устранение риска, которому подвержен ваш доход. Ваш приятель подвержен аналогичному риску, поэтому при использовании той же шкалы полезности он также будет готов заплатить эту же максимальную сумму за его полное устранение.
Рассмотрим ситуацию, когда между вашими рисками существует совершенная отрицательная корреляция и сумма вашего совокупного дохода составляет 200 000 долларов независимо от обстоятельств. Вы делаете приятелю следующее предложение: я заплачу тебе 90 001 — 40 000 = 50 001 доллар в случае неудачного года, а ты мне 160 000 — 90 001 = 69 999 долларов, когда у тебя будет урожайный год. В результате ваш приятель получит доход в размере 90 001 доллар как в неудачном, так и удачном году (160 000 — 69 999 долларов в первом случае и 40 000 + 50 001 доллар во втором). Он предпочтет эту ситуацию перспективе столкнуться с риском. Когда ему сопутствует удача, а вам — нет, у вас есть 40 000 долларов собственного дохода и вы получаете еще 69 999 долларов от приятеля, то есть ваш доход в сумме равен 109 999 долларов. Когда вашего приятеля постигает неудача, а у вас все будет хорошо, у вас есть 160 000 собственного дохода и после выплаты приятелю 50 001 доллара остается 109 999 долларов. Кроме того, вы устраняете свой риск. В итоге вы с приятелем оба выигрываете от сделки, но вы оставили за собой почти весь выигрыш.
Безусловно, приятель мог бы сделать вам встречное предложение. Кроме того, еще существует целый диапазон промежуточных предложений, подразумевающих более справедливое распределение выигрышей от разделения рисков. Какое из них одержит верх? Как мы увидим в , весь диапазон взаимовыгодных исходов разделения риска согласуется с границей эффективности переговоров в переговорной игре между игроками.
Б. Плата за снижение риска
Теперь рассмотрим возможность продажи рисков за деньги. Предположим, вы фермер, столкнувшийся с тем же риском, что и в предыдущем примере, но теперь ваш приятель имеет гарантированный доход в размере 100 000 долларов. Ваш риск увеличился, а приятель вообще не несет никакого риска. Возможно, он согласится принять на себя часть вашего риска по цене, приемлемой для вас обоих. Мы только что видели, что 10 000 долларов — максимальный «страховой взнос», который вы готовы выплатить за полное устранение риска. Примет ли ваш приятель эту сумму в качестве платы за устранение вашего риска? По сути, он берет на себя свой безрисковый доход в размере 100 000 долларов плюс ваш рисковый доход, то есть 100 000 + 160 000 = 260 000 долларов, если вам будет сопутствовать удача, и 100 000 + 40 000 = 140 000 долларов, если вам не повезет. Приятель выплатит вам 90 000 долларов в любом из этих случаев; при этом у него останется либо 170 000 долларов, либо 50 000 долларов с равной вероятностью. Следовательно, ожидаемая полезность вашего приятеля равна
Если приятель не заключит с вами сделку, его ожидаемая полезность составит
а значит, сделка принесет ему немного больше выгоды. Диапазон взаимовыгодных сделок в данном случае очень узкий, поэтому исход почти предопределен, но если вы намерены продать весь свой риск, остается совсем малый диапазон возможных взаимовыгодных вариантов.
А как насчет частичной торговли риском? Предположим, вы заплатите приятелю сумму x, если вам будет сопутствовать удача, а он вам сумму y, если вам не повезет. Для того чтобы это привело к повышению ожидаемой полезности в случае каждого из вас, необходимо выполнить следующих два неравенства:
В качестве примера допустим, что y = 10 000. Тогда второе неравенство дает x > 10 526,67, а первое — x < 18 328,16. Первое значение x — минимальная плата, которую приятель потребует за готовность взять на себя ваш риск, а второе значение x — максимальная сумма, которую вы готовы заплатить ему за это. Таким образом, имеем довольно большой диапазон возможностей для взаимовыгодного обмена и торга.
А что если ваш приятель нейтрален к риску, то есть его интересуют только ожидаемые денежные показатели? Тогда, чтобы сделка стала для него приемлемой, она должна удовлетворять условию:
1/2 × (100 000 + x) + 1/2 × (100 000 − y) > 100 000,
или просто x > y. В такой ситуации возможно почти полное страхование от риска, при котором вы платите приятелю 60 001 доллар, если вам сопутствует удача, а он вам 59 999 долларов, если вам не повезет. Это и есть ситуация, в которой вы получаете весь выигрыш от торговли рисками.
Если на самом деле в роли вашего «приятеля» выступает страховая компания, она может быть почти нейтральной к риску, поскольку объединяет множество аналогичных рисков и принадлежит хорошо диверсифицированным инвесторам, для каждого из которых этот бизнес составляет всего лишь часть их общего риска. В таком случае вымышленный образ дружелюбного, нейтрального к риску, доброго фермера может стать реальностью. А если страховые компании конкурируют за страхование вашего бизнеса, страховой рынок может предложить вам почти полное страхование по цене, позволяющей вам оставить себе почти весь выигрыш.
Общей для всех этих договоренностей является идея, что заключение взаимовыгодных сделок возможно при условии, что тот, кто сталкивается с меньшим риском, снимает его часть с того, кто подвержен большему риску. На самом деле идея о существовании цены за риск и рынка риска лежит в основе почти всех финансовых механизмов в современной экономике. Акции и облигации, а также все сложные финансовые инструменты, такие как деривативы, — лишь способ распределения риска среди тех, кто готов его нести за минимальную цену. Многие считают, что такой рынок — в чистом виде азартная игра, и в каком-то смысле это так и есть. Однако те, кто стартует с минимального риска, соглашаются участвовать в подобных играх, возможно, потому, что уже обеспечили себе диверсификацию способом, о котором шла речь выше. А те, кто изначально наиболее подвержен риску, продают или избавляются от него. Это позволяет последним рисковать больше, чем в случае, если бы им приходилось нести весь риск на себе. Следовательно, финансовые рынки стимулируют предпринимательство, содействуя торговле рисками.
Итак, мы рассмотрели только разделение заданного общего риска. В реальной жизни существует возможность предпринять действия, направленные на уменьшение общего риска: фермер может защитить посевы от мороза, а владелец автомобиля — осторожнее им управлять, чтобы снизить риск аварии. Если такие действия не поддаются публичному наблюдению, это игра с несовершенной информацией, и возникает проблема морального риска, о которой говорилось выше: у хорошо застрахованных людей нет стимула снижать риск, с которым они сталкиваются. Мы рассмотрим подобные проблемы, а также механизмы их преодоления, в .
В. Манипулирование риском в соперничестве
Фермеры, о которых шла речь выше, столкнулись с риском из-за погодных условий, а не собственных действий или действий других фермеров. Если участники игры могут оказывать влияние на риск, которому подвержены они сами или другие игроки, то они могут использовать такое манипулирование риском стратегически. Наглядный пример — соперничество в области исследований и разработок между компаниями, стремящимися превзойти друг друга в разработке и выводе на рынок новых информационных технологий или биотехнологических продуктов; многим спортивным соревнованиям свойственны аналогичные характеристики.
В спорте и других типах соперничества такого рода исход игры зависит от комбинации мастерства и удачи. Вы одержите победу, если
ваше мастерство + ваша удача > мастерство соперника + удача соперника
или если
ваше удача − удача соперника > мастерство соперника — ваше мастерство.
Обозначим левую сторону последнего неравенства символом L; это ваш «избыток удачи». L — неопределенная величина; предположим, распределение ее вероятностей — это нормальная, или колоколобразная, кривая, показанная на рис. 8.2 в виде черной кривой. В любой точке на горизонтальной оси высота этой кривой представляет вероятность, с которой L принимает соответствующее значение. Следовательно, область под кривой между любыми двумя точками на горизонтальной оси равна вероятности того, что L лежит между этими двумя точками. Допустим, у вашего соперника уровень мастерства выше, а значит, вы более слабый игрок. Ваш «дефицит мастерства», эквивалентный разности между навыками соперника и вашими, имеет положительное значение, как показано в точке S. Вы одержите победу, если ваш избыток удачи L превосходит ваш дефицит мастерства S. Стало быть, область под кривой справа от точки S, заштрихованная на рис. 8.2, представляет вероятность вашей победы. Если привнести в ситуацию больше случайности, колоколобразная кривая станет более пологой (как серая кривая на рис. 8.2), поскольку вероятность относительно высоких и низких значений L повышается, тогда как вероятность средних значений снижается. В таком случае область под кривой справа от точки S также увеличивается. На рис. 8.2 область под исходной кривой нормального распределения заштрихована перекрестными линиями, а более крупная область под пологой кривой — однонаправленными. В качестве аутсайдера вы должны придерживаться стратегии, которая сглаживает эту кривую. И напротив, если вы фаворит, вам следует попытаться сократить элемент случайности в состязании.
Рис. 8.2. Влияние повышения риска на вероятность победы
Таким образом, мы должны воспринимать более слабых игроков или тех, кто отстал в длинной гонке, как людей, пытающихся применить неформатные или рискованные стратегии, поскольку это их единственный шанс наверстать упущенное или вырваться вперед. Напротив, игроки, имеющие максимальные шансы на успех или преимущество в игре, будут вести осторожную игру. Вот практический совет, основанный на этом принципе: если вы хотите бросить вызов тому, кто играет в теннис лучше вас, выберите для матча ветреный день.
Вы можете извлечь для себя выгоду из манипулирования не только величиной риска в вашей стратегии, но и корреляцией между рисками. Опережающий вас игрок попытается выбрать максимально высокую положительную корреляцию; тогда независимо от того, сопутствует ли ему самому удача или нет, удача его соперника останется неизменной и его преимущество в игре будет защищено. Напротив, отстающий игрок постарается найти риск, как можно меньше коррелирующий с риском соперника. Общеизвестно, что в гонке между двумя парусниками яхта, находящаяся позади, должна следовать по другому пути, чем яхта, которая вырвалась вперед и должна повторять все маневры отстающей.
2. Асимметричная информация: основные идеи
Во многих играх один или несколько игроков могут иметь преимущество за счет того, что они с большей определенностью знают, что произошло или произойдет. Такие преимущества, или асимметричность информации, присущи реальным стратегическим ситуациях. На самом базовом уровне каждый игрок может знать собственные предпочтения или выигрыши, скажем, терпимость к риску в игре «балансирование на грани», терпение в переговорах, а также мирные или воинственные намерения в международных отношениях. Однако при этом у него могут быть весьма расплывчатые представления о предпочтениях или выигрышах других игроков. То же касается и знания игроком своих характеристик (таких как уровень квалификации работника или склонность к риску у человека, подающего заявку на страхование автомобиля или медицинское страхование). Иногда действия, доступные одному игроку (например, вооружение и боеготовность страны), не в полной мере известны другим игрокам. И наконец, некоторые фактические результаты (фактический объем убытков, понесенных застрахованным домовладельцем в результате наводнения или землетрясения) может видеть один игрок, но не другие.
Манипулирование информацией о ваших способностях и предпочтениях, известной другим игрокам, позволяет влиять на равновесный исход игры. В результате такое манипулирование асимметричной информацией само по себе становится стратегической игрой. Возможно, вы считаете, что каждый игрок всегда стремится скрывать свою информацию и получать информацию от других игроков, но это не так. Ниже представлен список различных возможностей вместе с примерами. Более информированный игрок может предпринять следующие действия:
1. Скрыть или дать ложную информацию. При смешивании ходов в игре с нулевой суммой вы не хотите, чтобы другой игрок видел, что вы делаете. Так вы блефуете в покере, чтобы ввести в заблуждение других игроков относительно ваших карт.
2. Раскрыть часть правдивой информации. Когда вы предпринимаете стратегический ход, вам нужно, чтобы другие игроки видели, что именно вы сделали, и отреагировали соответствующим образом. Например, если вы оказались в напряженной ситуации, но у вас нет враждебных намерений, вам необходимо убедить других в их достоверности, чтобы не завязалась ненужная схватка.
В свою очередь менее информированный игрок может предпринять одно из следующих действий:
1. Получить необходимую информацию или отделить правду от лжи. Например, работодатель хочет определить уровень квалификации потенциального сотрудника или объем усилий, вкладываемых в работу наемным работником. Страховой компании необходимо знать категорию риска человека, подающего заявление о страховании, и объем убытков человека, подающего заявление о выплате страхового возмещения, а также информацию о любой небрежности страхователя, предполагающей возмещение доли его ответственности.
2. Оставаться в неведении. Незнание о стратегическом ходе соперника может оградить вас от его обязательств и угроз. Политики или руководители высшего уровня часто извлекают выгоду из такого «достоверного отрицания».
Обычно одних только слов для передачи достоверной информации бывает недостаточно: судят скорее по делам, чем по словам. Но даже действия не всегда эффективны, если любой игрок может без труда их выполнить. Тем не менее в целом менее информированным игрокам следует обращать внимание на действия более информированного игрока, а не на то, что он говорит. А более информированный игрок, в свою очередь, зная о том, что другие игроки будут интерпретировать его действия таким образом, должен попытаться манипулировать их информационным содержанием.
В ходе стратегической игры вы можете обнаружить, что владеете информацией, которой нет у других игроков. В вашем распоряжении может оказаться информация, «хорошая» именно для вас в том смысле, что, узнай о ней другие игроки, они изменили бы свои действия так, что это увеличило бы ваш выигрыш. Например, вам точно известно, что вы некурящий, поэтому вы должны претендовать на более низкие взносы по страхованию жизни. С другой стороны, у вас может быть «плохая» информация, раскрытие которой обусловило бы действия других игроков, способные вам навредить. Например, в колледже вы получали оценки обманным путем и не заслуживаете принятия на учебу в престижную юридическую школу. Вы знаете, что окружающие составят о вас мнение на основании ваших действий, и в связи с этим попытаетесь придумать и предпринять шаги, которые заставят их решить, что ваша информация заслуживает доверия. Такие действия называются сигналами, а стратегия их использования — сигнализированием. И наоборот, если окружающие посчитают, что ваша информация не заслуживает доверия, вы можете помешать им в этом утвердиться, попытавшись ввести их в заблуждение. Такие стратегии, обозначаемые термином «подавление сигнала», как правило, относятся к числу смешанных, поскольку случайный характер смешанных стратегий не позволяет делать точные логические выводы.
Если другие игроки знают больше вас или совершают действия, которые нельзя непосредственно наблюдать, вы можете использовать стратегии, которые сократят такое информационное отставание. Стратегия, вынуждающая другого игрока раскрыть свою информацию, называется скринингом, а конкретные методы, используемые с этой целью, — инструментами скрининга.
Поскольку личная информация игрока часто включает в себя знания о его способностях или предпочтениях, полезно думать об игроках, вступающих в игру с разной личной информацией, как об игроках различных типов. При наличии достоверного сигнализирования в равновесии игры менее информированные игроки смогут делать правильные выводы об информации, имеющейся у более информированных игроков, на основании их действий. Например, юридическая школа примет на учебу только абитуриентов, прошедших надлежащий отбор. Этот исход еще можно описать так: в равновесии разные типы игроков правильно раскрываются или разделяются, поэтому мы называем данную ситуацию разделяющим равновесием. Тем не менее иногда игроки одного или более типов могут успешно имитировать действия игроков других типов с тем, чтобы неинформированные игроки не могли определять различные типы игроков и идентифицировать их действия; например, страховые компании могут предлагать только одну разновидность страховых полисов. В таком случае мы говорим, что в равновесии типы объединяются, и называем его объединяющим равновесием. В процессе изучения игр с неполной информацией мы увидим, что идентификация типа равновесия, присутствующего в игре, имеет первостепенное значение.
3. Непосредственная коммуникация, или дешевый разговор
Обычно самый простой способ передать информацию другим — просто сообщить им ее. Точно так же самый простой способ получить информацию — попросить предоставить ее. Однако участники стратегической игры должны осознавать, что другие игроки не всегда говорят правду сами и не всегда поверят чьим-то утверждениям. То есть достоверность сказанных слов может быть поставлена под сомнение. Есть такое распространенное изречение: «слова стоят дешево»; непосредственная коммуникация действительно не требует прямых затрат, или они настолько незначительны, что их можно не принимать в расчет. Тем не менее она может косвенно повлиять на исходы игры и выигрыши игроков путем изменения убеждений одного игрока в отношении действий другого игрока или воздействия на выбор одного равновесия из множества равновесий. Непосредственную коммуникацию, не требующую прямых затрат, специалисты по теории игр называют «дешевым разговором», а равновесие, достигнутое в результате ее использования, обозначается термином «равновесие дешевого разговора».
А. Полностью совпадающие интересы
Прямая передача информации оправдывает себя в случаях, когда интересы игроков полностью совпадают. Игра в доверие, описанная в , — самый яркий пример данной ситуации. Таблица этой игры (см. ) воспроизведена на рис. 8.3.
Рис. 8.3. Игра в доверие
В этой игре интересы Гарри и Салли полностью совпадают: оба хотят встретиться и оба предпочитают сделать это в Local Latte. Проблема в том, что эта игра носит некооперативный характер: ее участники делают выбор независимо друг от друга, не зная о выборе другого игрока. Но давайте представим, что у Гарри появляется возможность отправить Салли сообщение (или Салли получает возможность задать вопрос, на который Гарри отвечает), прежде чем оба сделают выбор. Если сообщение Гарри «Я иду в Local Latte», у Салли нет оснований думать, что он лжет. И если Гарри считает, что Салли поверит ему, для него в равной мере оптимально выбрать Local Latte, сделав свое сообщение правдивым. Таким образом, непосредственная коммуникация позволяет быстро добиться предпочтительного для обоих игроков исхода. Именно этим объясняется тот факт, что при анализе данной игры в нам пришлось придумать сложный сценарий, при котором коммуникация была невозможна: вспомните, что Гарри и Салли до последней минуты перед встречей были на разных занятиях и у них не было мобильных телефонов.
Давайте более детально проанализируем исход игры в доверие при наличии непосредственного общения с точки зрения теории игр. Предположим, мы сконструировали двухэтапную игру. На первом этапе действует только Гарри, и это передача сообщения Салли. На втором этапе разыгрывается исходная игра с одновременными ходами. В полной двухэтапной игре происходит равновесие обратных рассуждений, в котором стратегии (исчерпывающие планы действий) заключаются в следующем. План действий обоих игроков на втором этапе таков: «Если сообщение Гарри на первом этапе “Я иду в Starbucks”, то выбрать Starbucks; если сообщение Гарри на первом этапе “Я иду в Local Latte”, выбрать Local Latte». (Помните, что в играх с последовательными ходами игроки должны использовать исчерпывающие планы действий.) Действие Гарри на первом этапе сводится к отправке сообщения: «Я иду в Local Latte». Подтвердить, что это и есть равновесие обратных рассуждений в данной двухэтапной игре, не составит труда, поэтому мы оставляем эту задачу вам.
Однако равновесие, в котором применим дешевый разговор, не единственное равновесие обратных рассуждений в данной игре. Рассмотрим следующие стратегии: план действий каждого игрока на втором этапе — пойти в Starbucks независимо от сообщения, отправленного Гарри на первом этапе, то есть оно может быть любым. Можно убедиться, что эта совокупность стратегий также представляет собой равновесие обратных рассуждений. Независимо от сообщения Гарри на первом этапе, если один игрок отправится в Starbucks, то для другого игрока будет оптимальным пойти туда же. Таким образом, в каждой из подыигр, которые могут возникнуть на втором этапе (по одной подыгре после каждого из двух сообщений Гарри), выбор Starbucks обоими игроками и есть равновесие Нэша в соответствующей подыгре. В таком случае на первом этапе Гарри будет безразлично, какое сообщение отправить, поскольку он знает, что оно будет проигнорировано.
Равновесие дешевого разговора (при котором сообщение Гарри не игнорируется) обеспечивает более высокие выигрыши, и мы могли бы предположить, что именно оно будет выбрано в качестве фокальной точки. Тем не менее наличие причин исторического или культурного характера может обусловить выбор другого равновесия. Например, по неким причинам, не имеющим никакого отношения к данной игре, у Гарри может быть репутация абсолютно ненадежного человека. Он может быть неисправимым шутником или просто невнимательным человеком. В таком случае люди могут не доверять его заявлениям, и Салли, зная, что это обычное положение вещей, не поверит сообщению Гарри.
Подобные проблемы присущи всем коммуникационным играм. В них всегда есть альтернативные равновесия, в которых коммуникация не принимается во внимание, а значит, не играет особой роли. Специалисты по теории игр называют их равновесиями пустого разговора. Однако мы ограничимся лишь упоминанием о них и сосредоточимся на равновесиях дешевого разговора, в которых коммуникация действительно влечет за собой определенные последствия.
Б. Полностью противоположные интересы
Достоверность непосредственной коммуникации зависит от степени согласованности интересов игроков. В качестве разительного контраста с игрой в доверие рассмотрим игру, в которой интересы игроков диаметрально противоположны, а именно игру с нулевой суммой. Яркий пример такой игры — розыгрыш очка в теннисе на ; мы воспроизводим ее таблицу выигрышей на рис. 8.4. Помните, что в качестве выигрышей выступает процент успешных ударов Эверт. Не забывайте также, что в этой игре есть только равновесие Нэша в смешанных стратегиях (полученное в ); ожидаемый выигрыш Эверт в нем равен 62.
Рис. 8.4. Игра в розыгрыш очка в теннисе
Теперь представим, что мы построили двухэтапную игру. На первом этапе Эверт предоставляется возможность отправить сообщение Навратиловой. На втором этапе разыгрывается игра с одновременными ходами (рис. 8.4). Каким будет равновесие обратных рассуждений?
Вполне очевидно, что Навратилова не поверит ни одному сообщению, полученному от Эверт. Например, если сообщение Эверт — «Я намерена сыграть ПЛ» и Навратилова ей поверит, то Навратиловой следует выбрать стратегию «прикрывать ПЛ». Однако если Эверт придет к выводу, что Навратилова будет прикрывать ПЛ, то ей лучше применить стратегию ПД. На следующем уровне рассуждений Навратилова должна предвидеть это и не поверить в заявление Эверт о выборе ПЛ.
Но здесь есть еще кое-что. Навратилова также не должна полагать, что Эверт поступит наоборот. Предположим, сообщение Эверт: «Я намерена сыграть ПЛ», и Навратилова думает: «Она просто пытается меня обмануть, поэтому я буду исходить из того, что она выберет ПД». В результате Навратилова выбирает «прикрывать ПД». Однако если Эверт считает, что Навратилова усомнится в ее сообщении, она все же применит стратегию ПЛ. Навратилова должна предусмотреть и такой вариант развития событий.
Стало быть, недоверие Навратиловой должно означать абсолютное игнорирование сообщения Эверт. В таком случае в этой двухэтапной игре будет только равновесие пустого разговора. Действия двух ее участниц на втором этапе будут представлять собой равновесие в исходной игре, а сообщение Эверт на первом этапе может быть любым. Это характерно для всех игр с нулевой суммой.
В. Частично совпадающие интересы
А как насчет общих игр, где есть смешение конфликта и общих интересов? Заслуживает ли в них доверия непосредственная коммуникация, зависит от того, как смешиваются конфликт и сотрудничество при частичном совпадении интересов игроков. Таким образом, в подобных играх следует ожидать наличия как равновесия дешевого разговора, так и равновесия пустого разговора. В общем случае, чем больше совпадают интересы, тем больше информации должно быть доступно для передачи. Мы проиллюстрируем этот интуитивный вывод на следующем примере.
Рассмотрим ситуацию, с которой вы уже, возможно, сталкивались, а если нет, то это обязательно произойдет, как только вы начнете зарабатывать и инвестировать деньги. Когда финансовый консультант советует вам сделать инвестицию, он может предложить вам формирование долгосрочных отношений для получения стабильных комиссионных либо он может оказаться мошенником, который навяжет вам свой вариант инвестиций, заберет авансовые комиссионные и исчезнет. Достоверность его рекомендаций зависит от того, отношения какого типа вы с ним установите.
Предположим, вы намерены инвестировать 100 000 долларов в актив, рекомендованный консультантом, и предвидите три возможных исхода. Актив может оказаться плохим объектом для инвестиций (П), что приведет к убыткам в размере 50 %, то есть получению выигрыша −50, выраженного в тысячах долларов. Актив может оказаться средним объектом для инвестиций (С) и обеспечит рентабельность инвестиций в размере 1 %, или выигрыш 1. И наконец, он может стать хорошим объектом для инвестиций (Х), обеспечивающим рентабельность 55 %, или выигрыш 55. Решив инвестировать, вы авансом платите консультанту комиссионные в размере 2 % независимо от эффективности инвестиций, что дает ему выигрыш 2 и одновременно снижает ваш выигрыш на 2. Кроме того, консультант заработает 20 % от прибыли, которую вы получите, и у вас останется выигрыш в размере 80 % от прибыли, но при этом консультант не разделит с вами убытков.
Без специальных знаний о рекомендуемом активе вы не можете оценить вероятность какого-то из этих трех исходов. Поэтому вы просто полагаете, что все три варианта (П, С и Х) в равной степени возможны: каждый может наступить с вероятностью 1/3. В такой ситуации при отсутствии дополнительной информации вы рассчитываете свой ожидаемый выигрыш от инвестирования в рекомендуемый актив следующим образом:
[(1/3 × –50) + (1/3 × 0,8 × 1) + (1/3 × 0,8 × 55)] — 2 = [1/3 × (–50 + 0,8 + 44)] — 2 = [1/3 × (— 5,2)] — 2 = –1,73 — 2 = –3,73.
Согласно этому расчету, ожидаемый убыток составит 3 730 долларов. Следовательно, вы не станете вкладываться в этот актив, а ваш консультант не получит никаких комиссионных. Аналогичные вычисления показывают, что с учетом отрицательного ожидаемого выигрыша вы бы не инвестировали и в случае, если бы были убеждены, что рекомендуемый актив однозначно относится к типам П и С или представляет собой их любую взвешенную по вероятности комбинацию.
У вашего консультанта складывается иная ситуация. Он проанализировал соответствующий инвестиционный актив и точно знает, какой из трех сценариев (П, С или Х) соответствует истине. Нам необходимо определить, что он будет делать с этой информацией, в частности поделится ли ею с вами. Ниже мы рассмотрим разные возможности, исходя из предположения, что вы будете обновлять свои убеждения в отношении типа актива на основании полученной от консультанта информации. В данном примере просто условимся, что вы верите сказанному и присваиваете вероятность 1 тому, что актив относится к типу, указанному вашим консультантом.
I. Краткосрочные отношения. Если консультант говорит вам, что рекомендуемый актив относится к типу П, вы решаете не инвестировать. Почему? Потому что ваш ожидаемый выигрыш при этом составит −50; кроме того, данная инвестиция обойдется в 2 дополнительные единицы (комиссионные консультанту), то есть ваш окончательный выигрыш будет −52. Аналогично, если консультант вам сообщит, что актив относится к типу С, вы тоже не станете инвестировать. В этом случае ваш ожидаемый выигрыш составит 80 % от прибыли в размере 1 минус 2 на выплату комиссионных, то есть в сумме −1,2. Вы согласитесь только в случае, если консультант скажет, что актив относится к типу Х. Тогда ваш ожидаемый выигрыш будет 80 % от прибыли в размере 55 минус 2 на выплату комиссионных, или 42.
Что при этом сделает ваш консультант со своими знаниями? Если правда — Х, он захочет сказать вам об этом, чтобы убедить инвестировать в данный актив. Но если консультант не видит перспективы ваших долгосрочных отношений, он может заявить вам, что правда — это Х, даже если на самом деле актив относится к типу С или П и он об этом знает. Если вы решите инвестировать на основании слов консультанта, он просто положит в карман 2 % комиссионных и исчезнет ввиду отсутствия необходимости поддерживать с вами контакт. Зная о существовании вероятности получить плохой совет или ложную информацию от консультанта, с которым вы сталкиваетесь всего один раз, вы должны полностью игнорировать его рекомендацию. Следовательно, в этой игре с асимметричной информацией и краткосрочными отношениями достоверная коммуникация невозможна. Единственное равновесие, присутствующее здесь, — это равновесие пустого разговора; равновесия дешевого разговора в данном случае нет.
II. Долгосрочные отношения: полное раскрытие информации. Теперь представим, что ваш консультант работает на компанию, через которую вы делаете инвестиции уже много лет: потеря будущего бизнеса с вами может стоить ему работы. Если вы инвестируете в актив, рекомендуемый консультантом, вы сможете сравнить фактическую эффективность этих инвестиций с его прогнозом. Он может оказаться ошибочным отчасти (прогноз был С, а на самом деле П или был Х, а на самом деле С) или полностью (прогноз был Х, а на самом деле П). Если вы обнаружите такое искажение информации, ваш финансовый консультант и его компания не только потеряют вас как клиента, но и рискуют потерять других клиентов, если вы расскажете друзьям и знакомым о подобных махинациях. Если ваш консультант связывает потерю репутации с определенными издержками, ваши возможные убытки косвенным образом касаются и его, а значит, его интересы частично совпадают с вашими. Предположим, незначительное искажение информации обойдется консультанту в 2 единицы выигрыша (денежный эквивалент — 2000 долларов убытка), а серьезное искажение — в 4 единицы (убыток в размере 4000 долларов). Теперь можем определить, достаточно ли частичного совпадения ваших с консультантом интересов для того, чтобы заставить его говорить правду.
Как отмечалось выше, консультант скажет вам правду, чтобы побудить вас инвестировать в определенный актив, если последний относится к типу Х. Нам необходимо проанализировать мотивы консультанта, когда актив относится не к типу Х, а к типу П или С. Сперва допустим, что актив относится к типу П. Если ваш консультант раскроет правду о типе актива, вы не станете инвестировать и он лишится комиссионных, но при этом не понесет никаких репутационных издержек: его выигрыш от описания актива как П в случае, если он действительно относится к типу П, равен 0. Если консультант вам сообщит, что актив относится к типу С (хотя на самом деле это П), вы все равно откажетесь инвестировать, поскольку ваш выигрыш составил бы −1,2, как мы подсчитали выше. В этом случае консультант тоже получит выигрыш 0, поэтому у него нет причин вам лгать о типе актива. Но что если консультант скажет, будто актив принадлежит к типу Х? Если вы поверите ему и вложите деньги, он получит авансовые комиссионные в размере двух процентов, но при этом понесет репутационные издержки 4 в связи с серьезной ошибкой. Если консультант скажет, что актив относится к типу Х, тогда как на самом деле это тип П, он получит отрицательный ожидаемый выигрыш. Иными словами, вашему консультанту выгоднее честно признаться, что актив относится к типу П.
Но что если на самом деле актив относится к типу С? Правдивое раскрытие информации не убедит вас в целесообразности инвестиций, и выигрыш консультанта составит 0. Если консультант скажет вам, что актив относится к типу Х и вы поверите ему, то вашим решением будет инвестировать. Консультант получит комиссионные в размере 2, 20 процентов от прибыли 1, которую обеспечит вам актив типа С, но при этом понесет репутационные издержки 2 в связи с частичным искажением информации. Следовательно, его выигрыш составит 2 + (0,2 × 1) — 2 = 0,2 > 0. Таким образом, консультант все же извлечет выгоду из ложного сообщения о типе актива Х, если на самом деле это С. Зная об этом, вы не поверите никаким утверждениям консультанта о том, что данный актив относится к типу Х.
Поскольку у вашего консультанта есть стимул солгать, когда рекомендуемый им актив относится к типу С, в такой ситуации достоверное раскрытие всей информации невозможно. Равновесие пустого разговора, при котором игнорируется любое сообщение консультанта, — по-прежнему одно из возможных. Однако является ли оно здесь единственным или частичная коммуникация все же реальна? Невозможность полного раскрытия информации обусловлена тем, что консультант может неправильно заявить, что актив принадлежит к типу Х, хотя на самом деле к С, поэтому объединим эти две возможности в одно событие и обозначим его как «не-П». Тогда консультант спрашивает себя, что именно ему следует вам сообщить, П или «не-П». Теперь можем проанализировать, решит ли консультант сказать вам правду в условиях такой частичной коммуникации.
III. Долгосрочные отношения: частичное раскрытие информации. Чтобы определить мотивы вашего консультанта в ситуации «П или не-П», необходимо понять, какие выводы вы сделаете (то есть какую апостериорную вероятность вычислите) из сообщения «не-П», если вы ему поверите. Ваше предыдущее (первоначальное) убеждение состояло в том, что варианты П, С и Х в равной степени вероятны, то есть вероятность каждого из них составляет 1/3. Если консультант скажет «не-П», у вас останется два объекта для инвестиций — С и Х. Первоначально вы рассматривали их как равновероятные, и у вас нет оснований менять это предположение, поэтому теперь вы присваиваете каждому из них вероятность 1/2. Это ваша новая, апостериорная вероятность, зависящая от информации, предоставленной консультантом. С ее учетом ваш ожидаемый выигрыш при решении инвестировать после получения от консультанта сообщения «не-П» составит [1/2 × (0,8 × 1)] + [1/2 × (0,8 × 55)] — 2 = 0,4 + 22 — 2 = 20,4 > 0. Этого положительного ожидаемого выигрыша достаточно, чтобы побудить вас инвестировать.
Знание о том, что вы будете инвестировать в случае «не-П», позволяет определить, будет ли у вашего консультанта стимул солгать. Захочет ли он сказать «не-П», даже если правда П? Когда актив действительно принадлежит к типу П и консультант говорит правду (сообщает тип П), его выигрыш равен 0, как мы и вычислили выше. Если же вместо этого консультант сообщает «не-П» и вы верите ему, он получит 2 в качестве комиссионных и понесет репутационные издержки в связи с искажением информации. Поскольку вы исходите из того, что С и Х в равной степени вероятны в случае сообщения «не-П», ожидаемое значение репутационных издержек при этом составит 1/2 от издержек 4 вследствие серьезного искажения информации. Таким образом, ожидаемое значение репутационных издержек равно (1/2 × 2) + (1/2 × 4) = 3. Чистый выигрыш вашего консультанта от сообщения вам типа актива «не-П», тогда как на самом деле это П, составляет 2–3 = −1. Следовательно, предоставив вам ложную информацию, он ничего не выиграет. Сказать правду — его лучшая стратегия в данной ситуации, поэтому здесь возможно равновесие дешевого разговора с частичным раскрытием информации.
Концепцию равновесия дешевого разговора с частичным раскрытием информации можно уточнить с помощью концепции разбиения. Напомним, что вы предвидите три возможных сценария, или события, — П, С и Х. Это множество событий можно разделить, или разбить, на отдельные подмножества, и тогда ваш консультант сообщит вам о подмножестве, содержащем правду. (Разумеется, правдивость его сообщения предстоит проанализировать.) В данном случае мы имеем ситуацию с разбиением на два подмножества: одно, состоящее лишь из П, и второе, включающее пару событий {С, Х}. В равновесии с частичным раскрытием информации эти подмножества можно отличить друг от друга на основании сообщения консультанта, однако провести между С и Х более тонкое различие, которое бы привело к максимально точному разбиению на три подмножества, каждое из которых состояло бы из одного элемента, нельзя. Это было бы возможно только при наличии равновесия с полным раскрытием информации.
Мы намеренно сказали ранее о том, что равновесие дешевого разговора с достоверным частичным раскрытием информации возможно. Данная игра относится к категории игр со множеством равновесий, потому что в ней вероятно и равновесие пустого разговора. Конфигурация стратегий и убеждений, при которой вы игнорируете сообщение консультанта, а он отправляет одно и то же сообщение (или даже произвольное сообщение) независимо от того, что соответствует истине, и есть равновесие. С учетом стратегий каждого игрока, у другого игрока нет оснований менять свои действия или убеждения. В терминах разбиений такое равновесие пустого разговора можно считать равновесием с самым грубым, тривиальным разбиением с одним (под)множеством {П, С, Х}, включающим все три варианта. В общем случае всякий раз, когда в игре с дешевым разговором вы находите равновесие, не являющееся равновесием пустого разговора, там будет как минимум еще одно равновесие с более грубым разбиением исходов.
IV. Множество равновесий. В качестве примера ситуации, в которой более грубые варианты разбиения связаны с дополнительными равновесиями, рассмотрим случай, когда репутационные издержки консультанта выше, чем предполагалось ранее. Пусть они равны 4 (вместо 2) в случае мелкого искажения истины и 8 (вместо 4) при крупном искажении. Согласно выполненному нами анализу, ваш консультант сообщит о типе Х, если актив действительно относится к типу Х, и о типе П, если актив относится к типу П. Эти результаты сохраняются. Консультант хочет, чтобы вы инвестировали в актив типа Х; кроме того, он по-прежнему получает тот же выигрыш от сообщения о типе П, если актив действительно относится к типу П, так же как и в случае сообщения о типе С в той же ситуации. При более высоких репутационных издержках у консультанта еще меньше мотивов лгать вам о том, что рекомендуемый им актив относится к типу Х, тогда как на самом деле это тип П. Таким образом, если актив имеет тип П или Х, можно рассчитывать, что консультант скажет правду.
Проблема с полным раскрытием информации в предыдущем примере возникла только из-за наличия у консультанта стимула солгать в случае, когда актив относится к типу С. Судя по вычисленным нами показателям, выигрыш консультанта от предоставления информации о типе Х, тогда как на самом деле это тип С, был выше, чем при обнародовании правдивой информации. Сохранится ли такое положение вещей и в ситуации с более высокими репутационными издержками?
Предположим, актив относится к типу С, а консультант сообщает о типе Х. Если вы поверите ему и инвестируете в этот актив, ожидаемый выигрыш консультанта составит 2 (комиссионные) + 0,2 × 1 (его доля в фактической прибыли на инвестиции в актив типа С) — 4 (его репутационные издержки) = −1,8 < 0. Правда принесет консультанту выигрыш 0. У него больше нет мотивов завышать качество инвестиционного актива. Исход, при котором консультант всегда говорит правду, а вы верите ему и предпринимаете соответствующее действие, и есть равновесие дешевого разговора с полным раскрытием информации. В нем возможно самое мелкое разбиение на подмножества, состоящие из одного элемента, — {П}, {С} и {Х}.
В данном случае существуют еще три равновесия, каждое с более грубым разбиением, чем при равновесии с полным раскрытием информации. Обе ситуации с двумя подмножествами (одна с подмножествами {П, С} и {Х}, а другая — {П} и {С, Х}), а также ситуация с пустым разговором с одним подмножеством {П, С, Х}, — это альтернативные равновесия, которые возможны в данной игре. Какое из них получит приоритет, зависит от условий, рассмотренных в во время анализа игры со множеством равновесий.
Самая большая реальная трудность, связанная с получением равновесия с достоверной передачей информации, не являющегося равновесием пустого разговора, состоит в знании игроками степени совпадения их интересов, причем это должно быть их общим знанием. В примере с инвестициями для вас крайне важно на основании предыдущего опыта взаимодействия с консультантом или из других источников (таких как контракт) знать, что в целях сохранения репутации он лично заинтересован в благоприятном исходе вашего инвестирования. Если бы вы не знали, в какой степени интересы консультанта совпадают с вашими, у вас были бы все основания подозревать, что он привирает, чтобы склонить вас к инвестициям ради комиссионных, которые он незамедлительно получит.
Что происходит в случае более информативных сообщений? Предположим, консультант может сообщить вам показатель g, представляющий собой его оценку темпов роста курса акций, и уточнить, что g может принимать диапазон непрерывных значений. В этой ситуации, если консультант получит дополнительную выгоду от покупки вами плохих акций по его рекомендации, у него есть стимул завысить значение g. В результате абсолютно точная и правдивая коммуникация больше невозможна. Однако равновесие дешевого разговора с частичным раскрытием информации все же вероятно. Непрерывный диапазон значений темпов роста курса акций можно разделить на интервалы (скажем, от 0 до 1 %, от 1 до 2 % и т. д) так, чтобы консультант посчитал оптимальным сказать вам правду о том, в какой из этих интервалов на самом деле попадает показатель темпов роста курса акций, а вы сочли бы нужным прислушаться к его совету и предпринять на его основании оптимальное действие. Чем выше ценит консультант свою репутацию, тем мельче будет разбиение диапазона значений g — например, это может быть половина процента вместо целого или четверть процента вместо половины. Дальнейшее объяснение этой темы можно найти в работах, в которых она рассматривается более углубленно.
Г. Формальный анализ игр с дешевым разговором
До сих пор наш анализ игр с дешевым разговором носил эвристический и вербальный характер. Такого подхода обычно достаточно для понимания и прогнозирования поведения, но в подобных играх существуют и при необходимости могут быть использованы формальные методы описания и решения игр — деревья и матрицы игры. Для того чтобы показать, как это делается, и связать игры, представленные в данной главе, с теорией, изложенной в предыдущих главах, проанализируем игру между вами и вашим финансовым консультантом в этом контексте. В рамках анализа будем исходить из предположения, что ваш консультант проводит различие между тремя возможными вариантами П, С и Х, сообщая вам информацию о рекомендуемом активе; иными словами, рассмотрим ее самое мелкое разбиение. Прочитав этот раздел, вы сможете выполнить аналогичный анализ для случая, когда в сообщении консультанта присутствует более грубое разбиение информации об активе на типы П или «не-П».
Начнем с построения дерева игры, представленного на рис. 8.5. Условный игрок «природа», о котором шла речь в , ходит первым, создавая один из трех вариантов доходности ваших инвестиций, а именно П, С и Х, с вероятностью 1/3 каждый. Ваш консультат наблюдает за действиями «природы» и делает свой ход, а именно сообщает вам о трех вариантах доходности инвестиций, в качестве которых снова могут выступать варианты П, С и Х. Мы сразу же немного упростим дерево игры, отметив, что у консультанта нет никаких мотивов занижать рентабельность инвестиций: он никогда не станет сообщать о типе П, если правда — С или Х, или о типе С, если на самом деле это Х. (Эти действия можно было бы оставить в дереве, но они его слишком усложнят. Применение одного шага обратных рассуждений показывает, что ни одно из этих действий не является оптимальным для консультанта, а значит, ни одно из них не может быть частью равновесия.)
Рис. 8.5. Дерево игры с дешевым разговором между финансовым консультантом и инвестором
И наконец, вы ходите третьим и должны выбрать, инвестировать (И) или не инвестировать (Н). Однако вы не можете наблюдать за действиями «природы» непосредственно и знаете о них только со слов консультанта. Следовательно, для вас оба узла, в которых он сообщает о типе С, объединены в одно информационное множество, тогда как все три узла, в которых он сообщает тип Х, собраны в другое информационное множество (на рис. 8.5 оба информационных множества выделены пунктирными овалами). Наличие информационных множеств говорит о том, что вы ограничены в своих действиях. В том информационном множестве, где консультант сообщает тип С, вы должны сделать один и тот же выбор в отношении инвестиций в обоих узлах множества, то есть выбрать либо И, либо Н в обоих узлах, поскольку не можете провести различия между этими узлами в составе данного информационного множества, с тем чтобы выбрать И в одном узле и Н в другом. Точно так же вы должны выбрать либо И, либо Н во всех трех узлах информационного множества, в котором консультант сообщает тип Х.
В каждом концевом узле выигрыш консультанта показан первым, а ваш — вторым. Выигрыши, которые исчисляются в тысячах долларов, отражают те же числовые значения, что и в выполненном выше эвристическом анализе. Вы выплачиваете консультанту комиссионные 2 % от инвестиции в размере 100 000 долларов, и ваша прибыль составляет −50, если вы инвестируете в актив типа П, 1 при инвестициях в актив типа С, и 55 — в актив типа Х. Консультант получает 20 % от любой прибыли, которую вы заработаете благодаря его рекомендации. Единственное отличие данной модели от предыдущей: мы не приводим здесь точного значения репутационных издержек консультанта в случае искажения информации, а вместо этого используем символ М для обозначения репутационных издержек при незначительном искажении информации и символ Б — при значительном искажения информации. Для того чтобы привести эти параметры в соответствие с нашим анализом, мы исходим из предположения, что оба имеют положительное значение, а также что М < Б. Этот подход позволяет проанализировать оба уровня репутационных соображений, о которых шла речь выше.
В качестве примера того, как вычисляется каждая пара выигрышей, рассмотрим узел, в котором «природа» создала актив типа С, консультант сообщил о типе Х, а вы выбрали И (на этот узел обозначен символом i). При таком раскладе ваш выигрыш составляет 80 % от прибыли 1 на ваши инвестиции, из которого исключаются авансовые комиссионные 2, выплаченные консультанту, что в итоге равно 0,8–2 = −1,2. Консультант получает комиссионные 2 и свою долю 20 % от прибыли на инвестиции в данный актив (0,2), но при этом несет репутационные издержки М, а значит, его общий выигрыш будет 2,2 — М. Мы предоставляем вам возможность самостоятельно убедиться в том, что все остальные выигрыши, отображенные на данном дереве игры, вычислены правильно.
С помощью дерева игры на мы можем построить для нее таблицу выигрышей. Строго говоря, она должна включать в себя все стратегии, доступные вам и вашему консультанту. Однако, как и при построении дерева игры, мы можем исключить из рассмотрения некоторые стратегии, прежде чем вносить их в таблицу; в частности, удалим все явно плохие стратегии. Это позволит построить гораздо меньшую, а значит, и куда более удобную таблицу по сравнению с той, в которую были бы включены все возможные стратегии.
Какие стратегии мы можем исключить из рассмотрения в качестве равновесных? Ответ на этот вопрос включает два аспекта. Во-первых, мы можем игнорировать стратегии, которые однозначно не будут использованы. Во время построения дерева игры мы уже удалили некоторые из них для консультанта (например, стратегию «сообщать тип П, если истинный тип актива Х»). Теперь мы можем видеть, что у вас также есть несколько вариантов, подлежащих исключению. Например, стратегия «выбрать И, если консультант сообщает тип П» в концевом узле доминируема стратегией «выбрать Н, если консультант сообщает тип П», поэтому мы исключаем ее из рассмотрения. Точно так же в рамках информационного множества «сообщить тип С» ваша стратегия «выбрать И, если консультант сообщает тип С» доминируема стратегией «выбрать Н, если консультант сообщает тип С»; это худший выбор в обоих концевых узлах (c и g) и поэтому тоже может быть проигнорирован. Во-вторых, мы можем исключить все стратегии, не оказывающие никакого влияния на поиск равновесий дешевого разговора. Например, для консультанта обе стратегии «сообщить тип П» и «сообщить тип С» приводят к выбору вами стратегии Н, поэтому мы исключаем обе. Помимо концевых узлов, которые мы уже удалили на (a, c и g), мы можем удалить также узлы b, d и h.
После такой процедуры упрощения у нас остается всего шесть концевых узлов (e, f, i, j, k и l), соответствующих стратегиям, в случае которых консультант сообщает, что актив относится к типу Х, а вы в ответ выбираете стратегию согласно полученной информации. Если конкретно, в распоряжении консультанта осталось три интересные стратегии («всегда сообщать тип Х независимо от того, каков истинный тип актива — П, С или Х», «сообщать тип Х только в случае, если истинный тип актива С или Х» и «сообщать Х только в случае, если и только если истинный тип актива Х»), а в вашем — две («выбрать И, если консультант сообщает тип Х» и «выбрать Н, если консультант сообщает тип Х»). Эти пять стратегий позволяют построить таблицу выигрышей три на два, представленную на рис. 8.6.
Рис. 8.6. Таблица выигрышей игры с дешевым разговором
Выигрыши по каждой комбинации стратегий на рис. 8.6 — это ожидаемые выигрыши, вычисленные с помощью значений в концевых узлах дерева (которых можно достичь при данной комбинации стратегий), взвешенных по соответствующим вероятностям. В качестве примера рассмотрим верхнюю левую ячейку таблицы, в которой консультант сообщает о том, что актив относится к типу Х независимо от его истинного типа. Эта комбинация стратегий приводит к концевым узлам e, i и k, каждый с вероятностью 1/3. Следовательно, ожидаемый выигрыш консультанта в этой ячейке составляет {[1/3 × (2 — Б)] + [1/3 × (2,2 — М)] + (1/3 × 13)} = 1/3 × (17, 2 — Б — М). Точно так же ваш ожидаемый выигрыш в той же ячейке равен [(1/3 × –52) + (1/3 × –1,2) + (1/3 × 42)] = 1/3 × (–11,2). Мы снова предоставляем вам возможность самостоятельно убедиться в том, что оставшиеся ожидаемые выигрыши рассчитаны правильно.
Теперь, имея полную таблицу выигрышей, мы можем использовать представленные в методы для поиска равновесия с оговоркой, что значения М и Б в нашем анализе играют определенную роль. Простой анализ наилучших ответов показывает, что ваш наилучший ответ на стратегию консультанта «всегда Х» — «Н, если Х», а на две его другие стратегии — «И, если Х». Аналогичным образом, наилучшим ответом консультанта на вашу стратегию «Н, если Х» может быть любая из его трех стратегий. Таким образом, мы имеем первый результат: верхняя правая ячейка — это всегда равновесие Нэша. Если консультант сообщает, что актив относится к типу Х, каким бы ни был его истинный тип (или, если уж на то пошло, отправляет любое сообщение, но только одно и то же во всех трех сценариях), вам лучше выбрать Н, а если вы выбираете Н, у консультанта нет причин отклоняться от своего выбора. Это и есть равновесие пустого разговора при полном отсутствии обмена информацией, с которым мы уже сталкивались выше.
Далее рассмотрим наилучший ответ консультанта на ваш выбор стратегии «И, если Х». Единственно возможные равновесия возникают, когда он применяет стратегию «Х, только если С или Х» или «Х, если и только если Х». Однако какой именно из двух вариантов он выберет (или не выберет ни одного их них), зависит от конкретных значений Б и М. Для того чтобы пара стратегий {«Х, только если С или Х», «И, если Х»} была равновесием Нэша, должны выполняться следующие условия: 15,2 — М > 17,2 — Б — М и 15, 2 — М > 13. Первое выражение верно, если Б > 2, второе — если М < 2,2. Таким образом, если значения Б и М удовлетворяют этим условиям, средняя левая ячейка будет равновесием дешевого разговора (по Нэшу). В этом равновесии сообщение консультанта о типе актива Х не позволяет вам определить, каков истинный тип, С или Х, но вы точно знаете, что это не П. Располагая такой информацией, вы можете быть уверены, что ваш ожидаемый выигрыш будет положительным, и решаете инвестировать. В этой ситуации Х действительно означает «не-П», а равновесный исход формально эквивалентен равновесию с частичным раскрытием информации, о котором мы говорили выше.
Мы можем также проверить выполнение условий, при которых пара стратегий {«Х, если и только если Х», «И, если Х»} — это равновесие Нэша. Такой исход требует, чтобы 13 > 17,2 — Б — М и 13 > 15, 2 — М. Проанализировать эти выражения не так легко, как представленные выше. Однако следует отметить, что второе выражение требует, чтобы М > 2,2, а также что мы предположили, что Б > М; следовательно, условие Б > 2,2 должно выполняться при выполнении условия М > 2,2. Теперь можете использовать эти условия для проверки выполнения первого выражения. Возьмите минимальное значение Б и М, равное 2,2, и подставьте его в выражение 13 > 17,2 — Б — М, в результате получите 13 > 12,8, что, безусловно, верно. Эти расчеты указывают на то, что нижняя левая ячейка — это равновесие дешевого разговора, когда М > 2,2, при условии, что Б > М. Это и есть равновесие с полным раскрытием информации, которое мы нашли в конце предыдущего анализа.
В каждом из описанных случаев наряду с равновесиями {«Х, только если С или Х», «И, если Х»} и {«Х, если и только если Х», «И, если Х»} существует равновесие пустого разговора. Обратите внимание, что мы получим только равновесие пустого разговора в случае низких репутационных издержек консультанта (Б < 2 и М < Б), что согласуется со сформулированными ранее интуитивными выводами. И наконец, если мы ограничим язык передаваемых сообщений более грубым разбиением на П и «не-П», то продолжение представленного здесь анализа покажет, что множество стратегий {«не-П, если С или Х», «И, если не-П»} также будет равновесием Нэша в данной игре.
В каждом случае наш формальный анализ подтверждает аргументы, приведенные в . Некоторые из вас могут посчитать вербальный подход достаточным для большинства, если не для всех своих потребностей. Другие отдадут предпочтение более формальной модели, представленной в данном разделе. Однако вы должны осознавать, что деревья и таблицы имеют свои ограничения: как только ваша модель станет достаточно сложной (например, будет включать в себя непрерывный диапазон вариантов сообщений), вам придется практически полностью положиться на математику для поиска равновесий. Способность решать модели с асимметричной информацией в различных формах (вербально, посредством деревьев и таблиц или с помощью алгебры или исчисления) — очень важный навык. Ниже мы приведем дополнительные примеры таких игр; при этом одни из них будут решены путем сочетания интуиции и алгебры, а другие — с помощью дерева игры и таблицы выигрышей. Во всех случаях один метод решения не исключает другой, поэтому вы можете попробовать самостоятельно применить альтернативные варианты решения.
4. Неблагоприятный отбор, сигнализирование и скрининг
А. Неблагоприятный отбор и несостоятельность рынка
Во многих играх один из участников знает об исходе игры нечто такое, что неизвестно другим. Работодатель знает о квалификации потенциального сотрудника гораздо меньше, чем сам сотрудник; еще труднее отслеживать более неопределенные, но важные качества сотрудника, такие как отношение к работе и умение работать в коллективе. Страховой компании гораздо меньше известно о состоянии здоровья или навыках вождения человека, подающего заявку на оформление медицинской страховки или автострахования, чем самому страхователю. Продавец подержанного автомобиля многое о нем знает благодаря длительной эксплуатации, а потенциальный покупатель может в лучшем случае получить минимум информации в ходе осмотра авто.
В таких ситуациях непосредственная коммуникация не обеспечивает достоверной передачи информации. Неквалифицированные работники заявляют о наличии определенных навыков, чтобы получить более высокооплачиваемую должность; люди, которые относятся к категории повышенного риска, утверждают, что у них крепкое здоровье или хорошие навыки вождения, чтобы выплачивать более низкие страховые взносы; владельцы плохих автомобилей утверждают, что их автомобили работают прекрасно и за долгие годы не создавали никаких проблем. Другие стороны подобных сделок знают о наличии стимулов к искажению истины и не доверяют информации, передаваемой на словах. Следовательно, в этих играх нет условий для формирования равновесия дешевого разговора, о котором шла речь в .
Но что происходит, если менее информированные стороны таких сделок вообще не имеют возможности получить соответствующую информацию? Другими словами, выражаясь в терминах, введенных в , в их распоряжении нет ни достоверных инструментов скрининга, ни сигналов. Если страховая компания предлагает страховой полис, который обходится в 5 центов за каждый доллар страхового покрытия, он будет особенно привлекателен для людей, которые знают, что их собственный риск (болезни или автомобильной аварии) превышает 5 %. Безусловно, некоторые люди, знающие о том, что их риск ниже 5 %, все равно купят такой страховой полис ввиду нерасположенности к риску. Однако в общей совокупности лиц, претендующих на оформление этого страхового полиса, доля лиц с более высокой степенью риска превысит долю лиц с аналогичным риском в общей численности населения. Таким образом, страховая компания выборочно привлекает невыгодную, или неблагоприятную, группу клиентов. Данный феномен известен как неблагоприятный отбор и характерен для сделок с асимметричной информацией. (На самом деле этот термин возник именно в страховой отрасли.)
Потенциальные последствия неблагоприятного отбора для рыночных сделок весьма наглядно продемонстрировал Джордж Акерлоф в статье, которая положила начало экономическому анализу ситуаций с асимметричной информацией и обеспечила ему Нобелевскую премию в 2001 году. Мы приводим этот пример, чтобы ознакомить вас с возможными последствиями неблагоприятного отбора.
Б. Рынок «лимонов»
Представьте себе сформировавшийся в 2014 году рынок определенного типа подержанных автомобилей, скажем Citrus 2011 года выпуска. Предположим, что в эксплуатации эти машины оказались либо безотказными и надежными, либо очень проблемными. Автомобили второго типа принято называть «лимонами», поэтому для контраста назовем автомобили первого типа «апельсинами».
Допустим, каждый владелец «апельсина» Citrus оценивает его в 12 500 долларов и готов с ним расстаться за более высокую, но не более низкую цену по сравнению с этой ценой. В свою очередь, каждый владелец «лимона» Citrus оценивает его в 3000 долларов. Предположим, потенциальные покупатели готовы заплатить больше указанных сумм. Если бы покупатель был уверен, что приобретаемый им автомобиль — «апельсин», он бы выложил за него 16 000 долларов; если бы он знал, что автомобиль — «лимон», то 6000 долларов. Поскольку покупатели оценивают автомобили каждого типа по более высокой цене, чем их непосредственные владельцы, продажа авто была бы взаимовыгодной. Цена «апельсина» могла бы варьироваться в диапазоне от 12 500 до 16 000 долларов, а «лимона» — от 3000 до 6000 долларов. Для определенности допустим, что количество таких автомобилей ограниченно, а потенциальных покупателей больше, чем машин. Тогда покупатели, конкурируя друг с другом, повысят цену автомобилей до максимальной, которую они готовы заплатить, то есть «апельсин» будет стоить 16 000 долларов, а «лимон» — 6000 долларов при условии стопроцентной идентификации типа каждого из них.
Однако информация о качестве любого конкретного автомобиля несимметрично распределена между двумя сторонами сделки. Владелец Citrus точно знает, «апельсин» это или «лимон», а потенциальный покупатель — нет, и владельцу «лимона» абсолютно невыгодно обнародовать такие сведения. Давайте пока ограничимся анализом рынка частных подержанных автомобилей, на котором законы, требующие правдивого раскрытия информации, либо не действуют, либо трудновыполнимы. Кроме того, будем исходить из того, что у потенциального покупателя отсутствует любая возможность заметить нечто такое, что поможет ему определить тип автомобиля; точно так же и владелец автомобиля лишен возможности указать его тип. Таким образом, в данном примере мы проанализируем только последствия асимметричности информации, когда обе стороны сделки не могут воспользоваться инструментами сигнализации или скрининга.
Когда покупатели не могут отличить «апельсины» от «лимонов», на рынке не может быть разных цен на автомобили этих типов. Цена на автомобиль Citrus должна быть только одна — p, а значит, два типа автомобилей, «апельсины» и «лимоны», следует объединить в одну группу. Возможна ли эффективная торговля при таких обстоятельствах — зависит от доли «апельсинов» и «лимонов» в общей совокупности авто. Предположим, доля «апельсинов» — f от подержанных автомобилей Citrus, а «лимонов» — оставшаяся часть (1 — f).
Несмотря на то что покупатели не могут проверить качество отдельного автомобиля, они могут знать долю хороших машин в общей совокупности авто, например, из газет; мы предполагаем, что в действительности так и происходит. Если на продажу выставляются все автомобили, потенциальный покупатель может рассчитывать на случайный выбор с вероятностями получения «апельсина» и «лимона» f и (1 — f) соответственно. Ожидаемое значение цены автомобиля составляет 16 000 × f + 6000 × (1 — f) = 6000 + 10 000 × f > p. Потенциальный покупатель приобретет такой автомобиль, если его ожидаемая стоимость превысит цену, которую ему предлагают заплатить, то есть если 6000 + 10 000 × f > p.
Теперь проанализируем эту ситуацию с точки зрения продавца. Владельцы знают, какие у них автомобили — «апельсины» или «лимоны». Владелец «лимона» готов его продать, если цена превышает для него ценность автомобиля, то есть если p > 3000. Однако владелец «апельсина» требует, чтобы p > 12 500. Если это условие владельца «апельсина» удовлетворяется, то удовлетворяются и условия владельца «лимона».
Таким образом, для выполнения условий всех покупателей и продавцов, чтобы они были готовы заключить сделку, нужно, чтобы 6000 + 10 000 × f > p > 12 500. Если доля «апельсинов» в общей совокупности удовлетворяет условию 6000 + 10 000 × f > 12 500, или f > 0,65, можно найти цену, которая позволит выполнить эту задачу, в противном случае эффективная торговля невозможна. При 6000 + 10 000 × f < 12 500 (если исключить редкий и маловероятный случай равенства между этими двумя вариантами) владельцы «апельсинов» не захотят продавать их по максимальной цене, которую готовы заплатить потенциальные покупатели. В результате в совокупности подержанных автомобилей, выставленных на продажу, будет наблюдаться неблагоприятный отбор и «апельсины» вообще не появятся на рынке. Потенциальные покупатели, понимая, что они наверняка получат «лимон», будут готовы платить не более 6000 долларов. Владельцы «лимонов» будут довольны таким исходом, и «лимоны» будут продаваться. Однако в связи с асимметричностью информации рынок «апельсинов» рухнет. Этот исход станет одним из вариантов закона Грешема, в котором плохие автомобили вытесняют хорошие.
Поскольку отсутствие информации делает невозможным получение обоснованной цены на «апельсины», их владельцам каким-то способом понадобится убедить покупателей, что у них хорошие автомобили. Другими словами, им необходимо подать сигнал о типе автомобиля. Проблема в том, что владельцы «лимонов» тоже захотят сделать вид, будто их автомобили — «апельсины», и с этой целью могут имитировать большинство сигналов, подаваемых владельцами «апельсинов». Майкл Спенс, сформулировавший концепцию сигнализирования и разделивший с Акерлофом и Стиглицем Нобелевскую премию 2001 года за работу в области экономической информации, описывает проблемы владельцев «апельсинов» в своей новаторской книге о сигнализировании так: «Вербальные (словесные) заявления ничего не стоят, а значит, они бесполезны. Кто угодно может солгать о том, почему он продает машину. Кто угодно может предложить покупателю проверить состояние автомобиля. Владелец “лимона” также может сделать такое предложение. Это блеф. В любом случае он ничего не теряет. Кроме того, такие проверки дорогостоящи, а заключение о надежности автомобиля, сделанное механиком владельца, не заслуживает доверия. Умный владелец автомобиля, который не относится к числу “лимонов”, мог бы заплатить за техосмотр, но предоставить покупателю возможность выбрать эксперта. В таком случае у владельца возникает другая проблема — максимально сократить затраты на техосмотр. Никаких гарантий нет. Продавец может уехать в Кливленд, не оставив адреса».
На самом деле ситуация не столь безнадежна, как обрисовал Спенс. Люди и компании, занимающиеся продажей подержанных автомобилей, могут заслужить репутацию честных партнеров и извлекать из нее выгоду, устанавливая надбавку к цене продаваемых автомобилей. (Безусловно, некоторые торговцы подержанными автомобилями поступают непорядочно.) Одни покупатели разбираются в автомобилях, другие приобретают их у знакомых, а значит, могут проверить историю машины. Кроме того, автодилеры могут предлагать покупателям гарантию — эту тему мы рассмотрим подробнее ниже. А на других рынках недобросовестным игрокам труднее имитировать действия добросовестных, поэтому достоверное сигнализирование возможно. Конкретным примером может служить ситуация, в которой образование выступает в качестве сигнала о квалификации. В подобной ситуации людям с низким уровнем квалификации труднее получить такое образование, которое бы позволило ошибочно принять их за высококвалифицированных специалистов. Для того чтобы по уровню образования провести различие между типами специалистов, необходимо выполнение следующего условия: получение образования должно обходиться неквалифицированным работникам гораздо дороже, чем квалифицированным. Для того чтобы продемонстрировать, как и когда сигнализирование может эффективно разделить типы игроков, давайте обратимся к рынку труда.
В. Сигнализирование и скрининг: типичные ситуации
Основная идея использования сигнализирования или скрининга для передачи или сбора информации очень проста: игроки разных типов (то есть владеющие разной информацией о собственных характеристиках или об игре и выигрышах в ней в более общем случае) должны считать оптимальным выполнение различных действий так, чтобы они правдиво раскрывали их истинный тип. Существует множество ситуаций с такой асимметричностью информации, а также стратегий сигнализирования и скрининга, позволяющих справиться с подобными задачами. Ниже описывается ряд ситуаций, в которых применимы методы анализа, представленные в данной главе.
I. Страхование. Потенциальные покупатели страховых полисов относятся к разным категориям риска, или степени их риска для страховой компании. Например, среди многих водителей, подающих заявки на оформление полисов страхования автотранспортных средств на случай столкновения, есть как более, так и менее осторожные. Каждый потенциальный клиент лучше, чем страховая компания, знает о том, к какой категории риска он принадлежит. С учетом условий того или иного страхового полиса компания заработает меньше прибыли (или понесет более крупные убытки) на страховании клиентов более высокой категории риска. Тем не менее данный страховой полис может оказаться более привлекательным именно для клиентов с повышенным уровнем риска. Таким образом, страховая компания привлекает менее благоприятную группу клиентов, а значит, происходит неблагоприятный отбор. Безусловно, страховая компания заинтересована в проведении различия между категориями риска. Это можно сделать посредством одного из инструментов скрининга.
Предположим, существуют только две категории риска. Следовательно, страховая компания может предложить два полиса страхования, из которых каждый клиент выберет какой-то один. Первый полис предусматривает более низкий страховой взнос (измеряемый в определенном количестве центов на каждый доллар страхового покрытия), но обеспечивает покрытие меньшего процента от понесенных клиентом убытков. Второй полис предусматривает более высокий страховой взнос, но обеспечивает и более высокий процент страхового покрытия убытков, возможно, даже 100 процентов. (При страховании на случай столкновения эти убытки представляют собой стоимость ремонта автомобиля в автомастерской.) Клиент, принадлежащий к более высокой категории риска, с большей вероятностью может понести непокрытые убытки, поэтому он гораздо охотнее заплатит более высокий страховой взнос, чтобы получить большее страховое покрытие. Исходя из этого, страховая компания может установить соотношение между размером страховых взносов и покрытия убытков таким образом, чтобы клиенты более высокой категории риска выбирали полисы с высокими взносами и высоким покрытием, а клиенты более низкой категории риска — полисы с более низкими взносами и низким страховым покрытием. При наличии других категорий риска страховой компании необходимо предлагать потенциальным клиентам больше полисов страхования; в случае непрерывного диапазона категорий риска может быть и соответствующий диапазон страховых полисов.
Безусловно, любая страховая компания вынуждена бороться за каждого клиента. Такая конкуренция влияет на условия пакетов страховых взносов и уровней покрытия, предлагаемых страховой компанией. Иногда конкуренция может даже препятствовать достижению равновесия, поскольку каждое предложение рискует проиграть в противостоянии с другим предложением. Однако общая идея, лежащая в основе создания полисов с дифференцированными страховыми взносами для клиентов разных категорий риска, обоснованна и важна.
II. Гарантия. Многие типы товаров длительного пользования, такие как автомобили, компьютеры и стиральные машины, отличаются по уровню качества. Любая компания-производитель имеет полное представление о своем продукте. А вот потенциальные покупатели менее информированны. Может ли компания, которая знает, что ее продукт отличается высоким качеством, подать об этом потенциальным покупателям достоверный сигнал?
Самый очевидный и наиболее распространенный сигнал — гарантия. Стоимость гарантии действительно высококачественного продукта ниже, поскольку его производитель реже сталкивается с требованиями о ремонте или замене, чем производитель некачественного продукта. Следовательно, гарантия может служить сигналом о высоком качестве изделия, а покупатели интуитивно учитывают этот факт, принимая решение о покупке.
Как правило, в таких ситуациях сигнал должен быть избыточным, с тем чтобы его имитация обходилась достаточно дорого. В связи с этим компания, выпускающая качественные автомобили, должна предлагать весьма серьезную гарантию, для того чтобы подать достоверный сигнал о качестве автомобиля. Это требование имеет особое значение для любой компании-новичка в отрасли, еще не заслужившей репутации производителя высококачественной продукции. Например, Hyundai вышла на рынок США в 1986 году и на протяжении первых десяти лет имела репутацию компании, выпускающей автомобили низкого качества. В середине 1990-х Hyundai инвестировала большие средства в улучшение технологии, дизайна и производственного процесса. Для того чтобы обновить сложившийся имидж, компания предложила революционную на то время гарантию на свои автомобили, рассчитанную на 10 лет и 100 000 миль пробега. Теперь организации по защите потребителей считают Hyundai одним из лучших производителей высококачественных автомобилей.
III. Ценовая дискриминация. Покупатели большинства продуктов неоднородны с точки зрения готовности платить, уделять время поиску более выгодной цены и т. д. Компании хотели бы найти способ идентифицировать потенциальных клиентов с более высокой готовностью платить, чтобы назначать им одну, предположительно обоснованно высокую цену, и в то же время выборочно делать выгодные предложения тем клиентам, которые не могут платить так много (до тех пор, пока их готовность платить все же превышает затраты на поставку соответствующего продукта). Компании могут успешно устанавливать разные цены для разных групп потребителей с помощью инструментов скрининга для разделения типов клиентов. Мы обсудим такие стратегии, которые известны в экономической литературе как ценовая дискриминация, подробнее в . Здесь же представим лишь краткий обзор этой темы.
Наиболее показательный пример дискриминационных цен относится к отрасли авиаперевозок. Пассажиры, предпочитающие совершать деловые поездки бизнес-классом, зачастую готовы платить за авиабилеты больше, чем туристы, потому что как минимум часть их стоимости возмещает работодатель. Со стороны авиакомпании было бы незаконно открыто выяснять тип каждого пассажира и назначать разные цены пассажирам разных типов. Однако авиакомпании успешно используют тот факт, что туристы предпочитают составлять маршрут путешествий заранее, тогда как бизнес-пассажирам необходимо сохранять определенную гибкость в своих планах. В связи с этим авиаперевозчики устанавливают разные цены на билеты, подлежащие и не подлежащие возврату, и предоставляют путешественникам самим выбирать тип тарифа. Такая стратегия ценообразования представляет собой пример скрининга посредством самоотбора. Другие инструменты — специальный тариф при условии предварительной покупки билета, требование о минимальном сроке пребывания в ночь с субботы на воскресенье, разные категории обслуживания на борту (первый класс, бизнес-класс и экономкласс) — также применяются в целях скрининга.
Ценовая дискриминация характерна не только для таких дорогостоящих вещей, как авиабилеты. Другие схемы дискриминационного ценообразования можно наблюдать на многих рынках, где цены гораздо ниже цен на воздушные перевозки. Например, кафе и закусочные обычно предлагают завсегдатаям дисконтные карты, обеспечивающие скидку на кофе или закуски. Это объясняется тем, что постоянные клиенты в большей степени готовы искать более выгодные предложения поблизости, тогда как приезжие или случайные посетители идут в первое попавшееся кафе или закусочную и не тратят время на поиск заведения с более низкими ценами. Завышенная обычная цена и скидка в виде бесплатного одиннадцатого заказа — и есть то меню вариантов, из которого выбирают два типа клиентов, что, собственно, и разделяет их на типы.
Книги — еще один пример. Как правило, сначала книги издаются в твердом переплете; более дешевый вариант в мягкой обложке выходит спустя несколько месяцев, а то и через год и даже позже. Разница между затратами на публикацию двух версий книги несущественна. Но эти версии служат для разделения покупателей на тех, которые хотят прочитать книгу сразу же и готовы платить больше за возможность это сделать, и тех, кто намерен ждать дольше, чтобы заплатить меньше.
IV. Дизайн и реклама продукта. Может ли привлекательный, хорошо продуманный внешний вид продукта служить сигналом о его высоком качестве? Основное условие сводится к тому, что затраты на разработку такого сигнала для компании, которая лишь создает видимость высокого качества, должны быть существенно выше, чем для компании, выпускающей действительно качественный продукт. Как правило, затраты на внешнее оформление продукта не зависят от его качества. Следовательно, подражатель не сталкивается с разницей в затратах, а значит, такой сигнал не будет достоверным.
Однако порой подобные сигналы могут иметь под собой определенное обоснование. Внешнее оформление продукта требует фиксированных затрат, которые распределяются на весь его жизненный цикл. Покупатели действительно узнают о качестве продукта из собственного опыта, от друзей, а также из обзоров и отзывов в СМИ. Эти факторы указывают на то, что товар высокого качества может рассчитывать на более длительный период пребывания на рынке и более высокий общий объем продаж. Стало быть, затраты на дорогостоящее внешнее оформление распределяются на большее количество выпущенной продукции и в меньшей степени увеличивают себестоимость каждой единицы продукта, если он имеет более высокое внутреннее качество. Фактически компания делает такое заявление: «У нас хороший продукт, и мы его продадим в большом количестве. Поэтому мы можем себе позволить потратить столько денег на его дизайн. Такие затраты были бы непомерными для компании-однодневки, которая рассчитывает продать не так уж много единиц продукта, прежде чем люди обнаружат его низкое качество и перестанут покупать». Даже дорогостоящий, на первый взгляд бесполезный и неинформативный запуск продукта и рекламная кампания способны обеспечить аналогичный результат сигнализирования.
Похожая ситуация складывается и в банках. Когда вы заходите в банк и видите добротные мраморные стойки и бархатную мебель, это может убедить вас в его стабильности. Однако чтобы этот сигнал действительно работал, важно, чтобы здание, мебель и внутренняя отделка носили индивидуальный характер и были присущи именно этому банку. Если все это можно без труда продать учреждениям других типов и превратить помещение, скажем, в ресторан, то не заслуживающий доверия владелец мог бы имитировать поистине надежный банк без всяких дополнительных затрат. В данной ситуации такой сигнал был бы недостоверным.
V. Такси. Приведенные выше примеры взяты в основном из экономики, а теперь давайте рассмотрим пример из области социологии, касающийся службы такси. Подавляющее большинство людей, нанимающих такси, просто хотят доехать до пункта назначения, заплатить за проезд и уйти. Однако некоторые пытаются ограбить таксиста или угнать его автомобиль, возможно, даже применив физическое насилие. Как таксисты могут осуществить скрининг потенциальных клиентов и предоставлять услуги только хорошим людям? Социологи Диего Гамбетта и Хезер Хэмилл проанализировали этот вопрос на основании многочисленных бесед с таксистами в Нью-Йорке (где грабежи — большая проблема) и Северной Ирландии (где в период проведения исследования серьезной проблемой были межрелигиозные конфликты).
Водителям необходим подходящий инструмент скрининга, поскольку они знают, что потенциальные клиенты с плохими намерениями пытаются имитировать действия хороших клиентов. Здесь также применимо условие о разнице в затратах. Нет никаких гарантий того, что житель Нью-Йорка в добротном костюме не представляет опасности, так как грабитель может купить и надеть костюм по той же цене, что и хороший клиент. Расу и пол тоже нельзя использовать для отсеивания клиентов. В Северной Ирландии враждующие группировки также трудноотличимы по внешним характеристикам.
Гамбетта и Хэмилл обнаружили, что некоторые инструменты скрининга более приемлемы для таксистов. Например, заказ такси по телефону — более достоверный сигнал о благонадежности клиента, чем попытки поймать такси на улице: когда вы указываете место, где вас должно забрать такси, служба такси в буквальном смысле знает, где вы живете. Еще важнее то, что некоторые инструменты сигнализирования оказались более эффективны для клиентов (а значит, и выступали в качестве более эффективных инструментов скрининга) при использовании в сочетании друг с другом, а не по отдельности. Ношение костюма само по себе не было достоверным инструментом скрининга, но когда человек в костюме выходил из офисного здания, таксисты считали его более безопасным клиентом, чем человека в костюме, стоящего на углу улицы. В настоящее время в вестибюлях большинства офисных зданий есть охрана, поэтому можно считать, что такой клиент уже прошел один уровень проверки системой безопасности.
Пожалуй, самыми важными оказались бессознательные сигналы, подаваемые людьми (микровыражения лица, жесты и т. д.), которые опытные таксисты умеют читать и интерпретировать. Именно ввиду непроизвольности таких сигналов их имитация потребовала бы невероятных усилий, а значит, они могут считаться самыми эффективными инструментами скрининга, необходимого для разделения типов клиентов.
VI. Политические бизнес-циклы. Теперь приведем еще два примера из области политэкономии. Действующие правительства часто увеличивают бюджетные расходы, чтобы обеспечить рост экономики накануне выборов, тем самым надеясь привлечь больше голосов избирателей и выиграть выборы. Но разве не должны рационально мыслящие избиратели разгадать эту уловку и понять, что сразу же после завершения выборов правительство будет вынуждено сократить расходы, что может привести к экономическому спаду? Для того чтобы расходы накануне выборов эффективно сигнализировали о типе, избиратели должны испытывать неопределенность в отношении типа правительства в плане его компетентности. Будущая рецессия повлечет за собой определенные политические издержки для правительства. И они будут меньше, если правительство более компетентно в вопросах экономики. Когда разница в издержках между компетентным и некомпетентным правительством достаточно большая, значительное увеличение расходов может выступать в качестве достоверного сигнала о компетентности.
Еще один пример относится к методам управления инфляцией. Многие страны в разные времена переживали периоды высокой инфляции, и их правительства благочестиво заявляли о своем намерении снизить ее уровень. Может ли правительство, которое действительно заботится о стабильности цен, достоверно подать сигнал о своем типе? Да. Правительства могут выпустить облигации, защищенные от инфляции, процентная ставка по которым автоматически повышается с повышением темпов инфляции или капитальная стоимость которых увеличивается пропорционально росту уровня цен. Выпуск государственных долговых обязательств в такой форме обходится правительству, отдающему предпочтение политике, приводящей к росту инфляции, дороже, поскольку ему приходится выплачивать более высокий процент или увеличивать сумму своего долга. Следовательно, правительство с подлинно антиинфляционной политикой может выпустить защищенные от инфляции облигации в качестве достоверного сигнала, отделяя себя тем самым от типа правительства, предпочитающего инфляцию.
VII. Эволюционная биология. И в заключение — пример из области естественных наук. У многих видов птиц у самцов очень яркое и тяжелое оперение, которое привлекает самок. Казалось бы, самки должны искать генетически более развитых самцов, с тем чтобы увеличить шансы потомства дожить до зрелости и, в свою очередь, привлечь партнера. Но почему яркое оперение указывает на наличие данных генетических качеств? На первый взгляд может показаться, что такое оперение — недостаток, поскольку делает самца более заметным для хищников (и охотников) и менее мобильным, а значит, и в меньшей степени способным спастись. Почему же самки выбирают, казалось бы, столь неполноценных самцов? Ответ связан с условиями достоверного сигнализирования. Хотя тяжелое оперение — действительно физический недостаток, он все же говорит о том, что у самца с подобным оперением генетически более развиты такие качества, как сила и скорость. Чем слабее самец, тем труднее ему вырастить и поддерживать качественное оперение. Следовательно, именно тяжесть оперения делает его достоверным сигналом о качестве самца.
Г. Экспериментальные данные
Определение характеристик и поиск равновесий в играх с сигнализированием и скринингом предполагает использование ряда достаточно тонких концепций и вычислений. В частности, в каждом из приведенных выше примеров формальные модели должны быть тщательно описаны для того, чтобы можно было сформулировать обоснованные и точные прогнозы в отношении выбора игроков. В таких играх участникам следует пересматривать или обновлять значения вероятностей, присваиваемые ими типу (типам) игроков на основании наблюдений за их действиями. Это обновление требует применения теоремы Байеса, которая описана в . Кроме того, в мы подробно проанализируем игру, нуждающуюся в подобном обновлении.
Даже не вдаваясь в детали, вы можете себе представить, что вычисления для обновления вероятностей достаточно сложны. Стоит ли ожидать, что игроки смогут выполнить их правильно? Существует немало доказательств того, что люди очень плохо справляются с вычислениями, включающими вероятности, и еще хуже — с вычислением вероятностей с учетом новой информации. Поэтому нам следует с вполне обоснованным недоверием относиться к равновесиям, зависящим от выполнения таких вычислений.
В связи с этим весьма обнадеживают выводы экономистов, которые проводили лабораторные эксперименты с сигнальными играми. Некоторые чрезвычайно тонкие уточнения байесовского равновесия Нэша и совершенного байесовского равновесия можно изучить с помощью наблюдений, хотя эти уточнения требуют не только обновления информации посредством отслеживания действий на равновесном пути, но и принятия решения о том, как можно логически вывести информацию из неравновесных действий, которые вообще не следовало бы предпринимать. Тем не менее результаты всех этих исследований не позволяют сделать однозначные выводы, поскольку многое зависит от мелких деталей организации эксперимента в лаборатории.
5. Сигнализирование на рынке труда
Многие из вас рассчитывают по окончании учебы работать в элитной финансовой или ИТ-компании. В таких компаниях существует два типа вакансий. Один тип требует высокого уровня математических и аналитических навыков, а также способности усердно трудиться и оплачивается очень хорошо. Другой — это отчасти административная, менее квалифицированная, низкооплачиваемая работа. Безусловно, вы мечтаете о высокооплачиваемой работе. Вы знаете свои качества и навыки гораздо лучше, чем ваш потенциальный работодатель. Если у вас высокий уровень квалификации, вам необходимо, чтобы работодатель узнал об этом, к тому же он тоже хочет это знать. Работодатель может проверить ваши данные и провести с вами собеседование, но информация, полученная таким способом, ограничена имеющимися в его распоряжении временем и ресурсами. Вы можете рассказать работодателю, насколько вы опытный специалист, но подобные голословные заявления не внушают доверия. Вы должны чем-то подкрепить их, а ваш работодатель — попытаться получить более объективные данные.
Какие доказательства может искать работодатель, и что вы можете ему предоставить? Как говорилось в данной главы, ваш потенциальный работодатель применит определенные инструменты скрининга для определения ваших качеств и навыков. Вы, в свою очередь, будете использовать сигналы для передачи фактически той же информации. Иногда для сигнализирования или скрининга могут применяться подобные или даже идентичные инструменты.
В данном примере выбранный вами (и прослушанный) особенно трудный математический курс в университете может выступать в качестве достоверного доказательства вашей способности напряженно работать в целом и ваших математических и логических навыков в частности. Давайте проанализируем роль выбора курса обучения в качестве инструмента скрининга.
А. Скрининг в целях разделения типов
Для простоты проанализируем эту скрининговую игру с помощью интуиции и алгебры. Допустим, с точки зрения качеств, которые представляют интерес для работодателей, студенты делятся всего на два типа: талантливые (Т) и посредственные (П). Потенциальные работодатели из сферы финансов или информационных технологий готовы платить 160 000 долларов в год типу Т и 60 000 в год типу П. Другие работодатели предлагают типу Т 125 000 долларов, а типу П 30 000 долларов. Это те же показатели, что и в примере с автомобилями Citrus в , только умноженные на 10, чтобы они больше соответствовали реальному положению дел на рынке труда. И точно так же как в примере с подержанными автомобилями мы исходили из предположения о фиксированном запасе автомобилей и большом количестве потенциальных покупателей, здесь мы исходим из того, что у нас много потенциальных работодателей, вынужденных конкурировать друг с другом за ограниченное число кандидатов на вакантные должности, поэтому они должны предлагать им максимальную заработную плату, которую готовы выплачивать. Поскольку работодатели не могут определить тип конкретного претендента на ту или иную должность посредством прямых наблюдений, им необходимо найти другие надежные способы провести различие между типами.
Допустим, два типа студентов отличаются друг от друга готовностью изучать трудный, а не легкий курс в университете. Представители каждого типа готовы пожертвовать частью времени, выделенного на вечеринки и другие занятия, на изучение более трудного курса, но для студентов типа Т эта жертва меньше и пойти на нее легче, чем студентам типа П. Предположим, студенты типа Т рассматривают затраты на прохождение каждого такого курса как эквивалент годовой заработной платы в размере 3000 долларов, а студенты типа П — как 15 000 долларов. Может ли работодатель использовать эту разницу для скрининга кандидатов, чтобы отличить тип Т от типа П?
Рассмотрим следующую политику найма: любой студент, прослушавший определенное количество (n) сложных курсов, будет отнесен к типу Т и получит заработную плату в размере 160 000 долларов, и любой, кто изучил менее n сложных курсов, будет отнесен к типу П и получит 60 000 долларов. Цель такой политики — создание естественных стимулов, под влиянием которых только студенты типа Т будут изучать сложные курсы, а студенты типа П не станут этого делать. Ни один тип не намерен проходить больше сложных курсов обучения, чем требуется, поэтому варианты выбора таковы: либо изучить n курсов, чтобы претендовать на тип Т, либо признать поражение и согласиться на тип П (эти студенты могут вообще отказаться от изучения сложных курсов и просто учиться, не прилагая к этому особых усилий).
Чтобы такая политика найма достигла цели, она должна удовлетворять двум видам условий. Первый требует, чтобы политика найма стимулировала кандидатов каждого типа сделать тот выбор, который нужен компании. Иными словами, она должна быть совместима со стимулами сотрудников, поэтому соответствующие условия обозначаются термином условия совместимости стимулов. Второй вид условий гарантирует, что при выборе, продиктованном условиями совместимости стимулов, сотрудники получат лучший (по крайней мере не худший) выигрыш от соответствующих должностей, чем они получили бы в случае выбора другого варианта. То есть сотрудники должны согласиться на участие в предложенном компанией плане, поэтому соответствующие условия называются условиями участия. Мы рассмотрим их в контексте рынка труда чуть ниже. Аналогичные условия будут упоминаться и в других примерах, приведенных далее в этой главе и в , где описывается общая теория разработки подобных механизмов.
I. Совместимость стимулов. Критерий, разработанный работодателями, чтобы отличить тип Т от П (а именно, количество изученных сложных курсов), должен быть достаточно строгим, чтобы студенты типа П даже не пытались удовлетворить его, но не настолько строгим, чтобы лишить студентов типа Т желания предпринимать подобные попытки. Правильное значение n должно быть таким, чтобы студенты, действительно принадлежащие к типу П, признали это и согласились на 60 000 долларов, вместо того чтобы нести дополнительные издержки в связи с имитацией поведения студентов типа Т. Иначе говоря, нам нужно, чтобы политика найма была совместима по стимулам с типом П, поэтому
60 000 ≥ 160 000 — 15 000 n , или 15 n ≥ 100, или n ≥ 6,67.
Аналогичным образом условие, согласно которому студенты, действительно принадлежащие к типу Т, предпочитают доказать это посредством изучения n сложных курсов, выглядит так:
160 000 — 3000 n ≥ 60 000, или 3 n ≤ 100, или n ≤ 33,33.
Эти условия совместимости стимулов, или, что то же самое, ограничения совместимости стимулов, приводят стимулы кандидата на должность в соответствие с требованиями работодателя или делают оптимальным для кандидата раскрытие правдивой информации об уровне квалификации посредством своих действий. Значение n удовлетворяет обоим ограничениям, если это целое число в диапазоне от 7 до 33. Второе значение не совсем уместно в данном примере, поскольку программа обучения в колледже обычно состоит из 32 курсов, но в других примерах это может иметь смысл.
Удовлетворение обоим условиям обеспечивает разница в издержках в связи с изучением сложных курсов между двумя типами: эти издержки существенно ниже для студентов «хорошего» типа, которых и ищут работодатели. Когда ограничения удовлетворены, работодатель может использовать политику найма, на которую студенты двух типов отреагируют по-разному, тем самым раскрывая свой тип. Данный процесс называется разделением типов на основе самоотбора.
Мы не учли здесь вероятности того, что на самом деле сложные курсы обучения позволяют овладеть дополнительными навыками или методами работы, способными превратить студентов типа П в тип Т. Согласно нашему сценарию, сложные курсы служат только цели идентификации людей, которые уже обладают соответствующими качествами. Другими словами, эти курсы выполняют лишь функцию скрининга.
В реальной жизни образование действительно повышает продуктивность. Но помимо этого оно еще выполняет функцию сигнализирования и скрининга того вида, о котором идет речь в данном разделе. В нашем примере мы показали, что образование может быть получено исключительно ради второй функции; на самом деле оно часто превышает уровень, необходимый только для роста продуктивности. Такое дополнительное образование сопряжено с издержками асимметричности информации.
II. Участие. Когда условия совместимости стимулов для двух типов рабочих мест в данной компании удовлетворены, студенты типа Т изучают n сложных курсов и получают выигрыш в размере 160 000 — 3000n, тогда как cтуденты типа П не проходят сложных курсов и получают выигрыш 60 000. Чтобы студенты обоих типов были готовы сделать именно такой выбор вместо использования альтернативных возможностей, нужно, чтобы удовлетворялись также условия участия. Поэтому нам необходимо следующее неравенство:
160 000 — 3000 n ≥ 125 000, или 3 n ≤ 35, или n ≤ 11,67.
В данном примере очевидно, что условие участия студентов типа П удовлетворяется (хотя в других примерах может быть иначе), а условие участия студентов типа Т требует, чтобы n ≤ 11,67 или, поскольку n должно быть целым числом, n ≤ 11. Здесь любое значение n, которое удовлетворяет ограничению участия студентов типа Т n ≤ 11, удовлетворяет также ограничению совместимости стимулов n ≤ 33, поэтому второе условие становится логически избыточным.
В таком случае полная совокупность условий, выполнение которых необходимо для разделения типов на данном рынке труда, выглядит так: 7 ≤ n ≤ 11. Такое ограничение возможных значений n объединяет условие совместимости стимулов для студентов типа П и условие участия для студентов типа Т. В данном примере условие участия для студентов типа П и условие совместимости стимулов для студентов типа Т автоматически удовлетворяется в случае выполнения всех остальных условий.
Когда в качестве инструмента скрининга используется требование о прохождении достаточного количества сложных курсов, издержки несут студенты типа Т. Если предположить, что для обеспечения разделения типов используется минимальное количество курсов (а именно n = 7), издержки для каждого студента типа Т в денежном выражении составят 7 × 3000 = 21 000 долларов. В данном контексте это и есть издержки асимметричности информации. Их не существовало бы, если бы тип студента можно было определить напрямую и объективно. Не было бы их и в случае, если бы вся совокупность состояла исключительно из студентов типа Т. Последним приходится нести эти издержки по причине наличия в общей совокупности студентов типа П, от которых они (или их потенциальные работодатели) хотят отмежеваться.
Б. Объединение типов
А может, чтобы не возлагать на тип Т издержки асимметричности информации, лучше вообще не утруждать себя разделением типов? При разделении студенты типа Т получают заработную плату 160 000 долларов, но несут издержки в размере 21 000 долларов в связи с изучением сложных курсов; следовательно, их чистый выигрыш в денежном эквиваленте составляет 139 000 долларов. А студенты типа П получают заработную плату 60 000 долларов. Что произойдет с этими типами, если их не разделять?
Отказ от использования инструментов скрининга приведет к случайному выбору кандидатов из общей совокупности и выплате всем одинаковой заработной платы. Такая ситуация называется объединением типов, или просто объединением, когда понятен смысл происходящего. На конкурентном рынке труда в случае объединения типов общая заработная плата является средним значением той ценности, которую представляют собой специалисты разных типов для работодателя, и она зависит от доли каждого типа в общей совокупности. Например, если 60 % совокупности — тип Т, а 40 % — тип П, общая заработная плата при объединении типов составит:
0,6 × 160 000 + 0,4 × 60 000 = 120 000 долларов.
Естественно, в этом случае специалисты типа Т предпочтут ситуацию с разделением типов, поскольку это обеспечит им 139 000 долларов вместо 120 000. Однако если доли типов в общей совокупности составляют 80 % типа Т и 20 % типа П, то общая заработная плата при объединении будет 140 000 долларов, а значит, при разделении представители типа Т проиграют. Типу П всегда выгоднее объединение. Наличие типа Т в совокупности означает, что общая заработная плата при объединении типов всегда будет превышать заработную плату представителей типа П в размере 60 000 долларов в случае разделения.
Тем не менее если оба типа предпочтут результат, полученный при объединении, это не может быть равновесием в ситуации, когда многие работодатели или работники конкурируют друг с другом в процессе сигнализирования и скрининга. Предположим, соотношение типов в общей совокупности составляет 80 на 20 и имеет место исходная ситуация с объединением, в которой обоим типам платят по 140 000 долларов. Работодатель может объявить, что готов платить 144 000 долларов тому, кто прослушает всего один сложный курс. По сравнению с исходной ситуацией студенты типа Т сочтут это предложение выгодным, так как их расходы на изучение курса составляют всего 3000 долларов, а заработная плата повышается на 4000 долларов. Поскольку данный работодатель выборочно привлекает студентов типа Т, каждый из которых имеет ценность 160 000 долларов, но получает 144 000 долларов, он извлечет прибыль из отклонения от размера заработной платы, рассчитанного с учетом объединения типов.
Однако такое отклонение запускает процесс корректировки заработной платы конкурирующими работодателями, что приводит к разрушению исходной ситуации с объединением типов. Когда сотрудники типа Т начинают массово переходить к данному работодателю, это приводит к снижению общего уровня квалификации оставшихся у других работодателей специалистов и в итоге наступает момент, когда они уже не в состоянии платить им 140 000 долларов. После снижения заработной платы в совокупности специалистов разница между нею и суммой 144 000 долларов, предложенной вышеупомянутым работодателем, достигнет величины, при которой специалисты типа П также сочтут необходимым пройти один сложный курс обучения. Но тогда этот работодатель вынужден будет повысить свое требование до двух сложных курсов, а разницу в заработной плате до такого уровня, при котором изучение двух курсов станет слишком обременительным для типа П, но вполне приемлемым для типа Т. Другие работодатели, которые тоже захотят привлечь какое-то количество представителей типа Т, должны использовать аналогичную политику найма. Этот процесс будет продолжаться до тех пор, пока рынок труда не достигнет разделяющего равновесия, о котором шла речь выше.
Даже если работодатели не проявят инициативу по привлечению сотрудников типа Т вместо типа П, специалист типа Т, зарабатывающий 140 000 долларов в ситуации с объединением типов, может прослушать сложный курс обучения, принести подтверждающий это документ работодателю и сказать: «У меня есть сертификат о прохождении сложного курса обучения, поэтому я прошу повысить мне зарплату до 144 000 долларов. Это убедительное доказательство того, что я отношусь к типу Т; ни один представитель типа П не сделал бы вам подобного предложения». Учитывая имеющиеся в данной ситуации факты, аргумент можно считать обоснованным, и работодателю было бы выгодно согласиться: сотрудник типа Т представлял бы для него ценность 160 000 долларов, но при этом получал бы 144 000 долларов. Другие специалисты типа Т могут поступить так же. Это запускает тот же каскадный процесс, который приводит к разделяющему равновесию. Единственное различие — кто именно инициатор. Теперь специалисты типа Т решают получить дополнительное образование в качестве достоверного доказательства своего типа, и это уже сигнализирование, а не скрининг.
Общая идея такова: хотя объединение типов может быть выгодно всем, игроки не выбирают то или другое в ходе кооперативного, связующего процесса. Они преследуют собственные интересы, что приводит к формированию разделяющего равновесия. Эта ситуация напоминает игру «дилемма заключенных» со многими участниками, а значит, в издержках асимметричности информации присутствует элемент неизбежности.
В. Множество типов
Хотя мы рассмотрели пример с двумя типами, этот анализ можно обобщить. Предположим, существует несколько типов: А, Б, В, …, сгруппированных в порядке снижения их ценности для работодателя и повышения расходов на получение дополнительного образования. Это позволит установить последовательность постепенно повышающихся требований к уровню образования: самый худший тип в нем не нуждается вообще, следующему типу достаточно самого низкого уровня образования, третий тип должен иметь такой-то уровень и т. д.; при этом представители соответствующих типов будут сами выбирать уровень образования, который их идентифицирует.
В заключение хотим высказать еще одну мысль, или даже предостережение, в отношении сигнализирования. Вы — информированная сторона, и вам доступно действие, которое может достоверно передать хорошую информацию (то есть ту, что наверняка пойдет вам на пользу). Если вам не удастся отправить такой сигнал, это будет воспринято как плохая информация. В этом отношении сигнализирование подобно игре в труса: если вы откажетесь играть, вы уже сыграли и проиграли.
Вы должны помнить об этом, решая, какой курс выбрать — тот, который оценивается по буквенной системе или по принципу «зачтено / не зачтено». Студенты, изучающие тот или иной курс, получают весь диапазон оценок; предположим, средняя оценка — B. Очевидно, что каждый студент прекрасно знает свои способности. У студентов, достаточно уверенных в получении оценки A+, есть мощный стимул пройти сложный курс, который оценивается по буквенной системе. Если они это сделают, средняя оценка остальных студентов окажется меньше B, скажем B−, поскольку это экстремальное значение исключается из распределения. Теперь уже студенты, рассчитывающие на оценку «A», заинтересованы в выборе курса с буквенной системой оценивания, что, в свою очередь, снижает среднюю оценку остальных, и т. д. В итоге студенты выбирают курс, который оценивается по принципу «зачтено / не зачтено», но это касается лишь тех, кто надеется на оценки C и D. Стратегически грамотный читатель приложения к диплому (потенциальный работодатель или член приемной комиссии вуза) знает, что курс с системой оценивания «зачтено / не зачтено» в основном выбирают студенты из нижней части распределения оценок. По этой причине он воспримет оценку «зачтено» как C или D, а не как среднюю оценку всей группы B.
6. Равновесия в сигнальных играх с двумя участниками
До сих пор наш анализ охватывал общую концепцию неполной информации, а также конкретные стратегии сигнализирования и скрининга. Кроме того, мы рассмотрели возможные результаты разделения или объединения типов, которые могут возникнуть вследствие применения этих стратегий. Мы видели, как на рынке с большим количеством владельцев автомобилей и покупателей может сформироваться неблагоприятный отбор, а также как работают инструменты сигнализирования и скрининга в условиях взаимодействия работодателей и работников. Тем не менее мы еще не описали в этой главе решения игры с участием двух игроков, владеющих разной информацией. Ниже приводится пример решения такой игры с использованием дерева игры и таблицы выигрышей в качестве инструментов анализа. Мы увидим, что равновесием в ней может быть либо разделение, либо объединение типов, а также высока вероятность формирования частично раскрывающего или полуразделяющего равновесия.
А. Базовая модель и структура выигрышей
В данном разделе мы проанализируем игру с асимметричной информацией «выход на рынок», в качестве участников которой выступают две автомобилестроительные компании, Tudor и Fordor. В настоящее время корпорация Tudor имеет монополию на рынке автомобилей определенного типа, скажем экономичных малолитражек, не загрязняющих окружающую среду. Инновационная компания Fordor разработала конкурирующую концепцию автомобиля и решает, стоит ли ей выходить на рынок. Однако Fordor не знает, насколько жестким конкурентом окажется Tudor. В частности, издержки производства компании Tudor (о которых Fordor ничего не известно) могут быть высокими или низкими. Если они высокие, Fordor может выйти на рынок и вступить в конкурентную борьбу, получая прибыль; если низкие, выход Fordor на рынок и затраты на разработку невозможно будет возместить за счет операционной прибыли, а значит, ее выход на рынок будет абсолютно убыточным.
Взаимодействие между компаниями представляет собой игру с последовательными ходами. На ее первом этапе (период 1) Tudor устанавливает цену (для простоты предположим, что высокую или низкую), зная, что она единственный производитель автомобилей такого класса на рынке. На следующем этапе Fordor принимает решение о выходе на рынок. Выигрыши (или прибыль) компаний определяются на основании рыночной цены автомобиля с учетом издержек производства каждой компании, а в случае Fordor еще и с учетом затрат в связи с выходом на рынок и разработку автомобиля.
Безусловно, для Tudor было бы лучше, если бы Fordor не выходила на рынок, поэтому на первом этапе игры Tudor может попытаться использовать цену автомобиля как сигнал об издержках производства. Компания с низкими издержками установила бы более низкую цену, чем с высокими. Следовательно, Tudor может рассчитывать на то, что, если на протяжении периода 1 она сохранит низкую цену на автомобиль, Fordor интерпретирует это как доказательство низких издержек производства Tudor и не станет выходить на рынок. (Как только Fordor откажется от дальнейшей борьбы и уйдет со сцены, Tudor может снова поднять цену на авто.) Подобно тому как в покере игрок может блефовать, рассчитывая на то, что это сработает и соперник сбросит карты, Tudor также может попытаться удержать Fordor от выхода на рынок посредством блефа. Разумеется, компания Fordor — стратегический игрок и знает о подобном трюке. Вопрос в том, сможет ли Tudor успешно блефовать в случае равновесия в данной игре. Ответ зависит от вероятности того, что в Tudor действительно низкие издержки производства, а также от затрат на введение конкурента в заблуждение. Ниже мы проанализируем различные варианты развития событий и покажем полученные в результате равновесия.
Во всех этих случаях затраты на единицу продукции и цены выражены в тысячах долларов, а количество проданных автомобилей — в сотнях тысяч, поэтому прибыль измеряется в сотнях миллионов. Это поможет нам представить выигрыши и таблицы в достаточно компактной, удобной для чтения форме. Мы вычислим выигрыши с помощью тех же инструментов анализа, которые применяли в игре с ценообразованием в ресторанах в , при этом будем исходить из предположения, что зависимость между назначенной ценой (P) и величиной спроса (Q) описывается формулой: P = 25 — Q30.
Чтобы выйти на рынок, компания Fordor должна понести первоначальные затраты в размере 40 (в тех же единицах, что и прибыли, в сотнях миллионов, то есть фактический показатель составит 4 миллиарда долларов) на строительство завода, проведение рекламной кампании и т. д. Если затем она выходит на рынок, затраты на производство и поставку на рынок каждого автомобиля составят 10 (тысяч долларов).
Tudor может быть либо громоздкой старой компанией с высокими издержками производства на единицу продукции, составляющими 15 (тысяч долларов), либо динамичным автопроизводителем с более низкими затратами на единицу продукции. Для начала допустим, что более низкие издержки составляют 5; этот показатель ниже затрат, которые может обеспечить Fordor. В и мы проанализируем эффект других уровней издержек. Пока же предположим, что Tudor может обеспечить более низкий уровень издержек с вероятностью 0,4, или в 40 % случаев; следовательно, вероятность того, что в этой компании высокий уровень издержек, равна 0,6, или 60 %.
Варианты выбора компании Fordor в игре «выход на рынок» зависят от того, что ей известно об издержках Tudor. Будем считать, что Fordor располагает информацией о двух возможных уровнях издержек и может вычислить прибыль в каждом из этих случаев. Таким образом, хотя Fordor неизвестно, к какому типу относится Tudor, предварительное убеждение Fordor в точности соответствует вероятности того, что в Tudor более низкий уровень издержек; иными словами, убеждение Fordor состоит в том, что вероятность вступить в борьбу с Tudor, имеющей низкий уровень издержек производства, составляет 40 %.
Если в Tudor высокий уровень издержек, например 15 (тысяч долларов), то в случае монополии, которой ничего не угрожает, компания максимизирует свою прибыль, установив на автомобили цену 20 (тысяч долларов). При такой цене Tudor продаст 5 (сотен тысяч) автомобилей и заработает 25 [= 5 × (20–15) сотен миллионов долларов, или 2,5 миллиарда долларов]. Если Fordor выйдет на рынок и составит конкуренцию Tudor, то равновесие Нэша в этой игре в дуополию обеспечит Tudor операционную прибыль 3, а Fordor 45. Эта операционная прибыль превышает первоначальные затраты Fordor в связи с выходом на рынок (40), поэтому если бы компания знала, что в Tudor высокий уровень издержек, она решила бы выйти на рынок и заработать чистую прибыль в размере 5.
Если в Tudor низкий уровень затрат (5), то при наличии монополии, которой ничто не угрожает, компания установит на свои автомобили цену 15, продаст 10 и заработает прибыль 100. В случае равновесия, сформировавшегося на втором этапе игры после выхода на рынок Fordor, операционная прибыль Tudor составит 69, а Fordor 11, что меньше затрат Fordor в связи с выходом на рынок (40). Следовательно, если бы Fordor знала, что в Tudor низкий уровень затрат, она бы не выходила на рынок и тем самым предотвратила бы убыток 29.
Б. Разделяющее равновесие
Если у компании Tudor на самом деле высокий уровень издержек производства, но она хочет, чтобы в Fordor считали, будто он низкий, она должна имитировать действия компании с низкими издержками, то есть установить на свои автомобили цену 15. Но эта цена равна себестоимости единицы продукции, а значит, компания получит нулевую прибыль. Будет ли такая жертва Tudor оправданна? Отпугнет ли она Fordor и обеспечит преимущества монополии в дальнейшем?
Полная игра представлена в экстенсивной форме на рис. 8.7. Обратите внимание, что, как и в , мы используем здесь игрока по имени «природа», для того чтобы выбрать тип издержек Tudor в самом начале игры. Далее Tudor принимает решение о цене. Мы исходим из предположения, что, если в Tudor низкий уровень издержек, она не установит высокую цену. Но если высокий, она может выбрать либо высокую, либо низкую цену, если захочет ввести конкурента в заблуждение. Fordor не может провести различие между двумя ситуациями, в которых Tudor устанавливает низкую цену на автомобили, поэтому варианты выбора Fordor в отношении выхода на рынок, который она делает в этих узлах, объединяются в одно информационное множество. Следовательно, Fordor должна применить в обоих узлах либо стратегию «выйти на рынок», либо «отказаться от выхода на рынок».
Рис. 8.7. Экстенсивная форма игры «выход на рынок»: низкий уровень издержек в Tudor — 5
В каждом концевом узле первый элемент записи выигрышей (выделено серым цветом) — это прибыль компании Tudor, а второй элемент (выделено черным цветом) — прибыль компании Fordor. Прибыль Tudor суммируется за два периода: первый — когда Tudor — единственный производитель автомобилей данного класса, и второй — когда Tudor может быть либо монополистом, либо участником дуополии в зависимости от решения Fordor о выходе на рынок. Прибыль Fordor охватывает только второй период и отличается от нуля лишь в случае выхода компании на рынок.
Один шаг анализа методом обратных рассуждений позволяет определить, что в нижнем узле, где компания Tudor выбрала высокую цену, Fordor выберет вариант «выйти на рынок», поскольку 45–40 + 5 > 0. Следовательно, мы можем отсечь в этом узле ветвь «не выходить на рынок». В результате у каждого игрока остается две стратегии (исчерпывающих плана действий): у Tudor — стратегия «блефовать», или выбрать низкую цену на период 1 независимо от уровня затрат (сокращенно НН в той системе обозначений, о которой шла речь в ), а также «поступить честно», или выбрать низкую цену на протяжении периода 1, если издержки низкие, и высокую цену, если издержки высокие (НВ). У Fordor — стратегия «независимо от обстоятельств», или выйти на рынок независимо от цены, которую установит Tudor на период 1 (сокращенно РР вместо «рынок, рынок»), и «в зависимости от обстоятельств», или выйти на рынок, только если Tudor установит высокую цену на протяжении периода 1 (сокращенно ОР вместо «отказ, рынок»).
Теперь мы можем представить эту игру в стратегической (нормальной) форме. На рис. 8.8 показан каждый игрок с двумя возможными стратегиями; выигрыши в каждой ячейке — ожидаемая прибыль каждой компании, полученная с учетом вероятности (40 %) того, что в Tudor низкий уровень издержек. Эти расчеты аналогичны выполненным нами для заполнения таблицы на . Как и тогда, вы можете упростить расчеты, если обозначите концевые узлы дерева игры и определите, какие из них соответствуют каждой ячейке таблицы.
Рис. 8.8. Стратегическая форма игры «выход на рынок»: низкий уровень издержек Tudor — 5
Это простая игра, разрешимая по доминированию. В случае Tudor стратегия «поступить честно» доминирует над стратегией «блефовать». А наилучший ответ Fordor на доминирующую стратегию Tudor «поступить честно» — «в зависимости от обстоятельств». Таким образом, «поступить честно» / «в зависимости от обстоятельств» — единственное равновесие Нэша в этой игре (совершенное равновесие подыгры).
Равновесие, найденное на , будет разделяющим. Для двух типов издержек компания Tudor устанавливает разные цены на период 1. Это действие раскрывает компании Fordor тип Tudor, которая после этого принимает соответствующее решение о выходе на рынок.
Ключ к пониманию того, почему стратегия «поступить честно» для Tudor доминирующая, можно найти в сравнении выигрышей компании в случае стратегии Fordor «в зависимости от обстоятельств». Вот исходы игры, если стратегия Tudor «блефовать» сработает: Fordor выйдет на рынок, если Tudor установит высокую цену на период 1, и откажется от этого, если Tudor установит низкую цену на период 1. Если в Tudor действительно низкий уровень издержек, то ее выигрыши против стратегии Fordor «в зависимости от обстоятельств» одни и те же независимо от того, какую стратегию она применит — «блефовать» или «поступить честно». Однако если в Tudor высокий уровень издержек, результаты будут разниться.
Если Fordor выберет стратегию «в зависимости от обстоятельств», а Tudor — высокие издержки, Tudor может успешно использовать стратегию блефа. Однако успешный блеф обойдется ей слишком дорого. Если бы в Tudor назначили самую выгодную монопольную цену (стратегия «поступить честно») на период 1, компания получила бы прибыль 25; низкая цена при блефе кардинально сокращает размер прибыли на протяжении периода 1, в данном случае до 0. Более высокая монопольная цена в течение периода 1 стимулировала бы выход Fordor на рынок и уменьшила бы прибыль Tudor за период 2 с монопольного уровня 25 до дуопольного уровня 3. Тем не менее выгода Tudor, полученная на протяжении периода 2 за счет установления низкой цены (стратегия «блефовать») и препятствования выходу Fordor на рынок (25 — 3 = 22), меньше издержек, чем в периоде 1, понесенных вследствие блефа и потери монопольной прибыли (25 — 0 = 25). При наличии малейшей положительной вероятности того, что в Tudor высокий уровень издержек, преимущества от выбора стратегии «поступить честно» превзойдут преимущества от стратегии «блефовать», даже если компания Fordor применит стратегию «в зависимости от обстоятельств».
Если бы низкая цена была не настолько низкой, то при наличии высоких издержек Tudor пошла бы на меньшие жертвы, имитируя тип компании с низкими издержками. Ниже мы проанализируем именно эту возможность.
В. Объединяющее равновесие
Давайте представим, что более низкие издержки производства в Tudor составляют 10 на один автомобиль, а не 5. При таком изменении их уровня компания Tudor, в которой на самом деле высокие издержки, по-прежнему заработает прибыль 25 в случае монополии, если изменит цену 20, обеспечивающую максимальную прибыль. Но теперь Tudor как компания с низким уровнем издержек установит цену 17,5 в качестве монополиста (вместо 15) и заработает прибыль 56. Если компания с высоким уровнем издержек будет имитировать их низкий уровень и тоже установит цену 17,5, ее прибыль составит 19, а не 0, как в предыдущем примере; в таком случае потеря прибыли в результате блефа гораздо меньше: 25 − 19 = 6, а не 25. Если Fordor выйдет на рынок, то прибыль двух компаний в их игре в дуополию составит 3 для Tudor и 45 для Fordor, если в Tudor высокий уровень издержек (как в предыдущем разделе). В дуополии прибыль каждой компании теперь равна 25, если в Tudor низкий уровень издержек; в этой ситуации у Fordor и у Tudor с низким уровнем издержек будет одинаковый уровень затрат на единицу продукции в размере 10.
Теперь предположим, что Tudor относится к типу компаний с низким уровнем издержек с вероятностью 40 % (0,4), а убеждение Fordor в отношении вероятности низких издержек в Tudor верно. Новое дерево игры изображено на рис. 8.9. Поскольку Fordor все так же выберет вариант «выйти на рынок», если Tudor установит высокую цену, ситуация снова будет сведена к игре, в которой у каждого игрока есть ровно две исчерпывающие стратегии и они те же, что и в . Таблица выигрышей для нормальной формы игры представлена на рис. 8.10.
Рис. 8.9. Экстенсивная форма игры «выход на рынок»: в Tudor низкий уровень издержек — 10