Это представление основных идей и понятий теории игр, необходимое для понимания проблем, обсуждающихся в данной книге, предназначено для читателей, которые до сих пор не были знакомы с теорией игр.
Теоретико-игровой анализ начинается со спецификации правил игры. Эти правила определяют тех, кто принимает решения (игроков), их возможные действия, имеющуюся у них информацию, распределения вероятностей по случайным событиям и предпочтения каждого из игроков относительно исходов, в частности, набор всех возможных комбинаций действий игроков. Игра определяется комбинацией множества игроков, множества действий (которое определяет действия каждого из игроков) и множества выигрышей (которое определяет выигрыши каждого игрока как производную от действий, предпринятых всеми игроками). Предполагается, что правила игры общеизвестны. Рассматриваемые ситуации являются стратегическими в том смысле, что оптимальная стратегия каждого игрока зависит от действий других игроков. (Нестратегические ситуации образуют отдельный случай.)
Цель теоретико-игрового анализа – предсказать поведение в стратегических ситуациях, – предсказать комбинацию действий (для каждого игрока) для любых данных правил игры. Трудность в нахождении таких решений связана с тем, что поскольку действие, оптимальное для каждого игрока, зависит от действий других, ни один игрок не может выбрать свои действия независимо от того, что выберут другие игроки. Для того чтобы игрок А выбрал поведение, он должен знать, что сделает В, но чтобы В выбрал поведение, он должен знать, что сделает А. В классической теории игр концепции равновесия Нэша и его усовершенствований, например, совершенное по подыграм равновесия, смягчают эту проблему бесконечного цикла и устраняют некоторые комбинации действий как неправдоподобные в данной игре.
Основная идея ограничения Нэша состоит не в том, чтобы рассмотреть динамическую проблему выбора поведения, а в том, чтобы рассмотреть поведение, которое образует решение проблемы выбора поведения. Равновесия Нэша ограничивают допустимые решения (комбинации действий) теми, которые являются самоподдерживающимися: если каждый индивид ожидает, что другие будут вести себя так, как от них этого ожидают, он сочтет оптимальным придерживаться того поведения, которое от него ожидают.
Чтобы не усложнять рассуждение, я сосредоточусь, без потери общности, на играх с двумя игроками, хотя анализ будет применим также и к большему количеству игроков. В разделах А.1 и А.2 рассматриваются статические игры, в которых игроки делают ходы одновременно, и динамические игры, в которых игроки делают ходы последовательно. В разделе А.3 обсуждается теория повторяющихся игр, рассматривающая ситуации, в которых отдельная стадия игры, статической или динамической, повторяется во времени. Знание игр с неполной информацией, в которых игроки обладают разной информацией относительно аспектов структуры игры, не имеет значения для чтения данной книги. Краткое обсуждение таких игр дано в главе III и в Приложении В (раздел В. 1). В главе V обсуждается теория обучения в играх, а в разделе В.2.7 – несовершенный мониторинг.
А.1. Самоподдерживающееся поведение в статических играх: равновесие Нэша
Рассмотрим сначала статические игры (или игры с одновременными ходами) – игры, в которых все игроки совершают действия одновременно. Предположим, что все игроки обладают одной и той же информацией о ситуации. Такие игры имеют следующую структуру: игрок 1 выбирает действие а1 из множества осуществимых действий А1. Одновременно игрок 2 выбирает действие а 2 из множества осуществимых действий А2. После того как игроки выбирают свои действия, они получают следующие выигрыши: u 1 (a 1 , a2) в случае игрока 1 и u2(a1, a2) в случае игрока 2.
РИС. А.1. Игра «Дилемма заключенного»
Возможно, наиболее известной и лучше всего исследованной из статических игр является «Дилемма заключенного». Она обязана своей широкой известностью тому обстоятельству, что показывает: в стратегических ситуациях для достижения Паретооптимального результата одной рациональности недостаточно. В отличие от рыночных, в стратегических ситуациях желание улучшить свою судьбу необязательно ведет к максимизации социального благосостояния. В «Дилемме заключенного» каждый игрок может либо сотрудничать с другим, либо предать. Если оба будут сотрудничать, выигрыш каждого игрока будет выше, чем если оба будут предавать. Но если один сотрудничает, а другой уклоняется, выигрывает тот, кто предает, получая более высокий выигрыш, чем когда сотрудничают оба. При этом тот, кто сотрудничает, получает более низкий выигрыш, чем он мог бы получить, предав.
На рис. А.1 представлен частный случай дилеммы заключенного. Действия игроков обозначаются как С (сотрудничать) и П (предать). Каждая ячейка соответствует комбинации действий или паре действий. Выигрыши, ассоциирующиеся с каждой комбинацией действий, представлены двумя числами – выигрыш для игрока 1 и для игрока 2.
В этой игре лучшая стратегия для каждого игрока – предать. Игрок 1 не может ожидать от игрока 2, что тот будет играть С, потому что, независимо от того что делает игрок 1, игроку 2 будет лучше, если он сыграет П. Если игрок 1 играет С, тогда игрок 2 зарабатывает 1, сыграв С, и 5, сыграв П. Если игрок 1 сыграет П, тогда игрок 2 зарабатывает -15, сыграв С, и только -8, сыграв П. На языке теории игр уклонение от сотрудничества является доминантной стратегией каждого игрока: это лучшее, что он может сделать, независимо от того, что сделают другие игроки. Следовательно, комбинации действий (П, П) будут придерживаться, если игра охватывает все аспекты ситуации.
В частном случае дилеммы заключенного ожидания, касающиеся поведения другого игрока, не имеют значения при выборе действия. Ход П – это лучшее, что можно сделать, независимо от выбора другого игрока. Но в стратегических ситуациях в целом оптимальный выбор действия для игрока зависит от выбора другого игрока.
РИС. А.2. Игра «Движение по дороге»
Рассмотрим игру «Движение по дороге» на рис. А.2. Эта игра представляет ситуацию, в которой два водителя направляются друг к другу. Оба игрока могут выбрать – по левой или по правой стороне дороги ехать. Если они оба выбирают одну и ту же сторону, столкновения удается избежать и каждый получает выигрыш, равный 2. Если они выбирают противоположные стороны (правую, левую) или (левую, правую), они сталкиваются и выигрыш каждого составляет 0.
В этой игре ситуация стратегическая: лучшее действие для одного игрока зависит от действия другого. Если игрок 1, как ожидается, выберет левую сторону, оптимальная реакция игрока 2 – тоже выбрать левую, тем самым получив 2 вместо 0, если он выберет правую сторону. Но если ожидается, что игрок 1 выберет правую сторону, игроку 2 тоже выгоднее выбирать ее же. Оптимальный выбор игрока 2 зависит от фактического выбора игрока 1. Но то же самое верно и для игрока 1. Поскольку выбор действий каждым игроком зависит от выбора другого, ни один из них не может выбрать действие.
Такая взаимосвязанность решений подразумевает, что мы не можем выяснить, что сделают игроки, изучая поведение каждого из них по отдельности, как мы делали в игре «Дилемма заключенного». Изобретательность концепции равновесия Нэша состоит в том, что вместо того, чтобы пытаться выяснить, что будут делать игроки, изучая их процесс принятия решений, мы устанавливаем возможные исходы, рассматривая, каким исходам, если они являются ожидаемыми, будут следовать.
Предположим, общеизвестно, что оба игрока придерживаются одних и тех же ожиданий касательно того, как будет идти игра. Какие у них могут быть ожидания относительно поведения? Они могут ожидать, что игроки станут следовать, только cамоподдерживающемуся поведению. Поведение является самоподдерживающимся в том случае, когда игроки ожидают, что ему будут следовать, и действительно ему следуют, потому что каждый игрок считает это действие оптимальным, ожидая, что другие будут делать то же самое. Комбинация действий (часто называемая комбинацией стратегий), отвечающая этому условию, называется равновесием Нэша. Равновесие Нэша отвечает условию взаимной лучшей реакции: лучшая реакция каждого игрока на его правильные убеждения, касающиеся поведения других, состоит в том, чтобы следовать поведению, которого от него ожидают.
РИС. А.3. Игра «Орлянка»
Чтобы показать, что не любое поведение отвечает этому условию, рассмотрим такое поведение, которому не следуют, когда его ожидают. В игре «Движение по дороге» это происходит по отношению к комбинации действий (право, лево). Такой комбинации не следовали бы, если бы каждый из игроков ожидал, что другой выберет именно ее. Если игрок 2 ожидает, что игрок 1 поедет по правой стороне, его лучшим ответом будет поехать по правой стороне, получив 2 вместо 0. Следовательно, игрок 1 не может придерживаться убеждения, что игрок 2 в этом случае поедет по левой стороне. Таким же образом мы можем продолжить рассматривать, являются ли различные комбинации действий самоподдерживающимися. Этот анализ демонстрирует, что в игре «Движение по дороге» существуют два равновесия Нэша (лево, лево) и (право, право). Если, например, ожидается комбинация (лево, лево), оба игрока сочтут оптимальным ехать по левой стороне, потому что при ожидании такого действия от другого это будет наилучшим ответом. Действительно, каждое из этих равновесий Нэша преобладает в разных странах. Этот анализ также показывает, что в игре может быть несколько равновесий Нэша.
В некоторых играх нет комбинации действий, которая удовлетворяла бы условию Нэша. Рассмотрим игру «Орлянка» на рис. А.3. Каждый из двух игроков одновременно выбирает либо орла, либо решку. Если их выбор не совпадет, игрок 2 проигрывает, получив -1, тогда как игрок 1 получает 1. Если они совпадут, игрок 1 проигрывает, получив -1, а игрок 2 получает 1. В этой игре, согласно определению, нет равновесия Нэша. Такое отсутствие равновесия отражает то, что эта игра рисует ситуацию, в которой каждый игрок пытается угадать действия другого игрока. Если игрок 1 ожидает, что игрок 2 выберет орла, наилучшим ответом с его стороны будет выбрать решку. Но если игрок 2 ожидает, что игрок 1 выберет решку, его наилучшим ответом будет выбрать решку. Если 1 ожидает, что 2 выберет решку, его наилучший ответ – выбрать орла. Если 2 ожидает, что 1 выберет орла, его наилучшим ответом будет также выбрать орла, и цикл начнется снова.
Вполне разумно, что в таких ситуациях ожидания людей относительно поведения будут вероятностными по своей природе. Люди начнут ожидать, что другие будут выбирать то орла, то решку. Теория игр также определяет равновесие Нэша в таких случаях. Для этого действия в множестве действий игрока (A) называются чистыми стратегиями, и определяется смешанная стратегия как распределение вероятностей по чистым стратегиям игрока. Тогда мы можем решить так называемые равновесия Нэша со смешанной стратегией. В игре «Орлянка» и в игре «Движение по дороге», например, разыгрывание каждого действия с вероятностью 0,5 для каждого игрока является равновесием Нэша со смешанной стратегией.
Любая игра с конечным количеством игроков, каждый из которых имеет ограниченное количество чистых стратегий, имеет равновесие Нэша, хотя возможно и в смешанных стратегиях. Путем ограничения комбинаций стратегий (т. е. планов поведения) теми, что являются самоподдерживающимися в смысле равновесия Нэша, теория игр ограничивает спектр допустимого поведения в таких играх.
Хотя описанные здесь ситуации очень просты, тот же самый анализ может быть применен к более сложным случаям, в которых игроки производят ходы последовательно и в которых существует информационная асимметрия или неопределенность. Понятия равновесия, используемые применительно к таким ситуациям, как правило, являются усовершенствованиями равновесия Нэша, т. е. равновесиями Нэша, удовлетворяющими некоторым дополнительным условиям. Последующее обсуждение динамических игр иллюстрирует природу таких усовершенствований и полезность наложения дальнейших ограничений на допустимое самоподдерживающееся поведение.
А.2. Самоподдерживающееся поведение в динамических играх: обратная индукция и совершенные по подыграм равновесия
Рассмотрим динамическую ситуацию, в которой игроки делают ходы последовательно, а не одновременно. Динамические игры легче представлять в расширенной (древовидный график), а не в нормальной (матричной) форме, используемой в рис. А.1–3. В расширенной форме игра представляется в виде графа или древа, в котором каждое ответвление – точка принятия решения для игрока, а каждая ветвь ассоциируется с отдельным действием. Выигрыши, ассоциирующиеся с различными действиями, приводятся в конце древа.
Хотя в динамических играх может быть множество ветвей и поворотных точек, их базовую структуру можно проиллюстрировать на примере игры с двумя точками принятия решений. В этой игре игрок 1 выбирает действие а1 из множества осуществимых решений А1. Наблюдая за выбором игрока 1, игрок 2 выбирает действие а 2 из множества осуществимых решений А2. После того как игроки выбрали свои действия, они получают выигрыши u 1 (a 1 , a2) для игрока 1 и u2(a1, a2) для игрока 2.
РИС. А.4. Игра «Односторонняя дилемма заключенного»
Примером динамической игры с такой структурой является односторонняя дилемма заключенного (рис. А.4). Сначала игрок 1 выбирает, сотрудничать или нет. Если он выбирает отказ от сотрудничества, игра заканчивается и выигрыши игроков составляют (0,5; 0). Если игрок 1 выбирает сотрудничество, игрок 2 может выбрать какое-либо действие. Если он решает сотрудничать, выигрыши обоих игроков равны 1, но если он решает смошенничать, он получает больший выигрыш, 2, тогда как игрок 1 получает 0. В этой игре игроку 1 сотрудничество выгодно, но только если игрок 2 тоже сотрудничает. Если игрок 2 мошенничает, игрок получает меньший выигрыш, чем в случае, если бы он отказался от сотрудничества.
Динамические игры, такие как «Односторонняя дилемма заключенного», представляют интерес для социальных наук, потому что они передают главное в отношениях обмена – личных, социальных, экономических и политических. Обмен всегда является последовательным: между quid и quo всегда проходит некоторое время [Greif, 1997a; 2000]. Говоря обобщенно, в социальных отношениях прежде, чем что-то получить, приходится давать, и в тот момент, когда ты что-то отдаешь, ты получаешь лишь обещание получить что-то в будущем.
Может ли игрок 1 поверить в то, что игрок 2 будет сотрудничать? Чтобы это выяснить, мы должны пойти обратно по древу игры, изучив оптимальное действие игрока, предположительно делающего ходы в каждой точке принятия решения. Такой метод известен как обратная индукция.
РИС. А.5. Односторонняя игра «Дилемма заключенного» в матричной форме
Рассмотрим решение игрока 2. Его выигрыш составляет 2, если мошенничает, и 1, если сотрудничает, из чего следует, что мошенничество является для него оптимальным выбором. Ожидая этого, игрок 1 выберет отказ от сотрудничества и получит 0,5, вместо того чтобы сотрудничать и получить 0. (Эти ветви выделены жирным в графике древа игры на рис. А.4.) Данная комбинация действий является самоподдерживающейся, потому что наилучшим ответом на отказ от сотрудничества является мошенничество. Обратная индукция открывает самоподдерживающуюся комбинацию действий – не сотрудничать, мошенничать. Такая комбинация действий является равновесием Нэша.
Как указывает этот анализ, равновесие Нэша может быть парето-худшим. Выигрыши, связанные со стратегией (сотрудничать, сотрудничать) выгоднее для обоих игроков, чем если игрок 1 отказывается от сотрудничества; таким образом, кооперация является выгодной и эффективной. Но если игрок 1 сотрудничает, выигрыш игрока 2 от мошенничества выше, чем выигрыш от сотрудничества. Сотрудничество не является самоподдерживающимся.
В односторонней дилемме заключенного обратная индукция дает единственное равновесие Нэша. Это легко увидеть, если мы представим игру в матричной форме (рис. А.5). В матричной форме игрок 1 выбирает между сотрудничеством и отказом от него, тогда как игрок 2 выбирает между сотрудничеством и мошенничеством. Связанные с каждым действием выигрыши – те же самые, что на рис. А.4. Исход с равновесием Нэша выделен жирным шрифтом.
Когда обратная индукция возможна, это ведет к таким комбинациям действий, которые являются равновесием Нэша, но обратное неверно. Если мы представим расширенную (древовидную) форму в соответствующей матричной (нормальной) форме, не каждое равновесие Нэша в матричной форме игры может быть достигнуто через обратную индукцию в исходной древовидной форме. Это происходит потому, что анализ игры в древовидной форме при помощи обратной индукции передает тот факт, что игроки делают ходы последовательно, а это не передается в матричной форме представления игры. То, что древовидная форма передает больше информации о структуре игры, позволяет нам исключить некоторые равновесия Нэша, которые мы не можем устранить в нормальной форме. В частности, мы можем исключить равновесия Нэша, основывающиеся на недостоверных угрозах или обещаниях. Древовидное представление, таким образом, способствует дедуктивному ограничению – уточнению – множества допустимых вариантов самоподдерживающегося поведения.
Для того чтобы увидеть преимущество обратной индукции, рассмотрим следующие древовидные и матричные представления одной и той же игры (рис. А.6). В этой игре игрок 1 выбирает между левой (Л) и правой (П) стороной, тогда как игрок 2, который ходит вторым, выбирает между верхом (В) и низом (Н). Если игрок 1 сыграет Л, его выигрыш составит 1, а игрок 2 выиграет 2. Если игрок 1 сыграет П, а игрок 2 сыграет Н, то выигрыши составят (2, 1), но если игрок 2 сыграет В, то выигрыши составят (0, 0). Анализ этой игры показывает, как обратная индукция устраняет равновесие Нэша, основанное на недостоверных угрозах.
РИС. А.6. Устранение равновесия Нэша, основанного на недостоверных угрозах
Матричная форма представления этой игры показывает два равновесия Нэша: (Л, В) с выигрышами (1, 2) и (П, Н) с выигрышами (2, 1). Обратная индукция дает только (П, Н). (Л, В) не выводится путем обратной индукции, потому что основывается на недостоверной угрозе, которую скрывает нормальная форма представления. При этом равновесии игрок 1 мотивирован выбирать Л, потому что игрок 2, как предполагается, сыграет В, тогда как наилучшим ответом игрока 2 на выбор игроком 1 Л было бы В. Учитывая, что игрок 1 выбирает Л, выигрыш игрока 2 в действительности не зависит от выбора между В и Н, потому что, учитывая, что игрок 1 выбрал Л, ни одно из этих действий предпринято не будет. Отсюда следует, что равновесие (Л, В) зависит от недостоверной угрозы, лежащей вне равновесной траектории, т. е. основывается на том, что игрок 2 будет действовать в ситуации, которая никогда бы не произошла, если бы игроки играли в соответствии с этой комбинацией действий. Если бы у игрока 2 действительно возникла потребность, чтобы такое действие совершилось, он не счел бы такое поведение оптимальном. Обратная индукция позволяет нам выявить блеф игрока 2 и соответственно ограничить множество вариантов допустимого самоподдерживающегося поведения. Если игрок 1 играет П и, следовательно, выбор игрока 2 влияет на выигрыши, то оптимальным для игрока 2 будет сыграть Н и получить 1 (вместо того чтобы сыграть В и получить 0). Обратная индукция показывает, что игрок 1, предвосхищая такой ответ, выбрал бы П и получил 2 вместо того, чтобы выбрать Л и получить 1.
Обратная индукция может применяться к любой динамической игре с закрытым горизонтом и совершенной информацией. В таких играх игроки делают ходы последовательно, и все предыдущие ходы становятся общеизвестными прежде, чем будет выбрано следующее действие. В других играх, например в динамических играх с одновременными ходами или при бесконечном горизонте, мы не можем применять обратную индукцию напрямую. Тем не менее понятие совершенного по подыграм равновесия позволяет ограничить множество допустимых равновесий Нэша, устранив те из них, которые полагаются на недостоверные угрозы или обещания. В тех случаях, когда может быть применена обратная индукция, получаемое в результате равновесие Нэша оказывается совершенным по подыграм равновесием: оно представляет собой усовершенствование равновесия Нэша в том смысле, что это равновесие Нэша, удовлетворяющее дополнительному условию.
Для того чтобы лучше понять концепцию совершенного по подыграм равновесия, заметим, что в представленных здесь примерах комбинации действий, полученные благодаря обратной индукции, удовлетворяют требованию взаимного наилучшего ответа для равновесия Нэша. Оно также удовлетворяет требованию того, чтобы действие игрока 2 было оптимальным в игре, которая началась, когда ему приходилось выбирать действие. Начиная с этой точки принятия решения, обратная индукция ограничивает допустимое множество действий игрока 2 оптимальными действиями.
Однако в динамических играх с одновременными ходами мы, как правило, не можем следовать этой процедуре, потому что оптимальное действие зависит от действия другого игрока. Чтобы понять, почему данное условие ограничивает использование обратной индукции, рассмотрим следующую игру, представленную в расширенной и в нормальной форме (рис. А.7). Игрок 1 первым делает ход, выбирая между А и В. Если игрок 1 выбирает В, игра заканчивается и выигрыши составляют (2, 6). Если игрок 1 выбирает А, оба игрока играют в игру с одновременными ходами, представленными в матрице 2–2. К игре 2–2, которая следует за выбором А игроком 1, не может быть применена обратная индукция с рассмотрением оптимальных ходов либо игрока 1, либо игрока 2.
Иными словами, ни один игрок не делает ход последним, как это происходит в игре с последовательными ходами.
РИС. А.7. Совершенное по подыграм равновесие
Однако мы по-прежнему можем следовать логике процедуры обратной индукции с нахождением равновесия Нэша в играх 2–2 и рассмотрением оптимального выбора игрока 1 между А и В, принимая во внимание этот исход равновесия Нэша. Равновесием Нэша в игре 2–2 является комбинация (C, E), которая дает выигрыши (3, 4). Оптимальным выбором между А и В для игрока 1 является, таким образом, А. Комбинация действий, которую дает эта процедура, – (AC, E), т. е. совершенное по подыгре равновесие. Чтобы увидеть, что эта процедура устраняет равновесие Нэша, основанное на недостоверных угрозах, отметим, что в игре есть три равновесия Нэша: (AC, E), (BC, F) и (BD, F). (BC, F) и (BD, F) дают выигрыши (2, 6), что менее выгодно для игрока 1 и более выгодно для игрока 2, чем совершенное по подыгре равновесие (AC, E). Оба эти равновесия, однако, основываются на недостоверных угрозах, лежащих вне траектории игры. Рассмотрим (BC, F). Если брать игру как целое, выбор С или F не влияет на выигрыши, потому что эти действия лежат вне траектории игры. Но если на самом деле возникнет потребность предпринять такие действия, они не станут взаимным наилучшим ответом. Если игрок 2 выбирает F, лучший ответ игрока 1 – D, а не C, который дает игроку 1 выигрыш в 2 вместо 1. Подобным образом в (BD, F), если игрок 1 выбирает D, лучший ответ игрока 2 – E вместо F, что дает ему выигрыш в 1 вместо 0.
Понятие совершенного по подыграм равновесия использует идею наилучшего взаимного ответа, которая составляет суть равновесия Нэша, применительно к подыграм. Интуитивно понятно, что подыгра – это часть первоначальной игры, которую еще предстоит сыграть, но подыгра начинается только в те моменты, когда полная история того, как уже разыгрывалась данная игра, известна всем игрокам. Равновесие Нэша (в игре в целом) является совершенным по подыгре равновесием, если стратегии игроков образуют равновесие Нэша в каждой подыгре. Каждая конечная игра имеет совершенное по подыгре равновесие.
А.3. Самоподдерживающееся поведение в повторяющихся играх: совершенные по подыграм равновесия, «народная» теорема и несовершенный мониторинг
До сих пор мы изучали игры, в которых игроки взаимодействуют только один раз. Однако институциональный анализ занимается повторяющимися ситуациями, в которых индивиды взаимодействуют во времени. Один из способов изучения таких ситуаций – использование динамических игр с более сложными древами игр. Подмножество таких игр – повторяющиеся игры, – как выяснилось, особенно хорошо поддается формальному анализу и полезно для институционального анализа (глава VI).
Теория повторяющихся игр изучает ситуации, в которых одна и та же (динамическая или статическая) игра (например, «Дилемма заключенного» или «Односторонняя дилемма заключенного») повторяется во время каждого периода. В конце каждого периода выигрыши распределяются, может открыться новая информация, и та же самая стадия игры повторяется снова. Будущие выигрыши дисконтируются (коэффициент дисконтирования часто обозначается как б). История в повторяющейся игре – это множество действий, совершенных в прошлом; стратегия определяет комбинацию действий на каждой стадии игры в соответствии с любой возможной историей. Комбинация стратегий определяет стратегию для каждого игрока.
Для изучения самоподдерживающегося поведения в таких играх предположим, что повторяющаяся базовая игра – это «Дилемма заключенного», представленная на рис. А.1. Если эта базовая игра повторяется только один раз, то единственное совершенное по подыгре равновесие – это (предательство, предательство); (сотрудничество, сотрудничество) не образует равновесия. Сравнимое совершенное по подыгре равновесие в повторяющейся игре заключается в том, что после каждой истории оба игрока всегда предают. Такое равновесие также является единственным равновесием, если игра повторяется конечное число раз. Причины этого и предполагаемые важные следствия для институционального анализа обсуждаются в Приложении В, раздел В.2.1. Здесь же мы рассматриваем ситуации, в которых стадийная игра повторяется бесконечное число периодов.
Когда базовая игра повторяется бесконечно, предшествующая стратегия по-прежнему является совершенным по подыгре равновесием. Наилучший ответ каждого игрока на эту стратегию – всегда предавать. Но возможны и другие равновесия. Рассмотрим, например, следующую стратегию для каждого игрока. В первом периоде – сотрудничать. Затем сотрудничать, только если всеми ходами во всех прежних периодах были (сотрудничество, сотрудничество); в противном случае – предавать. Стратегия каждого игрока, таким образом, требует инициирующего обмена в первом периоде и сотрудничества до тех пор, пока другой сотрудничает. Она не требует сотрудничества, если любой из игроков когда-либо уклонялся от него. Такая угроза навсегда прекратить сотрудничество является достоверной, потому что (предательство, предательство) – это равновесие.
Достоверная угроза такой стратегии-триггера может мотивировать игроков к сотрудничеству, если они достаточно терпеливы. Стратегия подразумевает, что игроку нужно выбирать между настоящими и будущими выигрышами. Предательство подразумевает относительно большой мгновенный выигрыш (5 очков в игре, представленной на рис. А.1), потому что второй игрок сотрудничает. Но это действие подразумевает потерю будущих выигрышей от сотрудничества, потому что вслед за предательством оба игрока всегда будут предавать (и, следовательно, каждый будет получать -8). Чистая приведенная стоимость следования стратегии-триггеру составляет 1/(1 – б). Отступление от нее предполагает получение одноразового выигрыша в 5 очков, за которым последует получение -8 в каждом последующем периоде. Это дает чистую дисконтиованную ценность 5 – б /(1 – б), которая снижается по мере роста коэффициентов дисконтирования у игроков: если игроки в достаточной мере терпеливы (если они достаточно высоко ценят будущую выгоду), предшествующая стратегия является равновесием.
Одна из самых полезных особенностей повторяющейся теории игр заключается в следующем: установить, что определенная комбинация стратегий является совершенным по подыгре равновесием, зачастую бывает проще, чем установить, что стратегия является равновесием Нэша. Грубо говоря, в любой повторяющейся игре комбинация стратегий – совершенное по подыгре равновесие, если ни одному из игроков невыгодно однократное отступление после любой истории. Другими словами, чтобы проверить, является ли определенная комбинация стратегий совершенным по подыгре равновесием, достаточно установить, что после любой истории – любой последовательности действий, которая может возникнуть при этой стратегии, – ни один игрок не может выиграть от однократного отклонения, после которого он вернется к следованию той же самой стратегии.
В стратегических динамических ситуациях часто существует множественное равновесие. «Народная» теорема о повторяющихся играх гласит, что в бесконечно повторяющихся играх обычно есть бесконечное число совершенных по подыграм равновесий. При данных правилах игры может существовать более одной формы поведения в качестве исхода равновесия, а в динамических играх с большим множеством действий это еще более вероятно.
Открывая существование множественных равновесий, теория игр поднимает проблему выбора равновесия. В литературе по теории игр предлагались усовершенствования концепции равновесия Нэша, дедуктивно ограничивающие множество допустимых исходов. Совершенное по подыгре является одним из таких ограничений. Но до сих пор теория игр не смогла предложить подходящее дедуктивное усовершенствование для бесконечно повторяющихся игр, ведущее к единственному равновесию [Van Damme, 1983, 1987; Fudenberg, Tirole, 1991].