Стратегические игры

Диксит Авинаш

Скит Сьюзан

Рейли-младший Дэвид

Часть III. Большие классы игр и стратегий

 

 

Глава 8. Неопределенность и информация

 

* * *

В мы уже упоминали о различных способах возникновения в игре неопределенности (внешняя и стратегическая) и о том, что игроки могут располагать ограниченной информацией (несовершенной и неполной, симметричной и асимметричной) о разных аспектах игры: с некоторыми из них мы уже сталкивались и анализировали. В частности, в играх с одновременными ходами присутствует стратегическая неопределенность, поскольку каждый игрок не знает, какие действия предпринимает другой игрок. В мы говорили о том, что стратегическая неопределенность порождает асимметричную и несовершенную информацию, потому что различные действия, предпринимаемые одним игроком, необходимо объединить в одно информационное множество другого игрока. В и мы рассказывали, как решить проблему стратегической неопределенности посредством формирования у каждого игрока определенных убеждений в отношении действий другого игрока (в том числе убеждений о вероятности выполнения различных действий в случае использования смешанной стратегии) и применения концепции равновесия Нэша, в котором эти убеждения находят подтверждение. В данной главе мы сфокусируемся на других способах возникновения неопределенности и информационных ограничений в играх.

Начнем с анализа различных стратегий, позволяющих отдельным людям и обществам в целом справляться с несовершенством информации, возникающим в результате внешней неопределенности или риска. Напомним, что внешняя неопределенность обусловлена причинами, неподконтрольными игрокам, но при этом влияющими на их выигрыши; погода — один из простых примеров. Мы представим вам ряд базовых идей, лежащих в основе диверсификации или распределения риска отдельным игроком или объединения рисков несколькими игроками. Эти стратегии способны принести пользу всем игрокам, хотя распределение общего выигрыша между участниками может быть неравномерным, из-за чего в ситуациях такого рода наблюдается смешение общих интересов и конфликта.

Далее рассмотрим информационные ограничения в ситуациях со стратегической взаимозависимостью. Информация в игре считается полной только тогда, когда все правила игры (стратегии игроков и выигрыши каждого из них как функции стратегий всех игроков) полностью известны всем игрокам и, более того, являются их общим знанием. При столь строгом стандарте в большинстве игр присутствует неполная информация. Кроме того, зачастую неполнота информации асимметрична: каждый игрок знает собственные возможности и выигрыши гораздо лучше, чем возможности других игроков. Как отмечалось в , манипулирование информацией — важный аспект стратегий в таких играх. В этой главе мы обсудим, когда информацию можно или нельзя передать в устной форме достоверным способом. Кроме того, проанализируем другие стратегии, предназначенные для передачи или сокрытия игроком своей информации, а также ее получения от другого игрока. В и вкратце анализировались некоторые из таких стратегий (скрининг и сигнализация), сейчас же мы остановимся на них более подробно.

Безусловно, участники многих игр хотели бы иметь возможность манипулировать действиями других игроков. Руководители хотели бы, чтобы подчиненные усердно трудились и качественно выполняли свою работу; страховые компании хотели бы, чтобы держатели страховых полисов проявляли осторожность, чтобы снизить страховой риск. Если бы информация была совершенной, действия игроков поддавались бы наблюдению. Оплату труда сотрудников можно было бы поставить в зависимость от качества и количества их усилий; страховое возмещение держателям страховых полисов можно было бы выплачивать только в случае, если они предпринимают необходимые меры предосторожности. Но в действительности все эти действия трудно отслеживать, что создает ситуацию с несовершенной асимметричной информацией, обычно обозначаемую термином моральный риск. В связи с этим участники таких игр вынуждены изобретать различные непрямые способы создания стимулов, позволяющих влиять на действия других игроков в нужном направлении.

Исследования по теме информации и манипулирования ею в играх очень активизировались в последние десятилетия и пролили свет на многие ранее не совсем понятные аспекты экономики, в частности природу стимулирующих контрактов, организационную структуру компаний, рынки труда и товаров длительного пользования, государственное регулирование бизнеса и множество других аспектов. Не так давно политологи применили эти же концепции для объяснения зависимости изменений в налоговой и бюджетной политике от выборов, а также делегирования законодательных полномочий комитетам. Эти идеи распространились и в биологии, где эволюционная теория игр рассматривает такие отличительные характеристики, как большой невероятно красивый хвост павлина в качестве сигнала. Пожалуй, еще более важно, чтобы вы поняли, насколько значимы скрининг и сигнализирование в вашем повседневном взаимодействии с членами семьи, друзьями, учителями, коллегами и прочими людьми, что позволит вам совершенствовать свои стратегии в подобных играх.

Хотя изучение информации явно выходит за рамки анализа внешней неопределенности и базовых концепций сигнализирования и скрининга, тем не менее мы сфокусируемся в данной главе только на этих темах. К анализу информации и манипулирования ею мы вернемся в , где используем описанные в данной главе методы для разработки механизмов создания стимулов и получения конфиденциальной информации от других игроков.

 

1. Несовершенная информация: преодоление риска

Представьте, что вы фермер и ваша работа зависит от прихотей погоды. Если погода способствует хорошему урожаю, вы получите доход 160 000 долларов. Если сложатся неблагоприятные метеорологические условия, ваш доход составит всего 40 000 долларов. Эти две возможности в равной степени вероятны (вероятность каждой из них: 1/2, или 0,5, или 50 %). Следовательно, ваш средний, или ожидаемый, доход равен 100 000 долларов 100 000 = 1/2 × 160 000 + 1/2 × 40 000, однако это среднее значение сопряжено со значительным риском.

Что вы можете сделать, чтобы уменьшить имеющийся риск? Попробовать выращивать культуру, которая менее подвержена капризам погоды. Но предположим, что вы уже сделали все от вас зависящее. В таком случае вы могли бы попытаться снизить риск еще больше, предложив кому-то принять на себя его часть. Безусловно, в обмен вам придется что-то этому человеку дать. Такой равноценный обмен обычно принимает две формы: денежный платеж или взаимный обмен либо разделение риска.

А. Разделение риска

Сначала проанализируем возможность взаимовыгодного разделения риска. Предположим, ваш приятель сталкивается с аналогичным риском, но в то время, когда у вас плохая погода, на его ферме погода хорошая и наоборот. (Допустим, вы живете на противоположных концах острова и дождевые облака приходят либо на одну, либо на другую его сторону, но не на обе сразу.) Корреляция — это зависимость между двумя любыми неопределенными величинами (в данном примере между риском одного фермера и риском другого). Следовательно, можно сказать, что между риском вашего приятеля и вашим риском существует полная отрицательная корреляция. Ваш с приятелем совокупный доход составляет 200 000 долларов, какой бы ни была погода, то есть он совершенно безрисковый. Вы можете заключить между собой контракт, по условиям которого каждый из вас получит гарантированных 100 000 долларов: вы обещаете выплачивать приятелю 60 000 долларов в те годы, когда вам сопутствует удача, а он — в те годы, когда ему сопутствует удача. Объединив свои риски, вы их устраняете.

Валютные свопы — еще один показательный пример отрицательной корреляции рисков в реальной жизни. Американская компания, экспортирующая продукцию в Европу, получает доход в евро, но ее интересует прибыль в долларах, зависящая от колебаний обменного курса евро — доллар. Со своей стороны, европейская компания, экспортирующая продукцию в США, сталкивается с аналогичной неопределенностью в отношении прибыли, выраженной в евро. Когда курс евро по отношению к доллару падает, доход американской компании в евро составляет меньшую сумму в долларах, а долларовый доход европейской компании — более крупную сумму в евро. Когда курс евро по отношению к доллару повышается, складывается противоположная ситуация. Таким образом, колебания обменного курса создают отрицательно коррелированные риски для обеих компаний. Следовательно, обе могут их снизить, заключив контракт о соответствующем обмене доходами.

Даже при отсутствии отрицательной корреляции разделение рисков имеет свои преимущества. Вернемся к вашей роли фермера и допустим, что вы с приятелем сталкиваетесь с рисками, не зависящими друг от друга, как если бы тучи подбрасывали монету, чтобы решить, на какую сторону острова отправиться. В таком случае существуют четыре возможных исхода, каждый с вероятностью 1/4. Ваш с приятелем доход при этих четырех исходах представлен в левой части рис. 8.1. Но предположим, вы должны заключить контракт о разделении риска поровну; тогда ваш доход будет отображен в правой части рис. 8.1. Ваш средний (ожидаемый) доход в каждой таблице составляет 100 000 долларов, однако без договора о разделении риска каждый из вас получил бы 160 000 долларов, или 40 000 долларов с вероятностью 1/2 каждый. При наличии контракта вы оба получили бы по 160 000 долларов с вероятностью 1/4, по 100 000 долларов с вероятностью 1/2 и 40 000 долларов с вероятностью 1/4. Таким образом, контракт о разделении риска позволяет каждому из вас снизить вероятность двух крайних исходов с 1/2 до 1/4 и повысить вероятность среднего исхода с 0 до 1/2. Иными словами, контракт уменьшил риск каждого из вас.

Рис. 8.1. Разделение риска в связи с получением дохода

В действительности вы с приятелем можете уменьшать свои риски посредством их разделения при условии, что между вашими доходами нет полной положительной корреляции (то есть до тех пор, пока удача не улыбнется вам обоим). А группе более двух человек, риски которых в определенной мере независимы друг от друга, закон больших чисел позволяет еще сильнее снизить риск каждого участника. Именно так и поступают страховые компании: объединив подобные, но независимые риски многих людей, они могут выплатить страховое возмещение каждому, кто понесет существенные убытки. Этот же принцип лежит в основе диверсификации инвестиционного портфеля: вкладывая средства во много разных активов с разными типами и степенями риска, вы тем самым уменьшаете общий уровень подверженности риску.

Однако такие механизмы разделения рисков зависят от публичной наблюдаемости результатов и возможности контролировать выполнение условий контракта. В противном случае у каждого фермера возникает соблазн сделать вид, что ему не повезло, или просто нарушить условия договора о разделении риска, когда ему сопутствует удача. Точно так же страховая компания может безо всяких оснований отказать в выплате страхового возмещения, но желание сохранить репутацию может удержать ее от этого шага.

Теперь рассмотрим еще один вопрос. В обсуждении выше мы исходили из того, что разделение риска осуществляется в равных долях. Это кажется естественным, поскольку вы и ваш приятель-фермер находитесь в одинаковых ситуациях. Но у вас могут быть разные стратегические навыки и возможности, и один из вас умеет лучше вести переговоры и, соответственно, добиваться большего при заключении контрактов.

Для того чтобы это понять, мы должны признать, что фермеры стремятся заключать договоренности о разделении рисков по причине их нерасположенности к риску. Как объясняется в , отношение к риску можно определить путем использования нелинейной шкалы для перевода денежного дохода в показатели полезности. Функция квадратного корня — простой пример такой шкалы, отображающей нерасположенность к риску, и мы применим ее здесь.

Когда вы несете полный риск получения 160 000 долларов или 40 000 долларов с вероятностью 1/2 в каждом случае, ваша ожидаемая полезность (взвешенное по вероятности среднее) составляет

Безрисковый доход, обеспечивающий вам такую же полезность, — это число, квадратный корень которого равен 300, то есть 90 000 долларов, что меньше вашего среднего денежного дохода в размере 100 000 долларов. Разность в 10 000 долларов — максимальная сумма денег, которую вы будете готовы заплатить в качестве цены за полное устранение риска, которому подвержен ваш доход. Ваш приятель подвержен аналогичному риску, поэтому при использовании той же шкалы полезности он также будет готов заплатить эту же максимальную сумму за его полное устранение.

Рассмотрим ситуацию, когда между вашими рисками существует совершенная отрицательная корреляция и сумма вашего совокупного дохода составляет 200 000 долларов независимо от обстоятельств. Вы делаете приятелю следующее предложение: я заплачу тебе 90 001 — 40 000 = 50 001 доллар в случае неудачного года, а ты мне 160 000 — 90 001 = 69 999 долларов, когда у тебя будет урожайный год. В результате ваш приятель получит доход в размере 90 001 доллар как в неудачном, так и удачном году (160 000 — 69 999 долларов в первом случае и 40 000 + 50 001 доллар во втором). Он предпочтет эту ситуацию перспективе столкнуться с риском. Когда ему сопутствует удача, а вам — нет, у вас есть 40 000 долларов собственного дохода и вы получаете еще 69 999 долларов от приятеля, то есть ваш доход в сумме равен 109 999 долларов. Когда вашего приятеля постигает неудача, а у вас все будет хорошо, у вас есть 160 000 собственного дохода и после выплаты приятелю 50 001 доллара остается 109 999 долларов. Кроме того, вы устраняете свой риск. В итоге вы с приятелем оба выигрываете от сделки, но вы оставили за собой почти весь выигрыш.

Безусловно, приятель мог бы сделать вам встречное предложение. Кроме того, еще существует целый диапазон промежуточных предложений, подразумевающих более справедливое распределение выигрышей от разделения рисков. Какое из них одержит верх? Как мы увидим в , весь диапазон взаимовыгодных исходов разделения риска согласуется с границей эффективности переговоров в переговорной игре между игроками.

Б. Плата за снижение риска

Теперь рассмотрим возможность продажи рисков за деньги. Предположим, вы фермер, столкнувшийся с тем же риском, что и в предыдущем примере, но теперь ваш приятель имеет гарантированный доход в размере 100 000 долларов. Ваш риск увеличился, а приятель вообще не несет никакого риска. Возможно, он согласится принять на себя часть вашего риска по цене, приемлемой для вас обоих. Мы только что видели, что 10 000 долларов — максимальный «страховой взнос», который вы готовы выплатить за полное устранение риска. Примет ли ваш приятель эту сумму в качестве платы за устранение вашего риска? По сути, он берет на себя свой безрисковый доход в размере 100 000 долларов плюс ваш рисковый доход, то есть 100 000 + 160 000 = 260 000 долларов, если вам будет сопутствовать удача, и 100 000 + 40 000 = 140 000 долларов, если вам не повезет. Приятель выплатит вам 90 000 долларов в любом из этих случаев; при этом у него останется либо 170 000 долларов, либо 50 000 долларов с равной вероятностью. Следовательно, ожидаемая полезность вашего приятеля равна

Если приятель не заключит с вами сделку, его ожидаемая полезность составит  а значит, сделка принесет ему немного больше выгоды. Диапазон взаимовыгодных сделок в данном случае очень узкий, поэтому исход почти предопределен, но если вы намерены продать весь свой риск, остается совсем малый диапазон возможных взаимовыгодных вариантов.

А как насчет частичной торговли риском? Предположим, вы заплатите приятелю сумму x, если вам будет сопутствовать удача, а он вам сумму y, если вам не повезет. Для того чтобы это привело к повышению ожидаемой полезности в случае каждого из вас, необходимо выполнить следующих два неравенства:

В качестве примера допустим, что y = 10 000. Тогда второе неравенство дает x > 10 526,67, а первое — x < 18 328,16. Первое значение x — минимальная плата, которую приятель потребует за готовность взять на себя ваш риск, а второе значение x — максимальная сумма, которую вы готовы заплатить ему за это. Таким образом, имеем довольно большой диапазон возможностей для взаимовыгодного обмена и торга.

А что если ваш приятель нейтрален к риску, то есть его интересуют только ожидаемые денежные показатели? Тогда, чтобы сделка стала для него приемлемой, она должна удовлетворять условию:

1/2 × (100 000 + x) + 1/2 × (100 000 − y) > 100 000,

или просто x > y. В такой ситуации возможно почти полное страхование от риска, при котором вы платите приятелю 60 001 доллар, если вам сопутствует удача, а он вам 59 999 долларов, если вам не повезет. Это и есть ситуация, в которой вы получаете весь выигрыш от торговли рисками.

Если на самом деле в роли вашего «приятеля» выступает страховая компания, она может быть почти нейтральной к риску, поскольку объединяет множество аналогичных рисков и принадлежит хорошо диверсифицированным инвесторам, для каждого из которых этот бизнес составляет всего лишь часть их общего риска. В таком случае вымышленный образ дружелюбного, нейтрального к риску, доброго фермера может стать реальностью. А если страховые компании конкурируют за страхование вашего бизнеса, страховой рынок может предложить вам почти полное страхование по цене, позволяющей вам оставить себе почти весь выигрыш.

Общей для всех этих договоренностей является идея, что заключение взаимовыгодных сделок возможно при условии, что тот, кто сталкивается с меньшим риском, снимает его часть с того, кто подвержен большему риску. На самом деле идея о существовании цены за риск и рынка риска лежит в основе почти всех финансовых механизмов в современной экономике. Акции и облигации, а также все сложные финансовые инструменты, такие как деривативы, — лишь способ распределения риска среди тех, кто готов его нести за минимальную цену. Многие считают, что такой рынок — в чистом виде азартная игра, и в каком-то смысле это так и есть. Однако те, кто стартует с минимального риска, соглашаются участвовать в подобных играх, возможно, потому, что уже обеспечили себе диверсификацию способом, о котором шла речь выше. А те, кто изначально наиболее подвержен риску, продают или избавляются от него. Это позволяет последним рисковать больше, чем в случае, если бы им приходилось нести весь риск на себе. Следовательно, финансовые рынки стимулируют предпринимательство, содействуя торговле рисками.

Итак, мы рассмотрели только разделение заданного общего риска. В реальной жизни существует возможность предпринять действия, направленные на уменьшение общего риска: фермер может защитить посевы от мороза, а владелец автомобиля — осторожнее им управлять, чтобы снизить риск аварии. Если такие действия не поддаются публичному наблюдению, это игра с несовершенной информацией, и возникает проблема морального риска, о которой говорилось выше: у хорошо застрахованных людей нет стимула снижать риск, с которым они сталкиваются. Мы рассмотрим подобные проблемы, а также механизмы их преодоления, в .

В. Манипулирование риском в соперничестве

Фермеры, о которых шла речь выше, столкнулись с риском из-за погодных условий, а не собственных действий или действий других фермеров. Если участники игры могут оказывать влияние на риск, которому подвержены они сами или другие игроки, то они могут использовать такое манипулирование риском стратегически. Наглядный пример — соперничество в области исследований и разработок между компаниями, стремящимися превзойти друг друга в разработке и выводе на рынок новых информационных технологий или биотехнологических продуктов; многим спортивным соревнованиям свойственны аналогичные характеристики.

В спорте и других типах соперничества такого рода исход игры зависит от комбинации мастерства и удачи. Вы одержите победу, если

ваше мастерство + ваша удача > мастерство соперника + удача соперника

или если

ваше удача − удача соперника > мастерство соперника — ваше мастерство.

Обозначим левую сторону последнего неравенства символом L; это ваш «избыток удачи». L — неопределенная величина; предположим, распределение ее вероятностей — это нормальная, или колоколобразная, кривая, показанная на рис. 8.2 в виде черной кривой. В любой точке на горизонтальной оси высота этой кривой представляет вероятность, с которой L принимает соответствующее значение. Следовательно, область под кривой между любыми двумя точками на горизонтальной оси равна вероятности того, что L лежит между этими двумя точками. Допустим, у вашего соперника уровень мастерства выше, а значит, вы более слабый игрок. Ваш «дефицит мастерства», эквивалентный разности между навыками соперника и вашими, имеет положительное значение, как показано в точке S. Вы одержите победу, если ваш избыток удачи L превосходит ваш дефицит мастерства S. Стало быть, область под кривой справа от точки S, заштрихованная на рис. 8.2, представляет вероятность вашей победы. Если привнести в ситуацию больше случайности, колоколобразная кривая станет более пологой (как серая кривая на рис. 8.2), поскольку вероятность относительно высоких и низких значений L повышается, тогда как вероятность средних значений снижается. В таком случае область под кривой справа от точки S также увеличивается. На рис. 8.2 область под исходной кривой нормального распределения заштрихована перекрестными линиями, а более крупная область под пологой кривой — однонаправленными. В качестве аутсайдера вы должны придерживаться стратегии, которая сглаживает эту кривую. И напротив, если вы фаворит, вам следует попытаться сократить элемент случайности в состязании.

Рис. 8.2. Влияние повышения риска на вероятность победы

Таким образом, мы должны воспринимать более слабых игроков или тех, кто отстал в длинной гонке, как людей, пытающихся применить неформатные или рискованные стратегии, поскольку это их единственный шанс наверстать упущенное или вырваться вперед. Напротив, игроки, имеющие максимальные шансы на успех или преимущество в игре, будут вести осторожную игру. Вот практический совет, основанный на этом принципе: если вы хотите бросить вызов тому, кто играет в теннис лучше вас, выберите для матча ветреный день.

Вы можете извлечь для себя выгоду из манипулирования не только величиной риска в вашей стратегии, но и корреляцией между рисками. Опережающий вас игрок попытается выбрать максимально высокую положительную корреляцию; тогда независимо от того, сопутствует ли ему самому удача или нет, удача его соперника останется неизменной и его преимущество в игре будет защищено. Напротив, отстающий игрок постарается найти риск, как можно меньше коррелирующий с риском соперника. Общеизвестно, что в гонке между двумя парусниками яхта, находящаяся позади, должна следовать по другому пути, чем яхта, которая вырвалась вперед и должна повторять все маневры отстающей.

 

2. Асимметричная информация: основные идеи

Во многих играх один или несколько игроков могут иметь преимущество за счет того, что они с большей определенностью знают, что произошло или произойдет. Такие преимущества, или асимметричность информации, присущи реальным стратегическим ситуациях. На самом базовом уровне каждый игрок может знать собственные предпочтения или выигрыши, скажем, терпимость к риску в игре «балансирование на грани», терпение в переговорах, а также мирные или воинственные намерения в международных отношениях. Однако при этом у него могут быть весьма расплывчатые представления о предпочтениях или выигрышах других игроков. То же касается и знания игроком своих характеристик (таких как уровень квалификации работника или склонность к риску у человека, подающего заявку на страхование автомобиля или медицинское страхование). Иногда действия, доступные одному игроку (например, вооружение и боеготовность страны), не в полной мере известны другим игрокам. И наконец, некоторые фактические результаты (фактический объем убытков, понесенных застрахованным домовладельцем в результате наводнения или землетрясения) может видеть один игрок, но не другие.

Манипулирование информацией о ваших способностях и предпочтениях, известной другим игрокам, позволяет влиять на равновесный исход игры. В результате такое манипулирование асимметричной информацией само по себе становится стратегической игрой. Возможно, вы считаете, что каждый игрок всегда стремится скрывать свою информацию и получать информацию от других игроков, но это не так. Ниже представлен список различных возможностей вместе с примерами. Более информированный игрок может предпринять следующие действия:

1. Скрыть или дать ложную информацию. При смешивании ходов в игре с нулевой суммой вы не хотите, чтобы другой игрок видел, что вы делаете. Так вы блефуете в покере, чтобы ввести в заблуждение других игроков относительно ваших карт.

2. Раскрыть часть правдивой информации. Когда вы предпринимаете стратегический ход, вам нужно, чтобы другие игроки видели, что именно вы сделали, и отреагировали соответствующим образом. Например, если вы оказались в напряженной ситуации, но у вас нет враждебных намерений, вам необходимо убедить других в их достоверности, чтобы не завязалась ненужная схватка.

В свою очередь менее информированный игрок может предпринять одно из следующих действий:

1. Получить необходимую информацию или отделить правду от лжи. Например, работодатель хочет определить уровень квалификации потенциального сотрудника или объем усилий, вкладываемых в работу наемным работником. Страховой компании необходимо знать категорию риска человека, подающего заявление о страховании, и объем убытков человека, подающего заявление о выплате страхового возмещения, а также информацию о любой небрежности страхователя, предполагающей возмещение доли его ответственности.

2. Оставаться в неведении. Незнание о стратегическом ходе соперника может оградить вас от его обязательств и угроз. Политики или руководители высшего уровня часто извлекают выгоду из такого «достоверного отрицания».

Обычно одних только слов для передачи достоверной информации бывает недостаточно: судят скорее по делам, чем по словам. Но даже действия не всегда эффективны, если любой игрок может без труда их выполнить. Тем не менее в целом менее информированным игрокам следует обращать внимание на действия более информированного игрока, а не на то, что он говорит. А более информированный игрок, в свою очередь, зная о том, что другие игроки будут интерпретировать его действия таким образом, должен попытаться манипулировать их информационным содержанием.

В ходе стратегической игры вы можете обнаружить, что владеете информацией, которой нет у других игроков. В вашем распоряжении может оказаться информация, «хорошая» именно для вас в том смысле, что, узнай о ней другие игроки, они изменили бы свои действия так, что это увеличило бы ваш выигрыш. Например, вам точно известно, что вы некурящий, поэтому вы должны претендовать на более низкие взносы по страхованию жизни. С другой стороны, у вас может быть «плохая» информация, раскрытие которой обусловило бы действия других игроков, способные вам навредить. Например, в колледже вы получали оценки обманным путем и не заслуживаете принятия на учебу в престижную юридическую школу. Вы знаете, что окружающие составят о вас мнение на основании ваших действий, и в связи с этим попытаетесь придумать и предпринять шаги, которые заставят их решить, что ваша информация заслуживает доверия. Такие действия называются сигналами, а стратегия их использования — сигнализированием. И наоборот, если окружающие посчитают, что ваша информация не заслуживает доверия, вы можете помешать им в этом утвердиться, попытавшись ввести их в заблуждение. Такие стратегии, обозначаемые термином «подавление сигнала», как правило, относятся к числу смешанных, поскольку случайный характер смешанных стратегий не позволяет делать точные логические выводы.

Если другие игроки знают больше вас или совершают действия, которые нельзя непосредственно наблюдать, вы можете использовать стратегии, которые сократят такое информационное отставание. Стратегия, вынуждающая другого игрока раскрыть свою информацию, называется скринингом, а конкретные методы, используемые с этой целью, — инструментами скрининга.

Поскольку личная информация игрока часто включает в себя знания о его способностях или предпочтениях, полезно думать об игроках, вступающих в игру с разной личной информацией, как об игроках различных типов. При наличии достоверного сигнализирования в равновесии игры менее информированные игроки смогут делать правильные выводы об информации, имеющейся у более информированных игроков, на основании их действий. Например, юридическая школа примет на учебу только абитуриентов, прошедших надлежащий отбор. Этот исход еще можно описать так: в равновесии разные типы игроков правильно раскрываются или разделяются, поэтому мы называем данную ситуацию разделяющим равновесием. Тем не менее иногда игроки одного или более типов могут успешно имитировать действия игроков других типов с тем, чтобы неинформированные игроки не могли определять различные типы игроков и идентифицировать их действия; например, страховые компании могут предлагать только одну разновидность страховых полисов. В таком случае мы говорим, что в равновесии типы объединяются, и называем его объединяющим равновесием. В процессе изучения игр с неполной информацией мы увидим, что идентификация типа равновесия, присутствующего в игре, имеет первостепенное значение.

 

3. Непосредственная коммуникация, или дешевый разговор

Обычно самый простой способ передать информацию другим — просто сообщить им ее. Точно так же самый простой способ получить информацию — попросить предоставить ее. Однако участники стратегической игры должны осознавать, что другие игроки не всегда говорят правду сами и не всегда поверят чьим-то утверждениям. То есть достоверность сказанных слов может быть поставлена под сомнение. Есть такое распространенное изречение: «слова стоят дешево»; непосредственная коммуникация действительно не требует прямых затрат, или они настолько незначительны, что их можно не принимать в расчет. Тем не менее она может косвенно повлиять на исходы игры и выигрыши игроков путем изменения убеждений одного игрока в отношении действий другого игрока или воздействия на выбор одного равновесия из множества равновесий. Непосредственную коммуникацию, не требующую прямых затрат, специалисты по теории игр называют «дешевым разговором», а равновесие, достигнутое в результате ее использования, обозначается термином «равновесие дешевого разговора».

А. Полностью совпадающие интересы

Прямая передача информации оправдывает себя в случаях, когда интересы игроков полностью совпадают. Игра в доверие, описанная в , — самый яркий пример данной ситуации. Таблица этой игры (см. ) воспроизведена на рис. 8.3.

Рис. 8.3. Игра в доверие

В этой игре интересы Гарри и Салли полностью совпадают: оба хотят встретиться и оба предпочитают сделать это в Local Latte. Проблема в том, что эта игра носит некооперативный характер: ее участники делают выбор независимо друг от друга, не зная о выборе другого игрока. Но давайте представим, что у Гарри появляется возможность отправить Салли сообщение (или Салли получает возможность задать вопрос, на который Гарри отвечает), прежде чем оба сделают выбор. Если сообщение Гарри «Я иду в Local Latte», у Салли нет оснований думать, что он лжет. И если Гарри считает, что Салли поверит ему, для него в равной мере оптимально выбрать Local Latte, сделав свое сообщение правдивым. Таким образом, непосредственная коммуникация позволяет быстро добиться предпочтительного для обоих игроков исхода. Именно этим объясняется тот факт, что при анализе данной игры в нам пришлось придумать сложный сценарий, при котором коммуникация была невозможна: вспомните, что Гарри и Салли до последней минуты перед встречей были на разных занятиях и у них не было мобильных телефонов.

Давайте более детально проанализируем исход игры в доверие при наличии непосредственного общения с точки зрения теории игр. Предположим, мы сконструировали двухэтапную игру. На первом этапе действует только Гарри, и это передача сообщения Салли. На втором этапе разыгрывается исходная игра с одновременными ходами. В полной двухэтапной игре происходит равновесие обратных рассуждений, в котором стратегии (исчерпывающие планы действий) заключаются в следующем. План действий обоих игроков на втором этапе таков: «Если сообщение Гарри на первом этапе “Я иду в Starbucks”, то выбрать Starbucks; если сообщение Гарри на первом этапе “Я иду в Local Latte”, выбрать Local Latte». (Помните, что в играх с последовательными ходами игроки должны использовать исчерпывающие планы действий.) Действие Гарри на первом этапе сводится к отправке сообщения: «Я иду в Local Latte». Подтвердить, что это и есть равновесие обратных рассуждений в данной двухэтапной игре, не составит труда, поэтому мы оставляем эту задачу вам.

Однако равновесие, в котором применим дешевый разговор, не единственное равновесие обратных рассуждений в данной игре. Рассмотрим следующие стратегии: план действий каждого игрока на втором этапе — пойти в Starbucks независимо от сообщения, отправленного Гарри на первом этапе, то есть оно может быть любым. Можно убедиться, что эта совокупность стратегий также представляет собой равновесие обратных рассуждений. Независимо от сообщения Гарри на первом этапе, если один игрок отправится в Starbucks, то для другого игрока будет оптимальным пойти туда же. Таким образом, в каждой из подыигр, которые могут возникнуть на втором этапе (по одной подыгре после каждого из двух сообщений Гарри), выбор Starbucks обоими игроками и есть равновесие Нэша в соответствующей подыгре. В таком случае на первом этапе Гарри будет безразлично, какое сообщение отправить, поскольку он знает, что оно будет проигнорировано.

Равновесие дешевого разговора (при котором сообщение Гарри не игнорируется) обеспечивает более высокие выигрыши, и мы могли бы предположить, что именно оно будет выбрано в качестве фокальной точки. Тем не менее наличие причин исторического или культурного характера может обусловить выбор другого равновесия. Например, по неким причинам, не имеющим никакого отношения к данной игре, у Гарри может быть репутация абсолютно ненадежного человека. Он может быть неисправимым шутником или просто невнимательным человеком. В таком случае люди могут не доверять его заявлениям, и Салли, зная, что это обычное положение вещей, не поверит сообщению Гарри.

Подобные проблемы присущи всем коммуникационным играм. В них всегда есть альтернативные равновесия, в которых коммуникация не принимается во внимание, а значит, не играет особой роли. Специалисты по теории игр называют их равновесиями пустого разговора. Однако мы ограничимся лишь упоминанием о них и сосредоточимся на равновесиях дешевого разговора, в которых коммуникация действительно влечет за собой определенные последствия.

Б. Полностью противоположные интересы

Достоверность непосредственной коммуникации зависит от степени согласованности интересов игроков. В качестве разительного контраста с игрой в доверие рассмотрим игру, в которой интересы игроков диаметрально противоположны, а именно игру с нулевой суммой. Яркий пример такой игры — розыгрыш очка в теннисе на ; мы воспроизводим ее таблицу выигрышей на рис. 8.4. Помните, что в качестве выигрышей выступает процент успешных ударов Эверт. Не забывайте также, что в этой игре есть только равновесие Нэша в смешанных стратегиях (полученное в ); ожидаемый выигрыш Эверт в нем равен 62.

Рис. 8.4. Игра в розыгрыш очка в теннисе

Теперь представим, что мы построили двухэтапную игру. На первом этапе Эверт предоставляется возможность отправить сообщение Навратиловой. На втором этапе разыгрывается игра с одновременными ходами (рис. 8.4). Каким будет равновесие обратных рассуждений?

Вполне очевидно, что Навратилова не поверит ни одному сообщению, полученному от Эверт. Например, если сообщение Эверт — «Я намерена сыграть ПЛ» и Навратилова ей поверит, то Навратиловой следует выбрать стратегию «прикрывать ПЛ». Однако если Эверт придет к выводу, что Навратилова будет прикрывать ПЛ, то ей лучше применить стратегию ПД. На следующем уровне рассуждений Навратилова должна предвидеть это и не поверить в заявление Эверт о выборе ПЛ.

Но здесь есть еще кое-что. Навратилова также не должна полагать, что Эверт поступит наоборот. Предположим, сообщение Эверт: «Я намерена сыграть ПЛ», и Навратилова думает: «Она просто пытается меня обмануть, поэтому я буду исходить из того, что она выберет ПД». В результате Навратилова выбирает «прикрывать ПД». Однако если Эверт считает, что Навратилова усомнится в ее сообщении, она все же применит стратегию ПЛ. Навратилова должна предусмотреть и такой вариант развития событий.

Стало быть, недоверие Навратиловой должно означать абсолютное игнорирование сообщения Эверт. В таком случае в этой двухэтапной игре будет только равновесие пустого разговора. Действия двух ее участниц на втором этапе будут представлять собой равновесие в исходной игре, а сообщение Эверт на первом этапе может быть любым. Это характерно для всех игр с нулевой суммой.

В. Частично совпадающие интересы

А как насчет общих игр, где есть смешение конфликта и общих интересов? Заслуживает ли в них доверия непосредственная коммуникация, зависит от того, как смешиваются конфликт и сотрудничество при частичном совпадении интересов игроков. Таким образом, в подобных играх следует ожидать наличия как равновесия дешевого разговора, так и равновесия пустого разговора. В общем случае, чем больше совпадают интересы, тем больше информации должно быть доступно для передачи. Мы проиллюстрируем этот интуитивный вывод на следующем примере.

Рассмотрим ситуацию, с которой вы уже, возможно, сталкивались, а если нет, то это обязательно произойдет, как только вы начнете зарабатывать и инвестировать деньги. Когда финансовый консультант советует вам сделать инвестицию, он может предложить вам формирование долгосрочных отношений для получения стабильных комиссионных либо он может оказаться мошенником, который навяжет вам свой вариант инвестиций, заберет авансовые комиссионные и исчезнет. Достоверность его рекомендаций зависит от того, отношения какого типа вы с ним установите.

Предположим, вы намерены инвестировать 100 000 долларов в актив, рекомендованный консультантом, и предвидите три возможных исхода. Актив может оказаться плохим объектом для инвестиций (П), что приведет к убыткам в размере 50 %, то есть получению выигрыша −50, выраженного в тысячах долларов. Актив может оказаться средним объектом для инвестиций (С) и обеспечит рентабельность инвестиций в размере 1 %, или выигрыш 1. И наконец, он может стать хорошим объектом для инвестиций (Х), обеспечивающим рентабельность 55 %, или выигрыш 55. Решив инвестировать, вы авансом платите консультанту комиссионные в размере 2 % независимо от эффективности инвестиций, что дает ему выигрыш 2 и одновременно снижает ваш выигрыш на 2. Кроме того, консультант заработает 20 % от прибыли, которую вы получите, и у вас останется выигрыш в размере 80 % от прибыли, но при этом консультант не разделит с вами убытков.

Без специальных знаний о рекомендуемом активе вы не можете оценить вероятность какого-то из этих трех исходов. Поэтому вы просто полагаете, что все три варианта (П, С и Х) в равной степени возможны: каждый может наступить с вероятностью 1/3. В такой ситуации при отсутствии дополнительной информации вы рассчитываете свой ожидаемый выигрыш от инвестирования в рекомендуемый актив следующим образом:

[(1/3 × –50) + (1/3 × 0,8 × 1) + (1/3 × 0,8 × 55)] — 2 = [1/3 × (–50 + 0,8 + 44)] — 2 = [1/3 × (— 5,2)] — 2 = –1,73 — 2 = –3,73.

Согласно этому расчету, ожидаемый убыток составит 3 730 долларов. Следовательно, вы не станете вкладываться в этот актив, а ваш консультант не получит никаких комиссионных. Аналогичные вычисления показывают, что с учетом отрицательного ожидаемого выигрыша вы бы не инвестировали и в случае, если бы были убеждены, что рекомендуемый актив однозначно относится к типам П и С или представляет собой их любую взвешенную по вероятности комбинацию.

У вашего консультанта складывается иная ситуация. Он проанализировал соответствующий инвестиционный актив и точно знает, какой из трех сценариев (П, С или Х) соответствует истине. Нам необходимо определить, что он будет делать с этой информацией, в частности поделится ли ею с вами. Ниже мы рассмотрим разные возможности, исходя из предположения, что вы будете обновлять свои убеждения в отношении типа актива на основании полученной от консультанта информации. В данном примере просто условимся, что вы верите сказанному и присваиваете вероятность 1 тому, что актив относится к типу, указанному вашим консультантом.

I. Краткосрочные отношения. Если консультант говорит вам, что рекомендуемый актив относится к типу П, вы решаете не инвестировать. Почему? Потому что ваш ожидаемый выигрыш при этом составит −50; кроме того, данная инвестиция обойдется в 2 дополнительные единицы (комиссионные консультанту), то есть ваш окончательный выигрыш будет −52. Аналогично, если консультант вам сообщит, что актив относится к типу С, вы тоже не станете инвестировать. В этом случае ваш ожидаемый выигрыш составит 80 % от прибыли в размере 1 минус 2 на выплату комиссионных, то есть в сумме −1,2. Вы согласитесь только в случае, если консультант скажет, что актив относится к типу Х. Тогда ваш ожидаемый выигрыш будет 80 % от прибыли в размере 55 минус 2 на выплату комиссионных, или 42.

Что при этом сделает ваш консультант со своими знаниями? Если правда — Х, он захочет сказать вам об этом, чтобы убедить инвестировать в данный актив. Но если консультант не видит перспективы ваших долгосрочных отношений, он может заявить вам, что правда — это Х, даже если на самом деле актив относится к типу С или П и он об этом знает. Если вы решите инвестировать на основании слов консультанта, он просто положит в карман 2 % комиссионных и исчезнет ввиду отсутствия необходимости поддерживать с вами контакт. Зная о существовании вероятности получить плохой совет или ложную информацию от консультанта, с которым вы сталкиваетесь всего один раз, вы должны полностью игнорировать его рекомендацию. Следовательно, в этой игре с асимметричной информацией и краткосрочными отношениями достоверная коммуникация невозможна. Единственное равновесие, присутствующее здесь, — это равновесие пустого разговора; равновесия дешевого разговора в данном случае нет.

II. Долгосрочные отношения: полное раскрытие информации. Теперь представим, что ваш консультант работает на компанию, через которую вы делаете инвестиции уже много лет: потеря будущего бизнеса с вами может стоить ему работы. Если вы инвестируете в актив, рекомендуемый консультантом, вы сможете сравнить фактическую эффективность этих инвестиций с его прогнозом. Он может оказаться ошибочным отчасти (прогноз был С, а на самом деле П или был Х, а на самом деле С) или полностью (прогноз был Х, а на самом деле П). Если вы обнаружите такое искажение информации, ваш финансовый консультант и его компания не только потеряют вас как клиента, но и рискуют потерять других клиентов, если вы расскажете друзьям и знакомым о подобных махинациях. Если ваш консультант связывает потерю репутации с определенными издержками, ваши возможные убытки косвенным образом касаются и его, а значит, его интересы частично совпадают с вашими. Предположим, незначительное искажение информации обойдется консультанту в 2 единицы выигрыша (денежный эквивалент — 2000 долларов убытка), а серьезное искажение — в 4 единицы (убыток в размере 4000 долларов). Теперь можем определить, достаточно ли частичного совпадения ваших с консультантом интересов для того, чтобы заставить его говорить правду.

Как отмечалось выше, консультант скажет вам правду, чтобы побудить вас инвестировать в определенный актив, если последний относится к типу Х. Нам необходимо проанализировать мотивы консультанта, когда актив относится не к типу Х, а к типу П или С. Сперва допустим, что актив относится к типу П. Если ваш консультант раскроет правду о типе актива, вы не станете инвестировать и он лишится комиссионных, но при этом не понесет никаких репутационных издержек: его выигрыш от описания актива как П в случае, если он действительно относится к типу П, равен 0. Если консультант вам сообщит, что актив относится к типу С (хотя на самом деле это П), вы все равно откажетесь инвестировать, поскольку ваш выигрыш составил бы −1,2, как мы подсчитали выше. В этом случае консультант тоже получит выигрыш 0, поэтому у него нет причин вам лгать о типе актива. Но что если консультант скажет, будто актив принадлежит к типу Х? Если вы поверите ему и вложите деньги, он получит авансовые комиссионные в размере двух процентов, но при этом понесет репутационные издержки 4 в связи с серьезной ошибкой. Если консультант скажет, что актив относится к типу Х, тогда как на самом деле это тип П, он получит отрицательный ожидаемый выигрыш. Иными словами, вашему консультанту выгоднее честно признаться, что актив относится к типу П.

Но что если на самом деле актив относится к типу С? Правдивое раскрытие информации не убедит вас в целесообразности инвестиций, и выигрыш консультанта составит 0. Если консультант скажет вам, что актив относится к типу Х и вы поверите ему, то вашим решением будет инвестировать. Консультант получит комиссионные в размере 2, 20 процентов от прибыли 1, которую обеспечит вам актив типа С, но при этом понесет репутационные издержки 2 в связи с частичным искажением информации. Следовательно, его выигрыш составит 2 + (0,2 × 1) — 2 = 0,2 > 0. Таким образом, консультант все же извлечет выгоду из ложного сообщения о типе актива Х, если на самом деле это С. Зная об этом, вы не поверите никаким утверждениям консультанта о том, что данный актив относится к типу Х.

Поскольку у вашего консультанта есть стимул солгать, когда рекомендуемый им актив относится к типу С, в такой ситуации достоверное раскрытие всей информации невозможно. Равновесие пустого разговора, при котором игнорируется любое сообщение консультанта, — по-прежнему одно из возможных. Однако является ли оно здесь единственным или частичная коммуникация все же реальна? Невозможность полного раскрытия информации обусловлена тем, что консультант может неправильно заявить, что актив принадлежит к типу Х, хотя на самом деле к С, поэтому объединим эти две возможности в одно событие и обозначим его как «не-П». Тогда консультант спрашивает себя, что именно ему следует вам сообщить, П или «не-П». Теперь можем проанализировать, решит ли консультант сказать вам правду в условиях такой частичной коммуникации.

III. Долгосрочные отношения: частичное раскрытие информации. Чтобы определить мотивы вашего консультанта в ситуации «П или не-П», необходимо понять, какие выводы вы сделаете (то есть какую апостериорную вероятность вычислите) из сообщения «не-П», если вы ему поверите. Ваше предыдущее (первоначальное) убеждение состояло в том, что варианты П, С и Х в равной степени вероятны, то есть вероятность каждого из них составляет 1/3. Если консультант скажет «не-П», у вас останется два объекта для инвестиций — С и Х. Первоначально вы рассматривали их как равновероятные, и у вас нет оснований менять это предположение, поэтому теперь вы присваиваете каждому из них вероятность 1/2. Это ваша новая, апостериорная вероятность, зависящая от информации, предоставленной консультантом. С ее учетом ваш ожидаемый выигрыш при решении инвестировать после получения от консультанта сообщения «не-П» составит [1/2 × (0,8 × 1)] + [1/2 × (0,8 × 55)] — 2 = 0,4 + 22 — 2 = 20,4 > 0. Этого положительного ожидаемого выигрыша достаточно, чтобы побудить вас инвестировать.

Знание о том, что вы будете инвестировать в случае «не-П», позволяет определить, будет ли у вашего консультанта стимул солгать. Захочет ли он сказать «не-П», даже если правда П? Когда актив действительно принадлежит к типу П и консультант говорит правду (сообщает тип П), его выигрыш равен 0, как мы и вычислили выше. Если же вместо этого консультант сообщает «не-П» и вы верите ему, он получит 2 в качестве комиссионных и понесет репутационные издержки в связи с искажением информации. Поскольку вы исходите из того, что С и Х в равной степени вероятны в случае сообщения «не-П», ожидаемое значение репутационных издержек при этом составит 1/2 от издержек 4 вследствие серьезного искажения информации. Таким образом, ожидаемое значение репутационных издержек равно (1/2 × 2) + (1/2 × 4) = 3. Чистый выигрыш вашего консультанта от сообщения вам типа актива «не-П», тогда как на самом деле это П, составляет 2–3 = −1. Следовательно, предоставив вам ложную информацию, он ничего не выиграет. Сказать правду — его лучшая стратегия в данной ситуации, поэтому здесь возможно равновесие дешевого разговора с частичным раскрытием информации.

Концепцию равновесия дешевого разговора с частичным раскрытием информации можно уточнить с помощью концепции разбиения. Напомним, что вы предвидите три возможных сценария, или события, — П, С и Х. Это множество событий можно разделить, или разбить, на отдельные подмножества, и тогда ваш консультант сообщит вам о подмножестве, содержащем правду. (Разумеется, правдивость его сообщения предстоит проанализировать.) В данном случае мы имеем ситуацию с разбиением на два подмножества: одно, состоящее лишь из П, и второе, включающее пару событий {С, Х}. В равновесии с частичным раскрытием информации эти подмножества можно отличить друг от друга на основании сообщения консультанта, однако провести между С и Х более тонкое различие, которое бы привело к максимально точному разбиению на три подмножества, каждое из которых состояло бы из одного элемента, нельзя. Это было бы возможно только при наличии равновесия с полным раскрытием информации.

Мы намеренно сказали ранее о том, что равновесие дешевого разговора с достоверным частичным раскрытием информации возможно. Данная игра относится к категории игр со множеством равновесий, потому что в ней вероятно и равновесие пустого разговора. Конфигурация стратегий и убеждений, при которой вы игнорируете сообщение консультанта, а он отправляет одно и то же сообщение (или даже произвольное сообщение) независимо от того, что соответствует истине, и есть равновесие. С учетом стратегий каждого игрока, у другого игрока нет оснований менять свои действия или убеждения. В терминах разбиений такое равновесие пустого разговора можно считать равновесием с самым грубым, тривиальным разбиением с одним (под)множеством {П, С, Х}, включающим все три варианта. В общем случае всякий раз, когда в игре с дешевым разговором вы находите равновесие, не являющееся равновесием пустого разговора, там будет как минимум еще одно равновесие с более грубым разбиением исходов.

IV. Множество равновесий. В качестве примера ситуации, в которой более грубые варианты разбиения связаны с дополнительными равновесиями, рассмотрим случай, когда репутационные издержки консультанта выше, чем предполагалось ранее. Пусть они равны 4 (вместо 2) в случае мелкого искажения истины и 8 (вместо 4) при крупном искажении. Согласно выполненному нами анализу, ваш консультант сообщит о типе Х, если актив действительно относится к типу Х, и о типе П, если актив относится к типу П. Эти результаты сохраняются. Консультант хочет, чтобы вы инвестировали в актив типа Х; кроме того, он по-прежнему получает тот же выигрыш от сообщения о типе П, если актив действительно относится к типу П, так же как и в случае сообщения о типе С в той же ситуации. При более высоких репутационных издержках у консультанта еще меньше мотивов лгать вам о том, что рекомендуемый им актив относится к типу Х, тогда как на самом деле это тип П. Таким образом, если актив имеет тип П или Х, можно рассчитывать, что консультант скажет правду.

Проблема с полным раскрытием информации в предыдущем примере возникла только из-за наличия у консультанта стимула солгать в случае, когда актив относится к типу С. Судя по вычисленным нами показателям, выигрыш консультанта от предоставления информации о типе Х, тогда как на самом деле это тип С, был выше, чем при обнародовании правдивой информации. Сохранится ли такое положение вещей и в ситуации с более высокими репутационными издержками?

Предположим, актив относится к типу С, а консультант сообщает о типе Х. Если вы поверите ему и инвестируете в этот актив, ожидаемый выигрыш консультанта составит 2 (комиссионные) + 0,2 × 1 (его доля в фактической прибыли на инвестиции в актив типа С) — 4 (его репутационные издержки) = −1,8 < 0. Правда принесет консультанту выигрыш 0. У него больше нет мотивов завышать качество инвестиционного актива. Исход, при котором консультант всегда говорит правду, а вы верите ему и предпринимаете соответствующее действие, и есть равновесие дешевого разговора с полным раскрытием информации. В нем возможно самое мелкое разбиение на подмножества, состоящие из одного элемента, — {П}, {С} и {Х}.

В данном случае существуют еще три равновесия, каждое с более грубым разбиением, чем при равновесии с полным раскрытием информации. Обе ситуации с двумя подмножествами (одна с подмножествами {П, С} и {Х}, а другая — {П} и {С, Х}), а также ситуация с пустым разговором с одним подмножеством {П, С, Х}, — это альтернативные равновесия, которые возможны в данной игре. Какое из них получит приоритет, зависит от условий, рассмотренных в во время анализа игры со множеством равновесий.

Самая большая реальная трудность, связанная с получением равновесия с достоверной передачей информации, не являющегося равновесием пустого разговора, состоит в знании игроками степени совпадения их интересов, причем это должно быть их общим знанием. В примере с инвестициями для вас крайне важно на основании предыдущего опыта взаимодействия с консультантом или из других источников (таких как контракт) знать, что в целях сохранения репутации он лично заинтересован в благоприятном исходе вашего инвестирования. Если бы вы не знали, в какой степени интересы консультанта совпадают с вашими, у вас были бы все основания подозревать, что он привирает, чтобы склонить вас к инвестициям ради комиссионных, которые он незамедлительно получит.

Что происходит в случае более информативных сообщений? Предположим, консультант может сообщить вам показатель g, представляющий собой его оценку темпов роста курса акций, и уточнить, что g может принимать диапазон непрерывных значений. В этой ситуации, если консультант получит дополнительную выгоду от покупки вами плохих акций по его рекомендации, у него есть стимул завысить значение g. В результате абсолютно точная и правдивая коммуникация больше невозможна. Однако равновесие дешевого разговора с частичным раскрытием информации все же вероятно. Непрерывный диапазон значений темпов роста курса акций можно разделить на интервалы (скажем, от 0 до 1 %, от 1 до 2 % и т. д) так, чтобы консультант посчитал оптимальным сказать вам правду о том, в какой из этих интервалов на самом деле попадает показатель темпов роста курса акций, а вы сочли бы нужным прислушаться к его совету и предпринять на его основании оптимальное действие. Чем выше ценит консультант свою репутацию, тем мельче будет разбиение диапазона значений g — например, это может быть половина процента вместо целого или четверть процента вместо половины. Дальнейшее объяснение этой темы можно найти в работах, в которых она рассматривается более углубленно.

Г. Формальный анализ игр с дешевым разговором

До сих пор наш анализ игр с дешевым разговором носил эвристический и вербальный характер. Такого подхода обычно достаточно для понимания и прогнозирования поведения, но в подобных играх существуют и при необходимости могут быть использованы формальные методы описания и решения игр — деревья и матрицы игры. Для того чтобы показать, как это делается, и связать игры, представленные в данной главе, с теорией, изложенной в предыдущих главах, проанализируем игру между вами и вашим финансовым консультантом в этом контексте. В рамках анализа будем исходить из предположения, что ваш консультант проводит различие между тремя возможными вариантами П, С и Х, сообщая вам информацию о рекомендуемом активе; иными словами, рассмотрим ее самое мелкое разбиение. Прочитав этот раздел, вы сможете выполнить аналогичный анализ для случая, когда в сообщении консультанта присутствует более грубое разбиение информации об активе на типы П или «не-П».

Начнем с построения дерева игры, представленного на рис. 8.5. Условный игрок «природа», о котором шла речь в , ходит первым, создавая один из трех вариантов доходности ваших инвестиций, а именно П, С и Х, с вероятностью 1/3 каждый. Ваш консультат наблюдает за действиями «природы» и делает свой ход, а именно сообщает вам о трех вариантах доходности инвестиций, в качестве которых снова могут выступать варианты П, С и Х. Мы сразу же немного упростим дерево игры, отметив, что у консультанта нет никаких мотивов занижать рентабельность инвестиций: он никогда не станет сообщать о типе П, если правда — С или Х, или о типе С, если на самом деле это Х. (Эти действия можно было бы оставить в дереве, но они его слишком усложнят. Применение одного шага обратных рассуждений показывает, что ни одно из этих действий не является оптимальным для консультанта, а значит, ни одно из них не может быть частью равновесия.)

Рис. 8.5. Дерево игры с дешевым разговором между финансовым консультантом и инвестором

И наконец, вы ходите третьим и должны выбрать, инвестировать (И) или не инвестировать (Н). Однако вы не можете наблюдать за действиями «природы» непосредственно и знаете о них только со слов консультанта. Следовательно, для вас оба узла, в которых он сообщает о типе С, объединены в одно информационное множество, тогда как все три узла, в которых он сообщает тип Х, собраны в другое информационное множество (на рис. 8.5 оба информационных множества выделены пунктирными овалами). Наличие информационных множеств говорит о том, что вы ограничены в своих действиях. В том информационном множестве, где консультант сообщает тип С, вы должны сделать один и тот же выбор в отношении инвестиций в обоих узлах множества, то есть выбрать либо И, либо Н в обоих узлах, поскольку не можете провести различия между этими узлами в составе данного информационного множества, с тем чтобы выбрать И в одном узле и Н в другом. Точно так же вы должны выбрать либо И, либо Н во всех трех узлах информационного множества, в котором консультант сообщает тип Х.

В каждом концевом узле выигрыш консультанта показан первым, а ваш — вторым. Выигрыши, которые исчисляются в тысячах долларов, отражают те же числовые значения, что и в выполненном выше эвристическом анализе. Вы выплачиваете консультанту комиссионные 2 % от инвестиции в размере 100 000 долларов, и ваша прибыль составляет −50, если вы инвестируете в актив типа П, 1 при инвестициях в актив типа С, и 55 — в актив типа Х. Консультант получает 20 % от любой прибыли, которую вы заработаете благодаря его рекомендации. Единственное отличие данной модели от предыдущей: мы не приводим здесь точного значения репутационных издержек консультанта в случае искажения информации, а вместо этого используем символ М для обозначения репутационных издержек при незначительном искажении информации и символ Б — при значительном искажения информации. Для того чтобы привести эти параметры в соответствие с нашим анализом, мы исходим из предположения, что оба имеют положительное значение, а также что М < Б. Этот подход позволяет проанализировать оба уровня репутационных соображений, о которых шла речь выше.

В качестве примера того, как вычисляется каждая пара выигрышей, рассмотрим узел, в котором «природа» создала актив типа С, консультант сообщил о типе Х, а вы выбрали И (на этот узел обозначен символом i). При таком раскладе ваш выигрыш составляет 80 % от прибыли 1 на ваши инвестиции, из которого исключаются авансовые комиссионные 2, выплаченные консультанту, что в итоге равно 0,8–2 = −1,2. Консультант получает комиссионные 2 и свою долю 20 % от прибыли на инвестиции в данный актив (0,2), но при этом несет репутационные издержки М, а значит, его общий выигрыш будет 2,2 — М. Мы предоставляем вам возможность самостоятельно убедиться в том, что все остальные выигрыши, отображенные на данном дереве игры, вычислены правильно.

С помощью дерева игры на мы можем построить для нее таблицу выигрышей. Строго говоря, она должна включать в себя все стратегии, доступные вам и вашему консультанту. Однако, как и при построении дерева игры, мы можем исключить из рассмотрения некоторые стратегии, прежде чем вносить их в таблицу; в частности, удалим все явно плохие стратегии. Это позволит построить гораздо меньшую, а значит, и куда более удобную таблицу по сравнению с той, в которую были бы включены все возможные стратегии.

Какие стратегии мы можем исключить из рассмотрения в качестве равновесных? Ответ на этот вопрос включает два аспекта. Во-первых, мы можем игнорировать стратегии, которые однозначно не будут использованы. Во время построения дерева игры мы уже удалили некоторые из них для консультанта (например, стратегию «сообщать тип П, если истинный тип актива Х»). Теперь мы можем видеть, что у вас также есть несколько вариантов, подлежащих исключению. Например, стратегия «выбрать И, если консультант сообщает тип П» в концевом узле доминируема стратегией «выбрать Н, если консультант сообщает тип П», поэтому мы исключаем ее из рассмотрения. Точно так же в рамках информационного множества «сообщить тип С» ваша стратегия «выбрать И, если консультант сообщает тип С» доминируема стратегией «выбрать Н, если консультант сообщает тип С»; это худший выбор в обоих концевых узлах (c и g) и поэтому тоже может быть проигнорирован. Во-вторых, мы можем исключить все стратегии, не оказывающие никакого влияния на поиск равновесий дешевого разговора. Например, для консультанта обе стратегии «сообщить тип П» и «сообщить тип С» приводят к выбору вами стратегии Н, поэтому мы исключаем обе. Помимо концевых узлов, которые мы уже удалили на (a, c и g), мы можем удалить также узлы b, d и h.

После такой процедуры упрощения у нас остается всего шесть концевых узлов (e, f, i, j, k и l), соответствующих стратегиям, в случае которых консультант сообщает, что актив относится к типу Х, а вы в ответ выбираете стратегию согласно полученной информации. Если конкретно, в распоряжении консультанта осталось три интересные стратегии («всегда сообщать тип Х независимо от того, каков истинный тип актива — П, С или Х», «сообщать тип Х только в случае, если истинный тип актива С или Х» и «сообщать Х только в случае, если и только если истинный тип актива Х»), а в вашем — две («выбрать И, если консультант сообщает тип Х» и «выбрать Н, если консультант сообщает тип Х»). Эти пять стратегий позволяют построить таблицу выигрышей три на два, представленную на рис. 8.6.

Рис. 8.6. Таблица выигрышей игры с дешевым разговором

Выигрыши по каждой комбинации стратегий на рис. 8.6 — это ожидаемые выигрыши, вычисленные с помощью значений в концевых узлах дерева (которых можно достичь при данной комбинации стратегий), взвешенных по соответствующим вероятностям. В качестве примера рассмотрим верхнюю левую ячейку таблицы, в которой консультант сообщает о том, что актив относится к типу Х независимо от его истинного типа. Эта комбинация стратегий приводит к концевым узлам e, i и k, каждый с вероятностью 1/3. Следовательно, ожидаемый выигрыш консультанта в этой ячейке составляет {[1/3 × (2 — Б)] + [1/3 × (2,2 — М)] + (1/3 × 13)} = 1/3 × (17, 2 — Б — М). Точно так же ваш ожидаемый выигрыш в той же ячейке равен [(1/3 × –52) + (1/3 × –1,2) + (1/3 × 42)] = 1/3 × (–11,2). Мы снова предоставляем вам возможность самостоятельно убедиться в том, что оставшиеся ожидаемые выигрыши рассчитаны правильно.

Теперь, имея полную таблицу выигрышей, мы можем использовать представленные в методы для поиска равновесия с оговоркой, что значения М и Б в нашем анализе играют определенную роль. Простой анализ наилучших ответов показывает, что ваш наилучший ответ на стратегию консультанта «всегда Х» — «Н, если Х», а на две его другие стратегии — «И, если Х». Аналогичным образом, наилучшим ответом консультанта на вашу стратегию «Н, если Х» может быть любая из его трех стратегий. Таким образом, мы имеем первый результат: верхняя правая ячейка — это всегда равновесие Нэша. Если консультант сообщает, что актив относится к типу Х, каким бы ни был его истинный тип (или, если уж на то пошло, отправляет любое сообщение, но только одно и то же во всех трех сценариях), вам лучше выбрать Н, а если вы выбираете Н, у консультанта нет причин отклоняться от своего выбора. Это и есть равновесие пустого разговора при полном отсутствии обмена информацией, с которым мы уже сталкивались выше.

Далее рассмотрим наилучший ответ консультанта на ваш выбор стратегии «И, если Х». Единственно возможные равновесия возникают, когда он применяет стратегию «Х, только если С или Х» или «Х, если и только если Х». Однако какой именно из двух вариантов он выберет (или не выберет ни одного их них), зависит от конкретных значений Б и М. Для того чтобы пара стратегий {«Х, только если С или Х», «И, если Х»} была равновесием Нэша, должны выполняться следующие условия: 15,2 — М > 17,2 — Б — М и 15, 2 — М > 13. Первое выражение верно, если Б > 2, второе — если М < 2,2. Таким образом, если значения Б и М удовлетворяют этим условиям, средняя левая ячейка будет равновесием дешевого разговора (по Нэшу). В этом равновесии сообщение консультанта о типе актива Х не позволяет вам определить, каков истинный тип, С или Х, но вы точно знаете, что это не П. Располагая такой информацией, вы можете быть уверены, что ваш ожидаемый выигрыш будет положительным, и решаете инвестировать. В этой ситуации Х действительно означает «не-П», а равновесный исход формально эквивалентен равновесию с частичным раскрытием информации, о котором мы говорили выше.

Мы можем также проверить выполнение условий, при которых пара стратегий {«Х, если и только если Х», «И, если Х»} — это равновесие Нэша. Такой исход требует, чтобы 13 > 17,2 — Б — М и 13 > 15, 2 — М. Проанализировать эти выражения не так легко, как представленные выше. Однако следует отметить, что второе выражение требует, чтобы М > 2,2, а также что мы предположили, что Б > М; следовательно, условие Б > 2,2 должно выполняться при выполнении условия М > 2,2. Теперь можете использовать эти условия для проверки выполнения первого выражения. Возьмите минимальное значение Б и М, равное 2,2, и подставьте его в выражение 13 > 17,2 — Б — М, в результате получите 13 > 12,8, что, безусловно, верно. Эти расчеты указывают на то, что нижняя левая ячейка — это равновесие дешевого разговора, когда М > 2,2, при условии, что Б > М. Это и есть равновесие с полным раскрытием информации, которое мы нашли в конце предыдущего анализа.

В каждом из описанных случаев наряду с равновесиями {«Х, только если С или Х», «И, если Х»} и {«Х, если и только если Х», «И, если Х»} существует равновесие пустого разговора. Обратите внимание, что мы получим только равновесие пустого разговора в случае низких репутационных издержек консультанта (Б < 2 и М < Б), что согласуется со сформулированными ранее интуитивными выводами. И наконец, если мы ограничим язык передаваемых сообщений более грубым разбиением на П и «не-П», то продолжение представленного здесь анализа покажет, что множество стратегий {«не-П, если С или Х», «И, если не-П»} также будет равновесием Нэша в данной игре.

В каждом случае наш формальный анализ подтверждает аргументы, приведенные в . Некоторые из вас могут посчитать вербальный подход достаточным для большинства, если не для всех своих потребностей. Другие отдадут предпочтение более формальной модели, представленной в данном разделе. Однако вы должны осознавать, что деревья и таблицы имеют свои ограничения: как только ваша модель станет достаточно сложной (например, будет включать в себя непрерывный диапазон вариантов сообщений), вам придется практически полностью положиться на математику для поиска равновесий. Способность решать модели с асимметричной информацией в различных формах (вербально, посредством деревьев и таблиц или с помощью алгебры или исчисления) — очень важный навык. Ниже мы приведем дополнительные примеры таких игр; при этом одни из них будут решены путем сочетания интуиции и алгебры, а другие — с помощью дерева игры и таблицы выигрышей. Во всех случаях один метод решения не исключает другой, поэтому вы можете попробовать самостоятельно применить альтернативные варианты решения.

 

4. Неблагоприятный отбор, сигнализирование и скрининг

А. Неблагоприятный отбор и несостоятельность рынка

Во многих играх один из участников знает об исходе игры нечто такое, что неизвестно другим. Работодатель знает о квалификации потенциального сотрудника гораздо меньше, чем сам сотрудник; еще труднее отслеживать более неопределенные, но важные качества сотрудника, такие как отношение к работе и умение работать в коллективе. Страховой компании гораздо меньше известно о состоянии здоровья или навыках вождения человека, подающего заявку на оформление медицинской страховки или автострахования, чем самому страхователю. Продавец подержанного автомобиля многое о нем знает благодаря длительной эксплуатации, а потенциальный покупатель может в лучшем случае получить минимум информации в ходе осмотра авто.

В таких ситуациях непосредственная коммуникация не обеспечивает достоверной передачи информации. Неквалифицированные работники заявляют о наличии определенных навыков, чтобы получить более высокооплачиваемую должность; люди, которые относятся к категории повышенного риска, утверждают, что у них крепкое здоровье или хорошие навыки вождения, чтобы выплачивать более низкие страховые взносы; владельцы плохих автомобилей утверждают, что их автомобили работают прекрасно и за долгие годы не создавали никаких проблем. Другие стороны подобных сделок знают о наличии стимулов к искажению истины и не доверяют информации, передаваемой на словах. Следовательно, в этих играх нет условий для формирования равновесия дешевого разговора, о котором шла речь в .

Но что происходит, если менее информированные стороны таких сделок вообще не имеют возможности получить соответствующую информацию? Другими словами, выражаясь в терминах, введенных в , в их распоряжении нет ни достоверных инструментов скрининга, ни сигналов. Если страховая компания предлагает страховой полис, который обходится в 5 центов за каждый доллар страхового покрытия, он будет особенно привлекателен для людей, которые знают, что их собственный риск (болезни или автомобильной аварии) превышает 5 %. Безусловно, некоторые люди, знающие о том, что их риск ниже 5 %, все равно купят такой страховой полис ввиду нерасположенности к риску. Однако в общей совокупности лиц, претендующих на оформление этого страхового полиса, доля лиц с более высокой степенью риска превысит долю лиц с аналогичным риском в общей численности населения. Таким образом, страховая компания выборочно привлекает невыгодную, или неблагоприятную, группу клиентов. Данный феномен известен как неблагоприятный отбор и характерен для сделок с асимметричной информацией. (На самом деле этот термин возник именно в страховой отрасли.)

Потенциальные последствия неблагоприятного отбора для рыночных сделок весьма наглядно продемонстрировал Джордж Акерлоф в статье, которая положила начало экономическому анализу ситуаций с асимметричной информацией и обеспечила ему Нобелевскую премию в 2001 году. Мы приводим этот пример, чтобы ознакомить вас с возможными последствиями неблагоприятного отбора.

Б. Рынок «лимонов»

Представьте себе сформировавшийся в 2014 году рынок определенного типа подержанных автомобилей, скажем Citrus 2011 года выпуска. Предположим, что в эксплуатации эти машины оказались либо безотказными и надежными, либо очень проблемными. Автомобили второго типа принято называть «лимонами», поэтому для контраста назовем автомобили первого типа «апельсинами».

Допустим, каждый владелец «апельсина» Citrus оценивает его в 12 500 долларов и готов с ним расстаться за более высокую, но не более низкую цену по сравнению с этой ценой. В свою очередь, каждый владелец «лимона» Citrus оценивает его в 3000 долларов. Предположим, потенциальные покупатели готовы заплатить больше указанных сумм. Если бы покупатель был уверен, что приобретаемый им автомобиль — «апельсин», он бы выложил за него 16 000 долларов; если бы он знал, что автомобиль — «лимон», то 6000 долларов. Поскольку покупатели оценивают автомобили каждого типа по более высокой цене, чем их непосредственные владельцы, продажа авто была бы взаимовыгодной. Цена «апельсина» могла бы варьироваться в диапазоне от 12 500 до 16 000 долларов, а «лимона» — от 3000 до 6000 долларов. Для определенности допустим, что количество таких автомобилей ограниченно, а потенциальных покупателей больше, чем машин. Тогда покупатели, конкурируя друг с другом, повысят цену автомобилей до максимальной, которую они готовы заплатить, то есть «апельсин» будет стоить 16 000 долларов, а «лимон» — 6000 долларов при условии стопроцентной идентификации типа каждого из них.

Однако информация о качестве любого конкретного автомобиля несимметрично распределена между двумя сторонами сделки. Владелец Citrus точно знает, «апельсин» это или «лимон», а потенциальный покупатель — нет, и владельцу «лимона» абсолютно невыгодно обнародовать такие сведения. Давайте пока ограничимся анализом рынка частных подержанных автомобилей, на котором законы, требующие правдивого раскрытия информации, либо не действуют, либо трудновыполнимы. Кроме того, будем исходить из того, что у потенциального покупателя отсутствует любая возможность заметить нечто такое, что поможет ему определить тип автомобиля; точно так же и владелец автомобиля лишен возможности указать его тип. Таким образом, в данном примере мы проанализируем только последствия асимметричности информации, когда обе стороны сделки не могут воспользоваться инструментами сигнализации или скрининга.

Когда покупатели не могут отличить «апельсины» от «лимонов», на рынке не может быть разных цен на автомобили этих типов. Цена на автомобиль Citrus должна быть только одна — p, а значит, два типа автомобилей, «апельсины» и «лимоны», следует объединить в одну группу. Возможна ли эффективная торговля при таких обстоятельствах — зависит от доли «апельсинов» и «лимонов» в общей совокупности авто. Предположим, доля «апельсинов» — f от подержанных автомобилей Citrus, а «лимонов» — оставшаяся часть (1 — f).

Несмотря на то что покупатели не могут проверить качество отдельного автомобиля, они могут знать долю хороших машин в общей совокупности авто, например, из газет; мы предполагаем, что в действительности так и происходит. Если на продажу выставляются все автомобили, потенциальный покупатель может рассчитывать на случайный выбор с вероятностями получения «апельсина» и «лимона» f и (1 — f) соответственно. Ожидаемое значение цены автомобиля составляет 16 000 × f + 6000 × (1 — f) = 6000 + 10 000 × f > p. Потенциальный покупатель приобретет такой автомобиль, если его ожидаемая стоимость превысит цену, которую ему предлагают заплатить, то есть если 6000 + 10 000 × f > p.

Теперь проанализируем эту ситуацию с точки зрения продавца. Владельцы знают, какие у них автомобили — «апельсины» или «лимоны». Владелец «лимона» готов его продать, если цена превышает для него ценность автомобиля, то есть если p > 3000. Однако владелец «апельсина» требует, чтобы p > 12 500. Если это условие владельца «апельсина» удовлетворяется, то удовлетворяются и условия владельца «лимона».

Таким образом, для выполнения условий всех покупателей и продавцов, чтобы они были готовы заключить сделку, нужно, чтобы 6000 + 10 000 × f > p > 12 500. Если доля «апельсинов» в общей совокупности удовлетворяет условию 6000 + 10 000 × f > 12 500, или f > 0,65, можно найти цену, которая позволит выполнить эту задачу, в противном случае эффективная торговля невозможна. При 6000 + 10 000 × f < 12 500 (если исключить редкий и маловероятный случай равенства между этими двумя вариантами) владельцы «апельсинов» не захотят продавать их по максимальной цене, которую готовы заплатить потенциальные покупатели. В результате в совокупности подержанных автомобилей, выставленных на продажу, будет наблюдаться неблагоприятный отбор и «апельсины» вообще не появятся на рынке. Потенциальные покупатели, понимая, что они наверняка получат «лимон», будут готовы платить не более 6000 долларов. Владельцы «лимонов» будут довольны таким исходом, и «лимоны» будут продаваться. Однако в связи с асимметричностью информации рынок «апельсинов» рухнет. Этот исход станет одним из вариантов закона Грешема, в котором плохие автомобили вытесняют хорошие.

Поскольку отсутствие информации делает невозможным получение обоснованной цены на «апельсины», их владельцам каким-то способом понадобится убедить покупателей, что у них хорошие автомобили. Другими словами, им необходимо подать сигнал о типе автомобиля. Проблема в том, что владельцы «лимонов» тоже захотят сделать вид, будто их автомобили — «апельсины», и с этой целью могут имитировать большинство сигналов, подаваемых владельцами «апельсинов». Майкл Спенс, сформулировавший концепцию сигнализирования и разделивший с Акерлофом и Стиглицем Нобелевскую премию 2001 года за работу в области экономической информации, описывает проблемы владельцев «апельсинов» в своей новаторской книге о сигнализировании так: «Вербальные (словесные) заявления ничего не стоят, а значит, они бесполезны. Кто угодно может солгать о том, почему он продает машину. Кто угодно может предложить покупателю проверить состояние автомобиля. Владелец “лимона” также может сделать такое предложение. Это блеф. В любом случае он ничего не теряет. Кроме того, такие проверки дорогостоящи, а заключение о надежности автомобиля, сделанное механиком владельца, не заслуживает доверия. Умный владелец автомобиля, который не относится к числу “лимонов”, мог бы заплатить за техосмотр, но предоставить покупателю возможность выбрать эксперта. В таком случае у владельца возникает другая проблема — максимально сократить затраты на техосмотр. Никаких гарантий нет. Продавец может уехать в Кливленд, не оставив адреса».

На самом деле ситуация не столь безнадежна, как обрисовал Спенс. Люди и компании, занимающиеся продажей подержанных автомобилей, могут заслужить репутацию честных партнеров и извлекать из нее выгоду, устанавливая надбавку к цене продаваемых автомобилей. (Безусловно, некоторые торговцы подержанными автомобилями поступают непорядочно.) Одни покупатели разбираются в автомобилях, другие приобретают их у знакомых, а значит, могут проверить историю машины. Кроме того, автодилеры могут предлагать покупателям гарантию — эту тему мы рассмотрим подробнее ниже. А на других рынках недобросовестным игрокам труднее имитировать действия добросовестных, поэтому достоверное сигнализирование возможно. Конкретным примером может служить ситуация, в которой образование выступает в качестве сигнала о квалификации. В подобной ситуации людям с низким уровнем квалификации труднее получить такое образование, которое бы позволило ошибочно принять их за высококвалифицированных специалистов. Для того чтобы по уровню образования провести различие между типами специалистов, необходимо выполнение следующего условия: получение образования должно обходиться неквалифицированным работникам гораздо дороже, чем квалифицированным. Для того чтобы продемонстрировать, как и когда сигнализирование может эффективно разделить типы игроков, давайте обратимся к рынку труда.

В. Сигнализирование и скрининг: типичные ситуации

Основная идея использования сигнализирования или скрининга для передачи или сбора информации очень проста: игроки разных типов (то есть владеющие разной информацией о собственных характеристиках или об игре и выигрышах в ней в более общем случае) должны считать оптимальным выполнение различных действий так, чтобы они правдиво раскрывали их истинный тип. Существует множество ситуаций с такой асимметричностью информации, а также стратегий сигнализирования и скрининга, позволяющих справиться с подобными задачами. Ниже описывается ряд ситуаций, в которых применимы методы анализа, представленные в данной главе.

I. Страхование. Потенциальные покупатели страховых полисов относятся к разным категориям риска, или степени их риска для страховой компании. Например, среди многих водителей, подающих заявки на оформление полисов страхования автотранспортных средств на случай столкновения, есть как более, так и менее осторожные. Каждый потенциальный клиент лучше, чем страховая компания, знает о том, к какой категории риска он принадлежит. С учетом условий того или иного страхового полиса компания заработает меньше прибыли (или понесет более крупные убытки) на страховании клиентов более высокой категории риска. Тем не менее данный страховой полис может оказаться более привлекательным именно для клиентов с повышенным уровнем риска. Таким образом, страховая компания привлекает менее благоприятную группу клиентов, а значит, происходит неблагоприятный отбор. Безусловно, страховая компания заинтересована в проведении различия между категориями риска. Это можно сделать посредством одного из инструментов скрининга.

Предположим, существуют только две категории риска. Следовательно, страховая компания может предложить два полиса страхования, из которых каждый клиент выберет какой-то один. Первый полис предусматривает более низкий страховой взнос (измеряемый в определенном количестве центов на каждый доллар страхового покрытия), но обеспечивает покрытие меньшего процента от понесенных клиентом убытков. Второй полис предусматривает более высокий страховой взнос, но обеспечивает и более высокий процент страхового покрытия убытков, возможно, даже 100 процентов. (При страховании на случай столкновения эти убытки представляют собой стоимость ремонта автомобиля в автомастерской.) Клиент, принадлежащий к более высокой категории риска, с большей вероятностью может понести непокрытые убытки, поэтому он гораздо охотнее заплатит более высокий страховой взнос, чтобы получить большее страховое покрытие. Исходя из этого, страховая компания может установить соотношение между размером страховых взносов и покрытия убытков таким образом, чтобы клиенты более высокой категории риска выбирали полисы с высокими взносами и высоким покрытием, а клиенты более низкой категории риска — полисы с более низкими взносами и низким страховым покрытием. При наличии других категорий риска страховой компании необходимо предлагать потенциальным клиентам больше полисов страхования; в случае непрерывного диапазона категорий риска может быть и соответствующий диапазон страховых полисов.

Безусловно, любая страховая компания вынуждена бороться за каждого клиента. Такая конкуренция влияет на условия пакетов страховых взносов и уровней покрытия, предлагаемых страховой компанией. Иногда конкуренция может даже препятствовать достижению равновесия, поскольку каждое предложение рискует проиграть в противостоянии с другим предложением. Однако общая идея, лежащая в основе создания полисов с дифференцированными страховыми взносами для клиентов разных категорий риска, обоснованна и важна.

II. Гарантия. Многие типы товаров длительного пользования, такие как автомобили, компьютеры и стиральные машины, отличаются по уровню качества. Любая компания-производитель имеет полное представление о своем продукте. А вот потенциальные покупатели менее информированны. Может ли компания, которая знает, что ее продукт отличается высоким качеством, подать об этом потенциальным покупателям достоверный сигнал?

Самый очевидный и наиболее распространенный сигнал — гарантия. Стоимость гарантии действительно высококачественного продукта ниже, поскольку его производитель реже сталкивается с требованиями о ремонте или замене, чем производитель некачественного продукта. Следовательно, гарантия может служить сигналом о высоком качестве изделия, а покупатели интуитивно учитывают этот факт, принимая решение о покупке.

Как правило, в таких ситуациях сигнал должен быть избыточным, с тем чтобы его имитация обходилась достаточно дорого. В связи с этим компания, выпускающая качественные автомобили, должна предлагать весьма серьезную гарантию, для того чтобы подать достоверный сигнал о качестве автомобиля. Это требование имеет особое значение для любой компании-новичка в отрасли, еще не заслужившей репутации производителя высококачественной продукции. Например, Hyundai вышла на рынок США в 1986 году и на протяжении первых десяти лет имела репутацию компании, выпускающей автомобили низкого качества. В середине 1990-х Hyundai инвестировала большие средства в улучшение технологии, дизайна и производственного процесса. Для того чтобы обновить сложившийся имидж, компания предложила революционную на то время гарантию на свои автомобили, рассчитанную на 10 лет и 100 000 миль пробега. Теперь организации по защите потребителей считают Hyundai одним из лучших производителей высококачественных автомобилей.

III. Ценовая дискриминация. Покупатели большинства продуктов неоднородны с точки зрения готовности платить, уделять время поиску более выгодной цены и т. д. Компании хотели бы найти способ идентифицировать потенциальных клиентов с более высокой готовностью платить, чтобы назначать им одну, предположительно обоснованно высокую цену, и в то же время выборочно делать выгодные предложения тем клиентам, которые не могут платить так много (до тех пор, пока их готовность платить все же превышает затраты на поставку соответствующего продукта). Компании могут успешно устанавливать разные цены для разных групп потребителей с помощью инструментов скрининга для разделения типов клиентов. Мы обсудим такие стратегии, которые известны в экономической литературе как ценовая дискриминация, подробнее в . Здесь же представим лишь краткий обзор этой темы.

Наиболее показательный пример дискриминационных цен относится к отрасли авиаперевозок. Пассажиры, предпочитающие совершать деловые поездки бизнес-классом, зачастую готовы платить за авиабилеты больше, чем туристы, потому что как минимум часть их стоимости возмещает работодатель. Со стороны авиакомпании было бы незаконно открыто выяснять тип каждого пассажира и назначать разные цены пассажирам разных типов. Однако авиакомпании успешно используют тот факт, что туристы предпочитают составлять маршрут путешествий заранее, тогда как бизнес-пассажирам необходимо сохранять определенную гибкость в своих планах. В связи с этим авиаперевозчики устанавливают разные цены на билеты, подлежащие и не подлежащие возврату, и предоставляют путешественникам самим выбирать тип тарифа. Такая стратегия ценообразования представляет собой пример скрининга посредством самоотбора. Другие инструменты — специальный тариф при условии предварительной покупки билета, требование о минимальном сроке пребывания в ночь с субботы на воскресенье, разные категории обслуживания на борту (первый класс, бизнес-класс и экономкласс) — также применяются в целях скрининга.

Ценовая дискриминация характерна не только для таких дорогостоящих вещей, как авиабилеты. Другие схемы дискриминационного ценообразования можно наблюдать на многих рынках, где цены гораздо ниже цен на воздушные перевозки. Например, кафе и закусочные обычно предлагают завсегдатаям дисконтные карты, обеспечивающие скидку на кофе или закуски. Это объясняется тем, что постоянные клиенты в большей степени готовы искать более выгодные предложения поблизости, тогда как приезжие или случайные посетители идут в первое попавшееся кафе или закусочную и не тратят время на поиск заведения с более низкими ценами. Завышенная обычная цена и скидка в виде бесплатного одиннадцатого заказа — и есть то меню вариантов, из которого выбирают два типа клиентов, что, собственно, и разделяет их на типы.

Книги — еще один пример. Как правило, сначала книги издаются в твердом переплете; более дешевый вариант в мягкой обложке выходит спустя несколько месяцев, а то и через год и даже позже. Разница между затратами на публикацию двух версий книги несущественна. Но эти версии служат для разделения покупателей на тех, которые хотят прочитать книгу сразу же и готовы платить больше за возможность это сделать, и тех, кто намерен ждать дольше, чтобы заплатить меньше.

IV. Дизайн и реклама продукта. Может ли привлекательный, хорошо продуманный внешний вид продукта служить сигналом о его высоком качестве? Основное условие сводится к тому, что затраты на разработку такого сигнала для компании, которая лишь создает видимость высокого качества, должны быть существенно выше, чем для компании, выпускающей действительно качественный продукт. Как правило, затраты на внешнее оформление продукта не зависят от его качества. Следовательно, подражатель не сталкивается с разницей в затратах, а значит, такой сигнал не будет достоверным.

Однако порой подобные сигналы могут иметь под собой определенное обоснование. Внешнее оформление продукта требует фиксированных затрат, которые распределяются на весь его жизненный цикл. Покупатели действительно узнают о качестве продукта из собственного опыта, от друзей, а также из обзоров и отзывов в СМИ. Эти факторы указывают на то, что товар высокого качества может рассчитывать на более длительный период пребывания на рынке и более высокий общий объем продаж. Стало быть, затраты на дорогостоящее внешнее оформление распределяются на большее количество выпущенной продукции и в меньшей степени увеличивают себестоимость каждой единицы продукта, если он имеет более высокое внутреннее качество. Фактически компания делает такое заявление: «У нас хороший продукт, и мы его продадим в большом количестве. Поэтому мы можем себе позволить потратить столько денег на его дизайн. Такие затраты были бы непомерными для компании-однодневки, которая рассчитывает продать не так уж много единиц продукта, прежде чем люди обнаружат его низкое качество и перестанут покупать». Даже дорогостоящий, на первый взгляд бесполезный и неинформативный запуск продукта и рекламная кампания способны обеспечить аналогичный результат сигнализирования.

Похожая ситуация складывается и в банках. Когда вы заходите в банк и видите добротные мраморные стойки и бархатную мебель, это может убедить вас в его стабильности. Однако чтобы этот сигнал действительно работал, важно, чтобы здание, мебель и внутренняя отделка носили индивидуальный характер и были присущи именно этому банку. Если все это можно без труда продать учреждениям других типов и превратить помещение, скажем, в ресторан, то не заслуживающий доверия владелец мог бы имитировать поистине надежный банк без всяких дополнительных затрат. В данной ситуации такой сигнал был бы недостоверным.

V. Такси. Приведенные выше примеры взяты в основном из экономики, а теперь давайте рассмотрим пример из области социологии, касающийся службы такси. Подавляющее большинство людей, нанимающих такси, просто хотят доехать до пункта назначения, заплатить за проезд и уйти. Однако некоторые пытаются ограбить таксиста или угнать его автомобиль, возможно, даже применив физическое насилие. Как таксисты могут осуществить скрининг потенциальных клиентов и предоставлять услуги только хорошим людям? Социологи Диего Гамбетта и Хезер Хэмилл проанализировали этот вопрос на основании многочисленных бесед с таксистами в Нью-Йорке (где грабежи — большая проблема) и Северной Ирландии (где в период проведения исследования серьезной проблемой были межрелигиозные конфликты).

Водителям необходим подходящий инструмент скрининга, поскольку они знают, что потенциальные клиенты с плохими намерениями пытаются имитировать действия хороших клиентов. Здесь также применимо условие о разнице в затратах. Нет никаких гарантий того, что житель Нью-Йорка в добротном костюме не представляет опасности, так как грабитель может купить и надеть костюм по той же цене, что и хороший клиент. Расу и пол тоже нельзя использовать для отсеивания клиентов. В Северной Ирландии враждующие группировки также трудноотличимы по внешним характеристикам.

Гамбетта и Хэмилл обнаружили, что некоторые инструменты скрининга более приемлемы для таксистов. Например, заказ такси по телефону — более достоверный сигнал о благонадежности клиента, чем попытки поймать такси на улице: когда вы указываете место, где вас должно забрать такси, служба такси в буквальном смысле знает, где вы живете. Еще важнее то, что некоторые инструменты сигнализирования оказались более эффективны для клиентов (а значит, и выступали в качестве более эффективных инструментов скрининга) при использовании в сочетании друг с другом, а не по отдельности. Ношение костюма само по себе не было достоверным инструментом скрининга, но когда человек в костюме выходил из офисного здания, таксисты считали его более безопасным клиентом, чем человека в костюме, стоящего на углу улицы. В настоящее время в вестибюлях большинства офисных зданий есть охрана, поэтому можно считать, что такой клиент уже прошел один уровень проверки системой безопасности.

Пожалуй, самыми важными оказались бессознательные сигналы, подаваемые людьми (микровыражения лица, жесты и т. д.), которые опытные таксисты умеют читать и интерпретировать. Именно ввиду непроизвольности таких сигналов их имитация потребовала бы невероятных усилий, а значит, они могут считаться самыми эффективными инструментами скрининга, необходимого для разделения типов клиентов.

VI. Политические бизнес-циклы. Теперь приведем еще два примера из области политэкономии. Действующие правительства часто увеличивают бюджетные расходы, чтобы обеспечить рост экономики накануне выборов, тем самым надеясь привлечь больше голосов избирателей и выиграть выборы. Но разве не должны рационально мыслящие избиратели разгадать эту уловку и понять, что сразу же после завершения выборов правительство будет вынуждено сократить расходы, что может привести к экономическому спаду? Для того чтобы расходы накануне выборов эффективно сигнализировали о типе, избиратели должны испытывать неопределенность в отношении типа правительства в плане его компетентности. Будущая рецессия повлечет за собой определенные политические издержки для правительства. И они будут меньше, если правительство более компетентно в вопросах экономики. Когда разница в издержках между компетентным и некомпетентным правительством достаточно большая, значительное увеличение расходов может выступать в качестве достоверного сигнала о компетентности.

Еще один пример относится к методам управления инфляцией. Многие страны в разные времена переживали периоды высокой инфляции, и их правительства благочестиво заявляли о своем намерении снизить ее уровень. Может ли правительство, которое действительно заботится о стабильности цен, достоверно подать сигнал о своем типе? Да. Правительства могут выпустить облигации, защищенные от инфляции, процентная ставка по которым автоматически повышается с повышением темпов инфляции или капитальная стоимость которых увеличивается пропорционально росту уровня цен. Выпуск государственных долговых обязательств в такой форме обходится правительству, отдающему предпочтение политике, приводящей к росту инфляции, дороже, поскольку ему приходится выплачивать более высокий процент или увеличивать сумму своего долга. Следовательно, правительство с подлинно антиинфляционной политикой может выпустить защищенные от инфляции облигации в качестве достоверного сигнала, отделяя себя тем самым от типа правительства, предпочитающего инфляцию.

VII. Эволюционная биология. И в заключение — пример из области естественных наук. У многих видов птиц у самцов очень яркое и тяжелое оперение, которое привлекает самок. Казалось бы, самки должны искать генетически более развитых самцов, с тем чтобы увеличить шансы потомства дожить до зрелости и, в свою очередь, привлечь партнера. Но почему яркое оперение указывает на наличие данных генетических качеств? На первый взгляд может показаться, что такое оперение — недостаток, поскольку делает самца более заметным для хищников (и охотников) и менее мобильным, а значит, и в меньшей степени способным спастись. Почему же самки выбирают, казалось бы, столь неполноценных самцов? Ответ связан с условиями достоверного сигнализирования. Хотя тяжелое оперение — действительно физический недостаток, он все же говорит о том, что у самца с подобным оперением генетически более развиты такие качества, как сила и скорость. Чем слабее самец, тем труднее ему вырастить и поддерживать качественное оперение. Следовательно, именно тяжесть оперения делает его достоверным сигналом о качестве самца.

Г. Экспериментальные данные

Определение характеристик и поиск равновесий в играх с сигнализированием и скринингом предполагает использование ряда достаточно тонких концепций и вычислений. В частности, в каждом из приведенных выше примеров формальные модели должны быть тщательно описаны для того, чтобы можно было сформулировать обоснованные и точные прогнозы в отношении выбора игроков. В таких играх участникам следует пересматривать или обновлять значения вероятностей, присваиваемые ими типу (типам) игроков на основании наблюдений за их действиями. Это обновление требует применения теоремы Байеса, которая описана в . Кроме того, в мы подробно проанализируем игру, нуждающуюся в подобном обновлении.

Даже не вдаваясь в детали, вы можете себе представить, что вычисления для обновления вероятностей достаточно сложны. Стоит ли ожидать, что игроки смогут выполнить их правильно? Существует немало доказательств того, что люди очень плохо справляются с вычислениями, включающими вероятности, и еще хуже — с вычислением вероятностей с учетом новой информации. Поэтому нам следует с вполне обоснованным недоверием относиться к равновесиям, зависящим от выполнения таких вычислений.

В связи с этим весьма обнадеживают выводы экономистов, которые проводили лабораторные эксперименты с сигнальными играми. Некоторые чрезвычайно тонкие уточнения байесовского равновесия Нэша и совершенного байесовского равновесия можно изучить с помощью наблюдений, хотя эти уточнения требуют не только обновления информации посредством отслеживания действий на равновесном пути, но и принятия решения о том, как можно логически вывести информацию из неравновесных действий, которые вообще не следовало бы предпринимать. Тем не менее результаты всех этих исследований не позволяют сделать однозначные выводы, поскольку многое зависит от мелких деталей организации эксперимента в лаборатории.

 

5. Сигнализирование на рынке труда

Многие из вас рассчитывают по окончании учебы работать в элитной финансовой или ИТ-компании. В таких компаниях существует два типа вакансий. Один тип требует высокого уровня математических и аналитических навыков, а также способности усердно трудиться и оплачивается очень хорошо. Другой — это отчасти административная, менее квалифицированная, низкооплачиваемая работа. Безусловно, вы мечтаете о высокооплачиваемой работе. Вы знаете свои качества и навыки гораздо лучше, чем ваш потенциальный работодатель. Если у вас высокий уровень квалификации, вам необходимо, чтобы работодатель узнал об этом, к тому же он тоже хочет это знать. Работодатель может проверить ваши данные и провести с вами собеседование, но информация, полученная таким способом, ограничена имеющимися в его распоряжении временем и ресурсами. Вы можете рассказать работодателю, насколько вы опытный специалист, но подобные голословные заявления не внушают доверия. Вы должны чем-то подкрепить их, а ваш работодатель — попытаться получить более объективные данные.

Какие доказательства может искать работодатель, и что вы можете ему предоставить? Как говорилось в данной главы, ваш потенциальный работодатель применит определенные инструменты скрининга для определения ваших качеств и навыков. Вы, в свою очередь, будете использовать сигналы для передачи фактически той же информации. Иногда для сигнализирования или скрининга могут применяться подобные или даже идентичные инструменты.

В данном примере выбранный вами (и прослушанный) особенно трудный математический курс в университете может выступать в качестве достоверного доказательства вашей способности напряженно работать в целом и ваших математических и логических навыков в частности. Давайте проанализируем роль выбора курса обучения в качестве инструмента скрининга.

А. Скрининг в целях разделения типов

Для простоты проанализируем эту скрининговую игру с помощью интуиции и алгебры. Допустим, с точки зрения качеств, которые представляют интерес для работодателей, студенты делятся всего на два типа: талантливые (Т) и посредственные (П). Потенциальные работодатели из сферы финансов или информационных технологий готовы платить 160 000 долларов в год типу Т и 60 000 в год типу П. Другие работодатели предлагают типу Т 125 000 долларов, а типу П 30 000 долларов. Это те же показатели, что и в примере с автомобилями Citrus в , только умноженные на 10, чтобы они больше соответствовали реальному положению дел на рынке труда. И точно так же как в примере с подержанными автомобилями мы исходили из предположения о фиксированном запасе автомобилей и большом количестве потенциальных покупателей, здесь мы исходим из того, что у нас много потенциальных работодателей, вынужденных конкурировать друг с другом за ограниченное число кандидатов на вакантные должности, поэтому они должны предлагать им максимальную заработную плату, которую готовы выплачивать. Поскольку работодатели не могут определить тип конкретного претендента на ту или иную должность посредством прямых наблюдений, им необходимо найти другие надежные способы провести различие между типами.

Допустим, два типа студентов отличаются друг от друга готовностью изучать трудный, а не легкий курс в университете. Представители каждого типа готовы пожертвовать частью времени, выделенного на вечеринки и другие занятия, на изучение более трудного курса, но для студентов типа Т эта жертва меньше и пойти на нее легче, чем студентам типа П. Предположим, студенты типа Т рассматривают затраты на прохождение каждого такого курса как эквивалент годовой заработной платы в размере 3000 долларов, а студенты типа П — как 15 000 долларов. Может ли работодатель использовать эту разницу для скрининга кандидатов, чтобы отличить тип Т от типа П?

Рассмотрим следующую политику найма: любой студент, прослушавший определенное количество (n) сложных курсов, будет отнесен к типу Т и получит заработную плату в размере 160 000 долларов, и любой, кто изучил менее n сложных курсов, будет отнесен к типу П и получит 60 000 долларов. Цель такой политики — создание естественных стимулов, под влиянием которых только студенты типа Т будут изучать сложные курсы, а студенты типа П не станут этого делать. Ни один тип не намерен проходить больше сложных курсов обучения, чем требуется, поэтому варианты выбора таковы: либо изучить n курсов, чтобы претендовать на тип Т, либо признать поражение и согласиться на тип П (эти студенты могут вообще отказаться от изучения сложных курсов и просто учиться, не прилагая к этому особых усилий).

Чтобы такая политика найма достигла цели, она должна удовлетворять двум видам условий. Первый требует, чтобы политика найма стимулировала кандидатов каждого типа сделать тот выбор, который нужен компании. Иными словами, она должна быть совместима со стимулами сотрудников, поэтому соответствующие условия обозначаются термином условия совместимости стимулов. Второй вид условий гарантирует, что при выборе, продиктованном условиями совместимости стимулов, сотрудники получат лучший (по крайней мере не худший) выигрыш от соответствующих должностей, чем они получили бы в случае выбора другого варианта. То есть сотрудники должны согласиться на участие в предложенном компанией плане, поэтому соответствующие условия называются условиями участия. Мы рассмотрим их в контексте рынка труда чуть ниже. Аналогичные условия будут упоминаться и в других примерах, приведенных далее в этой главе и в , где описывается общая теория разработки подобных механизмов.

I. Совместимость стимулов. Критерий, разработанный работодателями, чтобы отличить тип Т от П (а именно, количество изученных сложных курсов), должен быть достаточно строгим, чтобы студенты типа П даже не пытались удовлетворить его, но не настолько строгим, чтобы лишить студентов типа Т желания предпринимать подобные попытки. Правильное значение n должно быть таким, чтобы студенты, действительно принадлежащие к типу П, признали это и согласились на 60 000 долларов, вместо того чтобы нести дополнительные издержки в связи с имитацией поведения студентов типа Т. Иначе говоря, нам нужно, чтобы политика найма была совместима по стимулам с типом П, поэтому

60 000 ≥ 160 000 — 15 000 n , или 15 n  ≥ 100, или n  ≥ 6,67.

Аналогичным образом условие, согласно которому студенты, действительно принадлежащие к типу Т, предпочитают доказать это посредством изучения n сложных курсов, выглядит так:

160 000 — 3000 n  ≥ 60 000, или 3 n  ≤ 100, или n  ≤ 33,33.

Эти условия совместимости стимулов, или, что то же самое, ограничения совместимости стимулов, приводят стимулы кандидата на должность в соответствие с требованиями работодателя или делают оптимальным для кандидата раскрытие правдивой информации об уровне квалификации посредством своих действий. Значение n удовлетворяет обоим ограничениям, если это целое число в диапазоне от 7 до 33. Второе значение не совсем уместно в данном примере, поскольку программа обучения в колледже обычно состоит из 32 курсов, но в других примерах это может иметь смысл.

Удовлетворение обоим условиям обеспечивает разница в издержках в связи с изучением сложных курсов между двумя типами: эти издержки существенно ниже для студентов «хорошего» типа, которых и ищут работодатели. Когда ограничения удовлетворены, работодатель может использовать политику найма, на которую студенты двух типов отреагируют по-разному, тем самым раскрывая свой тип. Данный процесс называется разделением типов на основе самоотбора.

Мы не учли здесь вероятности того, что на самом деле сложные курсы обучения позволяют овладеть дополнительными навыками или методами работы, способными превратить студентов типа П в тип Т. Согласно нашему сценарию, сложные курсы служат только цели идентификации людей, которые уже обладают соответствующими качествами. Другими словами, эти курсы выполняют лишь функцию скрининга.

В реальной жизни образование действительно повышает продуктивность. Но помимо этого оно еще выполняет функцию сигнализирования и скрининга того вида, о котором идет речь в данном разделе. В нашем примере мы показали, что образование может быть получено исключительно ради второй функции; на самом деле оно часто превышает уровень, необходимый только для роста продуктивности. Такое дополнительное образование сопряжено с издержками асимметричности информации.

II. Участие. Когда условия совместимости стимулов для двух типов рабочих мест в данной компании удовлетворены, студенты типа Т изучают n сложных курсов и получают выигрыш в размере 160 000 — 3000n, тогда как cтуденты типа П не проходят сложных курсов и получают выигрыш 60 000. Чтобы студенты обоих типов были готовы сделать именно такой выбор вместо использования альтернативных возможностей, нужно, чтобы удовлетворялись также условия участия. Поэтому нам необходимо следующее неравенство:

160 000 — 3000 n  ≥ 125 000, или 3 n  ≤ 35, или n  ≤ 11,67.

В данном примере очевидно, что условие участия студентов типа П удовлетворяется (хотя в других примерах может быть иначе), а условие участия студентов типа Т требует, чтобы n ≤ 11,67 или, поскольку n должно быть целым числом, n ≤ 11. Здесь любое значение n, которое удовлетворяет ограничению участия студентов типа Т n ≤ 11, удовлетворяет также ограничению совместимости стимулов n ≤ 33, поэтому второе условие становится логически избыточным.

В таком случае полная совокупность условий, выполнение которых необходимо для разделения типов на данном рынке труда, выглядит так: 7 ≤ n ≤ 11. Такое ограничение возможных значений n объединяет условие совместимости стимулов для студентов типа П и условие участия для студентов типа Т. В данном примере условие участия для студентов типа П и условие совместимости стимулов для студентов типа Т автоматически удовлетворяется в случае выполнения всех остальных условий.

Когда в качестве инструмента скрининга используется требование о прохождении достаточного количества сложных курсов, издержки несут студенты типа Т. Если предположить, что для обеспечения разделения типов используется минимальное количество курсов (а именно n = 7), издержки для каждого студента типа Т в денежном выражении составят 7 × 3000 = 21 000 долларов. В данном контексте это и есть издержки асимметричности информации. Их не существовало бы, если бы тип студента можно было определить напрямую и объективно. Не было бы их и в случае, если бы вся совокупность состояла исключительно из студентов типа Т. Последним приходится нести эти издержки по причине наличия в общей совокупности студентов типа П, от которых они (или их потенциальные работодатели) хотят отмежеваться.

Б. Объединение типов

А может, чтобы не возлагать на тип Т издержки асимметричности информации, лучше вообще не утруждать себя разделением типов? При разделении студенты типа Т получают заработную плату 160 000 долларов, но несут издержки в размере 21 000 долларов в связи с изучением сложных курсов; следовательно, их чистый выигрыш в денежном эквиваленте составляет 139 000 долларов. А студенты типа П получают заработную плату 60 000 долларов. Что произойдет с этими типами, если их не разделять?

Отказ от использования инструментов скрининга приведет к случайному выбору кандидатов из общей совокупности и выплате всем одинаковой заработной платы. Такая ситуация называется объединением типов, или просто объединением, когда понятен смысл происходящего. На конкурентном рынке труда в случае объединения типов общая заработная плата является средним значением той ценности, которую представляют собой специалисты разных типов для работодателя, и она зависит от доли каждого типа в общей совокупности. Например, если 60 % совокупности — тип Т, а 40 % — тип П, общая заработная плата при объединении типов составит:

0,6 × 160 000 + 0,4 × 60 000 = 120 000 долларов.

Естественно, в этом случае специалисты типа Т предпочтут ситуацию с разделением типов, поскольку это обеспечит им 139 000 долларов вместо 120 000. Однако если доли типов в общей совокупности составляют 80 % типа Т и 20 % типа П, то общая заработная плата при объединении будет 140 000 долларов, а значит, при разделении представители типа Т проиграют. Типу П всегда выгоднее объединение. Наличие типа Т в совокупности означает, что общая заработная плата при объединении типов всегда будет превышать заработную плату представителей типа П в размере 60 000 долларов в случае разделения.

Тем не менее если оба типа предпочтут результат, полученный при объединении, это не может быть равновесием в ситуации, когда многие работодатели или работники конкурируют друг с другом в процессе сигнализирования и скрининга. Предположим, соотношение типов в общей совокупности составляет 80 на 20 и имеет место исходная ситуация с объединением, в которой обоим типам платят по 140 000 долларов. Работодатель может объявить, что готов платить 144 000 долларов тому, кто прослушает всего один сложный курс. По сравнению с исходной ситуацией студенты типа Т сочтут это предложение выгодным, так как их расходы на изучение курса составляют всего 3000 долларов, а заработная плата повышается на 4000 долларов. Поскольку данный работодатель выборочно привлекает студентов типа Т, каждый из которых имеет ценность 160 000 долларов, но получает 144 000 долларов, он извлечет прибыль из отклонения от размера заработной платы, рассчитанного с учетом объединения типов.

Однако такое отклонение запускает процесс корректировки заработной платы конкурирующими работодателями, что приводит к разрушению исходной ситуации с объединением типов. Когда сотрудники типа Т начинают массово переходить к данному работодателю, это приводит к снижению общего уровня квалификации оставшихся у других работодателей специалистов и в итоге наступает момент, когда они уже не в состоянии платить им 140 000 долларов. После снижения заработной платы в совокупности специалистов разница между нею и суммой 144 000 долларов, предложенной вышеупомянутым работодателем, достигнет величины, при которой специалисты типа П также сочтут необходимым пройти один сложный курс обучения. Но тогда этот работодатель вынужден будет повысить свое требование до двух сложных курсов, а разницу в заработной плате до такого уровня, при котором изучение двух курсов станет слишком обременительным для типа П, но вполне приемлемым для типа Т. Другие работодатели, которые тоже захотят привлечь какое-то количество представителей типа Т, должны использовать аналогичную политику найма. Этот процесс будет продолжаться до тех пор, пока рынок труда не достигнет разделяющего равновесия, о котором шла речь выше.

Даже если работодатели не проявят инициативу по привлечению сотрудников типа Т вместо типа П, специалист типа Т, зарабатывающий 140 000 долларов в ситуации с объединением типов, может прослушать сложный курс обучения, принести подтверждающий это документ работодателю и сказать: «У меня есть сертификат о прохождении сложного курса обучения, поэтому я прошу повысить мне зарплату до 144 000 долларов. Это убедительное доказательство того, что я отношусь к типу Т; ни один представитель типа П не сделал бы вам подобного предложения». Учитывая имеющиеся в данной ситуации факты, аргумент можно считать обоснованным, и работодателю было бы выгодно согласиться: сотрудник типа Т представлял бы для него ценность 160 000 долларов, но при этом получал бы 144 000 долларов. Другие специалисты типа Т могут поступить так же. Это запускает тот же каскадный процесс, который приводит к разделяющему равновесию. Единственное различие — кто именно инициатор. Теперь специалисты типа Т решают получить дополнительное образование в качестве достоверного доказательства своего типа, и это уже сигнализирование, а не скрининг.

Общая идея такова: хотя объединение типов может быть выгодно всем, игроки не выбирают то или другое в ходе кооперативного, связующего процесса. Они преследуют собственные интересы, что приводит к формированию разделяющего равновесия. Эта ситуация напоминает игру «дилемма заключенных» со многими участниками, а значит, в издержках асимметричности информации присутствует элемент неизбежности.

В. Множество типов

Хотя мы рассмотрели пример с двумя типами, этот анализ можно обобщить. Предположим, существует несколько типов: А, Б, В, …, сгруппированных в порядке снижения их ценности для работодателя и повышения расходов на получение дополнительного образования. Это позволит установить последовательность постепенно повышающихся требований к уровню образования: самый худший тип в нем не нуждается вообще, следующему типу достаточно самого низкого уровня образования, третий тип должен иметь такой-то уровень и т. д.; при этом представители соответствующих типов будут сами выбирать уровень образования, который их идентифицирует.

В заключение хотим высказать еще одну мысль, или даже предостережение, в отношении сигнализирования. Вы — информированная сторона, и вам доступно действие, которое может достоверно передать хорошую информацию (то есть ту, что наверняка пойдет вам на пользу). Если вам не удастся отправить такой сигнал, это будет воспринято как плохая информация. В этом отношении сигнализирование подобно игре в труса: если вы откажетесь играть, вы уже сыграли и проиграли.

Вы должны помнить об этом, решая, какой курс выбрать — тот, который оценивается по буквенной системе или по принципу «зачтено / не зачтено». Студенты, изучающие тот или иной курс, получают весь диапазон оценок; предположим, средняя оценка — B. Очевидно, что каждый студент прекрасно знает свои способности. У студентов, достаточно уверенных в получении оценки A+, есть мощный стимул пройти сложный курс, который оценивается по буквенной системе. Если они это сделают, средняя оценка остальных студентов окажется меньше B, скажем B−, поскольку это экстремальное значение исключается из распределения. Теперь уже студенты, рассчитывающие на оценку «A», заинтересованы в выборе курса с буквенной системой оценивания, что, в свою очередь, снижает среднюю оценку остальных, и т. д. В итоге студенты выбирают курс, который оценивается по принципу «зачтено / не зачтено», но это касается лишь тех, кто надеется на оценки C и D. Стратегически грамотный читатель приложения к диплому (потенциальный работодатель или член приемной комиссии вуза) знает, что курс с системой оценивания «зачтено / не зачтено» в основном выбирают студенты из нижней части распределения оценок. По этой причине он воспримет оценку «зачтено» как C или D, а не как среднюю оценку всей группы B.

 

6. Равновесия в сигнальных играх с двумя участниками

До сих пор наш анализ охватывал общую концепцию неполной информации, а также конкретные стратегии сигнализирования и скрининга. Кроме того, мы рассмотрели возможные результаты разделения или объединения типов, которые могут возникнуть вследствие применения этих стратегий. Мы видели, как на рынке с большим количеством владельцев автомобилей и покупателей может сформироваться неблагоприятный отбор, а также как работают инструменты сигнализирования и скрининга в условиях взаимодействия работодателей и работников. Тем не менее мы еще не описали в этой главе решения игры с участием двух игроков, владеющих разной информацией. Ниже приводится пример решения такой игры с использованием дерева игры и таблицы выигрышей в качестве инструментов анализа. Мы увидим, что равновесием в ней может быть либо разделение, либо объединение типов, а также высока вероятность формирования частично раскрывающего или полуразделяющего равновесия.

А. Базовая модель и структура выигрышей

В данном разделе мы проанализируем игру с асимметричной информацией «выход на рынок», в качестве участников которой выступают две автомобилестроительные компании, Tudor и Fordor. В настоящее время корпорация Tudor имеет монополию на рынке автомобилей определенного типа, скажем экономичных малолитражек, не загрязняющих окружающую среду. Инновационная компания Fordor разработала конкурирующую концепцию автомобиля и решает, стоит ли ей выходить на рынок. Однако Fordor не знает, насколько жестким конкурентом окажется Tudor. В частности, издержки производства компании Tudor (о которых Fordor ничего не известно) могут быть высокими или низкими. Если они высокие, Fordor может выйти на рынок и вступить в конкурентную борьбу, получая прибыль; если низкие, выход Fordor на рынок и затраты на разработку невозможно будет возместить за счет операционной прибыли, а значит, ее выход на рынок будет абсолютно убыточным.

Взаимодействие между компаниями представляет собой игру с последовательными ходами. На ее первом этапе (период 1) Tudor устанавливает цену (для простоты предположим, что высокую или низкую), зная, что она единственный производитель автомобилей такого класса на рынке. На следующем этапе Fordor принимает решение о выходе на рынок. Выигрыши (или прибыль) компаний определяются на основании рыночной цены автомобиля с учетом издержек производства каждой компании, а в случае Fordor еще и с учетом затрат в связи с выходом на рынок и разработку автомобиля.

Безусловно, для Tudor было бы лучше, если бы Fordor не выходила на рынок, поэтому на первом этапе игры Tudor может попытаться использовать цену автомобиля как сигнал об издержках производства. Компания с низкими издержками установила бы более низкую цену, чем с высокими. Следовательно, Tudor может рассчитывать на то, что, если на протяжении периода 1 она сохранит низкую цену на автомобиль, Fordor интерпретирует это как доказательство низких издержек производства Tudor и не станет выходить на рынок. (Как только Fordor откажется от дальнейшей борьбы и уйдет со сцены, Tudor может снова поднять цену на авто.) Подобно тому как в покере игрок может блефовать, рассчитывая на то, что это сработает и соперник сбросит карты, Tudor также может попытаться удержать Fordor от выхода на рынок посредством блефа. Разумеется, компания Fordor — стратегический игрок и знает о подобном трюке. Вопрос в том, сможет ли Tudor успешно блефовать в случае равновесия в данной игре. Ответ зависит от вероятности того, что в Tudor действительно низкие издержки производства, а также от затрат на введение конкурента в заблуждение. Ниже мы проанализируем различные варианты развития событий и покажем полученные в результате равновесия.

Во всех этих случаях затраты на единицу продукции и цены выражены в тысячах долларов, а количество проданных автомобилей — в сотнях тысяч, поэтому прибыль измеряется в сотнях миллионов. Это поможет нам представить выигрыши и таблицы в достаточно компактной, удобной для чтения форме. Мы вычислим выигрыши с помощью тех же инструментов анализа, которые применяли в игре с ценообразованием в ресторанах в , при этом будем исходить из предположения, что зависимость между назначенной ценой (P) и величиной спроса (Q) описывается формулой: P = 25 — Q30.

Чтобы выйти на рынок, компания Fordor должна понести первоначальные затраты в размере 40 (в тех же единицах, что и прибыли, в сотнях миллионов, то есть фактический показатель составит 4 миллиарда долларов) на строительство завода, проведение рекламной кампании и т. д. Если затем она выходит на рынок, затраты на производство и поставку на рынок каждого автомобиля составят 10 (тысяч долларов).

Tudor может быть либо громоздкой старой компанией с высокими издержками производства на единицу продукции, составляющими 15 (тысяч долларов), либо динамичным автопроизводителем с более низкими затратами на единицу продукции. Для начала допустим, что более низкие издержки составляют 5; этот показатель ниже затрат, которые может обеспечить Fordor. В и мы проанализируем эффект других уровней издержек. Пока же предположим, что Tudor может обеспечить более низкий уровень издержек с вероятностью 0,4, или в 40 % случаев; следовательно, вероятность того, что в этой компании высокий уровень издержек, равна 0,6, или 60 %.

Варианты выбора компании Fordor в игре «выход на рынок» зависят от того, что ей известно об издержках Tudor. Будем считать, что Fordor располагает информацией о двух возможных уровнях издержек и может вычислить прибыль в каждом из этих случаев. Таким образом, хотя Fordor неизвестно, к какому типу относится Tudor, предварительное убеждение Fordor в точности соответствует вероятности того, что в Tudor более низкий уровень издержек; иными словами, убеждение Fordor состоит в том, что вероятность вступить в борьбу с Tudor, имеющей низкий уровень издержек производства, составляет 40 %.

Если в Tudor высокий уровень издержек, например 15 (тысяч долларов), то в случае монополии, которой ничего не угрожает, компания максимизирует свою прибыль, установив на автомобили цену 20 (тысяч долларов). При такой цене Tudor продаст 5 (сотен тысяч) автомобилей и заработает 25 [= 5 × (20–15) сотен миллионов долларов, или 2,5 миллиарда долларов]. Если Fordor выйдет на рынок и составит конкуренцию Tudor, то равновесие Нэша в этой игре в дуополию обеспечит Tudor операционную прибыль 3, а Fordor 45. Эта операционная прибыль превышает первоначальные затраты Fordor в связи с выходом на рынок (40), поэтому если бы компания знала, что в Tudor высокий уровень издержек, она решила бы выйти на рынок и заработать чистую прибыль в размере 5.

Если в Tudor низкий уровень затрат (5), то при наличии монополии, которой ничто не угрожает, компания установит на свои автомобили цену 15, продаст 10 и заработает прибыль 100. В случае равновесия, сформировавшегося на втором этапе игры после выхода на рынок Fordor, операционная прибыль Tudor составит 69, а Fordor 11, что меньше затрат Fordor в связи с выходом на рынок (40). Следовательно, если бы Fordor знала, что в Tudor низкий уровень затрат, она бы не выходила на рынок и тем самым предотвратила бы убыток 29.

Б. Разделяющее равновесие

Если у компании Tudor на самом деле высокий уровень издержек производства, но она хочет, чтобы в Fordor считали, будто он низкий, она должна имитировать действия компании с низкими издержками, то есть установить на свои автомобили цену 15. Но эта цена равна себестоимости единицы продукции, а значит, компания получит нулевую прибыль. Будет ли такая жертва Tudor оправданна? Отпугнет ли она Fordor и обеспечит преимущества монополии в дальнейшем?

Полная игра представлена в экстенсивной форме на рис. 8.7. Обратите внимание, что, как и в , мы используем здесь игрока по имени «природа», для того чтобы выбрать тип издержек Tudor в самом начале игры. Далее Tudor принимает решение о цене. Мы исходим из предположения, что, если в Tudor низкий уровень издержек, она не установит высокую цену. Но если высокий, она может выбрать либо высокую, либо низкую цену, если захочет ввести конкурента в заблуждение. Fordor не может провести различие между двумя ситуациями, в которых Tudor устанавливает низкую цену на автомобили, поэтому варианты выбора Fordor в отношении выхода на рынок, который она делает в этих узлах, объединяются в одно информационное множество. Следовательно, Fordor должна применить в обоих узлах либо стратегию «выйти на рынок», либо «отказаться от выхода на рынок».

Рис. 8.7. Экстенсивная форма игры «выход на рынок»: низкий уровень издержек в Tudor — 5

В каждом концевом узле первый элемент записи выигрышей (выделено серым цветом) — это прибыль компании Tudor, а второй элемент (выделено черным цветом) — прибыль компании Fordor. Прибыль Tudor суммируется за два периода: первый — когда Tudor — единственный производитель автомобилей данного класса, и второй — когда Tudor может быть либо монополистом, либо участником дуополии в зависимости от решения Fordor о выходе на рынок. Прибыль Fordor охватывает только второй период и отличается от нуля лишь в случае выхода компании на рынок.

Один шаг анализа методом обратных рассуждений позволяет определить, что в нижнем узле, где компания Tudor выбрала высокую цену, Fordor выберет вариант «выйти на рынок», поскольку 45–40 + 5 > 0. Следовательно, мы можем отсечь в этом узле ветвь «не выходить на рынок». В результате у каждого игрока остается две стратегии (исчерпывающих плана действий): у Tudor — стратегия «блефовать», или выбрать низкую цену на период 1 независимо от уровня затрат (сокращенно НН в той системе обозначений, о которой шла речь в ), а также «поступить честно», или выбрать низкую цену на протяжении периода 1, если издержки низкие, и высокую цену, если издержки высокие (НВ). У Fordor — стратегия «независимо от обстоятельств», или выйти на рынок независимо от цены, которую установит Tudor на период 1 (сокращенно РР вместо «рынок, рынок»), и «в зависимости от обстоятельств», или выйти на рынок, только если Tudor установит высокую цену на протяжении периода 1 (сокращенно ОР вместо «отказ, рынок»).

Теперь мы можем представить эту игру в стратегической (нормальной) форме. На рис. 8.8 показан каждый игрок с двумя возможными стратегиями; выигрыши в каждой ячейке — ожидаемая прибыль каждой компании, полученная с учетом вероятности (40 %) того, что в Tudor низкий уровень издержек. Эти расчеты аналогичны выполненным нами для заполнения таблицы на . Как и тогда, вы можете упростить расчеты, если обозначите концевые узлы дерева игры и определите, какие из них соответствуют каждой ячейке таблицы.

Рис. 8.8. Стратегическая форма игры «выход на рынок»: низкий уровень издержек Tudor — 5

Это простая игра, разрешимая по доминированию. В случае Tudor стратегия «поступить честно» доминирует над стратегией «блефовать». А наилучший ответ Fordor на доминирующую стратегию Tudor «поступить честно» — «в зависимости от обстоятельств». Таким образом, «поступить честно» / «в зависимости от обстоятельств» — единственное равновесие Нэша в этой игре (совершенное равновесие подыгры).

Равновесие, найденное на , будет разделяющим. Для двух типов издержек компания Tudor устанавливает разные цены на период 1. Это действие раскрывает компании Fordor тип Tudor, которая после этого принимает соответствующее решение о выходе на рынок.

Ключ к пониманию того, почему стратегия «поступить честно» для Tudor доминирующая, можно найти в сравнении выигрышей компании в случае стратегии Fordor «в зависимости от обстоятельств». Вот исходы игры, если стратегия Tudor «блефовать» сработает: Fordor выйдет на рынок, если Tudor установит высокую цену на период 1, и откажется от этого, если Tudor установит низкую цену на период 1. Если в Tudor действительно низкий уровень издержек, то ее выигрыши против стратегии Fordor «в зависимости от обстоятельств» одни и те же независимо от того, какую стратегию она применит — «блефовать» или «поступить честно». Однако если в Tudor высокий уровень издержек, результаты будут разниться.

Если Fordor выберет стратегию «в зависимости от обстоятельств», а Tudor — высокие издержки, Tudor может успешно использовать стратегию блефа. Однако успешный блеф обойдется ей слишком дорого. Если бы в Tudor назначили самую выгодную монопольную цену (стратегия «поступить честно») на период 1, компания получила бы прибыль 25; низкая цена при блефе кардинально сокращает размер прибыли на протяжении периода 1, в данном случае до 0. Более высокая монопольная цена в течение периода 1 стимулировала бы выход Fordor на рынок и уменьшила бы прибыль Tudor за период 2 с монопольного уровня 25 до дуопольного уровня 3. Тем не менее выгода Tudor, полученная на протяжении периода 2 за счет установления низкой цены (стратегия «блефовать») и препятствования выходу Fordor на рынок (25 — 3 = 22), меньше издержек, чем в периоде 1, понесенных вследствие блефа и потери монопольной прибыли (25 — 0 = 25). При наличии малейшей положительной вероятности того, что в Tudor высокий уровень издержек, преимущества от выбора стратегии «поступить честно» превзойдут преимущества от стратегии «блефовать», даже если компания Fordor применит стратегию «в зависимости от обстоятельств».

Если бы низкая цена была не настолько низкой, то при наличии высоких издержек Tudor пошла бы на меньшие жертвы, имитируя тип компании с низкими издержками. Ниже мы проанализируем именно эту возможность.

В. Объединяющее равновесие

Давайте представим, что более низкие издержки производства в Tudor составляют 10 на один автомобиль, а не 5. При таком изменении их уровня компания Tudor, в которой на самом деле высокие издержки, по-прежнему заработает прибыль 25 в случае монополии, если изменит цену 20, обеспечивающую максимальную прибыль. Но теперь Tudor как компания с низким уровнем издержек установит цену 17,5 в качестве монополиста (вместо 15) и заработает прибыль 56. Если компания с высоким уровнем издержек будет имитировать их низкий уровень и тоже установит цену 17,5, ее прибыль составит 19, а не 0, как в предыдущем примере; в таком случае потеря прибыли в результате блефа гораздо меньше: 25 − 19 = 6, а не 25. Если Fordor выйдет на рынок, то прибыль двух компаний в их игре в дуополию составит 3 для Tudor и 45 для Fordor, если в Tudor высокий уровень издержек (как в предыдущем разделе). В дуополии прибыль каждой компании теперь равна 25, если в Tudor низкий уровень издержек; в этой ситуации у Fordor и у Tudor с низким уровнем издержек будет одинаковый уровень затрат на единицу продукции в размере 10.

Теперь предположим, что Tudor относится к типу компаний с низким уровнем издержек с вероятностью 40 % (0,4), а убеждение Fordor в отношении вероятности низких издержек в Tudor верно. Новое дерево игры изображено на рис. 8.9. Поскольку Fordor все так же выберет вариант «выйти на рынок», если Tudor установит высокую цену, ситуация снова будет сведена к игре, в которой у каждого игрока есть ровно две исчерпывающие стратегии и они те же, что и в . Таблица выигрышей для нормальной формы игры представлена на рис. 8.10.

Рис. 8.9. Экстенсивная форма игры «выход на рынок»: в Tudor низкий уровень издержек — 10

Рис. 8.10. Стратегическая форма игры «выход на рынок»: в Tudor низкий уровень издержек — 10

Это еще одна игра, разрешимая по доминированию. Но сейчас доминирующей стратегией располагает компания Fordor: она всегда будет выбирать вариант «в зависимости от обстоятельств». А при условии доминирования стратегии «в зависимости от обстоятельств» Tudor всегда будет выбирать «блефовать». Таким образом, «блефовать» / «в зависимости от обстоятельств» — единственное равновесие Нэша в этой игре (совершенное равновесие подыгры). Во всех остальных ячейках таблицы одна компания может добиться большего, переключившись на другое действие. Мы предоставляем вам возможность подумать над тем, почему каждое такое отклонение выгодно компании.

Равновесие, найденное на , подразумевает объединение. При обоих типах издержек Tudor устанавливает одну и ту же (низкую) цену, а Fordor, видя это, отказывается выходить на рынок. Знание этой цены не дает Fordor никакой информации. По оценке Fordor, вероятность того, что в Tudor низкие издержки производства, остается 0,4; компания определяет ожидаемую прибыль от выхода на рынок в размере −3 < 0, поэтому решает не выходить. Даже если Fordor прекрасно известно, что Tudor блефует в равновесии, риск в связи с раскрытием блефа слишком велик, поскольку вероятность того, что в Tudor действительно низкий уровень затрат, достаточно высока.

Но что если бы эта вероятность была меньше (скажем, 0,1) и Fordor об этом знала? Если все остальные показатели не изменятся, ожидаемая прибыль Fordor от стратегии «независимо от обстоятельств» составит –15 × 0,1 + 5 × 0,9 = 4,5–1,5 = 3 > 0. Тогда Fordor выйдет на рынок, какую бы цену ни установила Tudor, и блеф Tudor не возымеет действия. Такая ситуация приводит к формированию нового равновесия, характеристики которого мы рассмотрим ниже.

Г. Полуразделяющее равновесие

Теперь проанализируем исходы игры «выход на рынок» в ситуации, когда вероятность достижения Tudor низкого уровня издержек производства в размере 10 составляет всего 10 % (0,1). Все показатели затрат и прибыли те же, что и в предыдущем разделе, изменилась только вероятность. Поэтому мы не приводим здесь повторно дерево игры (), а покажем только таблицу выигрышей (рис. 8.11).

Рис. 8.11. Стратегическая форма игры «выход на рынок»: низкий уровень издержек в Tudor составляет 10 с вероятностью 0,1

В новой ситуации в игре, представленной на рис. 8.11, нет равновесия в чистых стратегиях. С парой стратегий «блефовать» / «независимо от обстоятельств» Tudor выигрывает, переключившись на «поступить честно»; с парой «поступить честно» / «независимо от обстоятельств» Fordor выигрывает, переключившись на «в зависимости от обстоятельств»; с парой «поступить честно» / «в зависимости от обстоятельств» Tudor выигрывает, переключившись на стратегию «блефовать»; с парой «блефовать» / «в зависимости от обстоятельств» Fordor выигрывает, переключившись на «независимо от обстоятельств». Мы снова предоставляем вам возможность самостоятельно поразмышлять над тем, почему каждое из этих отклонений выгодно.

Таким образом, теперь нам нужно искать равновесие в смешанных стратегиях. Предположим, Tudor смешает стратегии «блефовать» и «поступить честно» с вероятностями p и (1 — p) соответственно. Аналогичным образом Fordor смешает стратегии «независимо от обстоятельств» и «в зависимости от обстоятельств» с вероятностями q и (1 — q) соответственно. Выбранная Tudor p-комбинация должна поддерживать безразличие компании Fordor в отношении выбора между ее двумя чистыми стратегиями «независимо от обстоятельств» и «в зависимости от обстоятельств», поэтому нам нужно, чтобы выполнялось равенство

3 p  + 3(1 — p ) = 0 p  + 4,5(1 — p ), или 4,5(1 — p ) = 3, или 1 — p  = 2/3, или p  = 1/3.

В свою очередь, q-комбинация Fordor должна поддерживать безразличие компании Tudor в отношении выбора между ее двумя чистыми стратегиями «блефовать» и «поступить честно», а значит, необходимо выполнение равенства

27,9 q  + 50,8(1 — q ) = 33,3 q  + 36,4(1 — q ), или 5,4 q  = 14,4(1 — q ), или q  = 14,4/19,8 = 16/22 = 0,727.

В таком случае равновесие данной игры в смешанных стратегиях сводится к тому, что Tudor будет выбирать стратегию «блефовать» с вероятностью 1/3, а «поступить честно» с вероятностью 2/3, тогда как Fordor будет выбирать «независимо от обстоятельств» с вероятностью 16/22, а «в зависимости от обстоятельств» с вероятностью 6/22.

В этом равновесии типы Tudor разделены лишь частично. Tudor с низким уровнем затрат всегда устанавливает низкую цену на период 1, тогда как Tudor с высоким уровнем затрат смешивает чистые стратегии и устанавливает низкую цену в одной трети случаев. Если Fordor наблюдает высокую цену на протяжении периода 1, она может быть уверена, что Tudor — компания с высоким уровнем издержек, и всегда будет выбирать стратегию выхода на рынок. Но в случае низкой цены Fordor не будет знать, с каким типом Tudor имеет дело — с компанией с действительно низким уровнем издержек или с блефующей компанией, в которой на самом деле высокий уровень затрат. В такой ситуации Fordor также будет придерживаться смешанной стратегии, выбирая выход на рынок в 72,7 % случаев. Стало быть, высокая цена передает исчерпывающую информацию, тогда как низкая лишь частично раскрывает информацию о типе Tudor. Именно поэтому равновесие такого типа называется полуразделяющим.

Для того чтобы лучше понять смешанные стратегии каждой компании и полуразделяющее равновесие, проанализируем, как Fordor может применить частичную информацию, которую раскрывает низкая цена, установленная Tudor. Видя низкую цену на протяжении периода 1, Fordor сможет использовать это наблюдение для обновления своего убеждения в отношении вероятности того, что Tudor — компания с низким уровнем издержек; это можно сделать с помощью теоремы Байеса. Таблица расчетов представлена на рис. 8.12; она аналогична таблице на в приложении.

Рис. 8.12. Применение теоремы Байеса в игре «выход на рынок»

В этой таблице возможные типы издержек Tudor приведены в строках, а цены, наблюдаемые Fordor, — в столбцах. Значения в ячейках представляют собой вероятность того, что Tudor типа, указанного в соответствующей строке, выберет цену, указанную в соответствующем столбце (в котором отображены вероятности применения чистых стратегий в равновесной смешанной стратегии Tudor). В последней строке и последнем столбце таблицы отображены общие вероятности каждого типа и наблюдения каждой цены соответственно.

Согласно правилу Байеса, когда Fordor увидит, что Tudor устанавливает низкую цену на период 1, она пересмотрит свое убеждение относительно вероятности того, что в Tudor низкий уровень затрат. Для этого Fordor разделит вероятность того, что Tudor с низким уровнем издержек установит низкую цену (значение 0,1 в верхней левой ячейке), на общую вероятность того, что Tudor для двух типов издержек выберет низкую цену (значение 0,4, сумма по левому столбцу). Эти расчеты позволяют получить скорректированное убеждение Fordor относительно вероятности того, что в Tudor низкий уровень издержек: 0,1/0,4 = 0,25. Затем Fordor также уточнит значение ожидаемой прибыли от выхода на рынок: –15 × 0,25 + 5 × 0,75 = 0. Стало быть, равновесная комбинация Tudor такова, что компании Fordor безразлично, выходить ей на рынок или нет, если она видит низкую цену, установленную Tudor на период 1. Именно такой исход необходим для поддержания стремления Tudor смешивать чистые стратегии в равновесии.

Исходная вероятность 0,1 того, что в Tudor низкий уровень издержек, слишком низкая, чтобы удержать Fordor от выхода на рынок. Пересмотренная вероятность Fordor составляет 0,25 после наблюдения за низкой ценой, установленной Tudor на период 1. Почему? Именно по той причине, что в случае высоких издержек Tudor не всегда блефует. Если бы это было так, то низкая цена не передавала бы никакой информации и тогда пересмотренная вероятность Fordor составляла бы 0,1 и компания приняла бы решение выйти на рынок. Но если Tudor с высоким уровнем издержек блефует лишь иногда, то низкая цена с большей вероятностью свидетельствует о низких издержках.

В игре «выход на рынок» мы определили равновесия интуитивно понятным способом, а теперь вернемся назад и проанализируем их характер более систематически. В каждом конкретном случае мы сначала убеждались, что стратегия каждого игрока (и каждого типа) оптимальна с учетом стратегий остальных игроков, и применяли концепцию равновесия Нэша. Далее удостоверялись, что игроки делают правильные выводы из своих наблюдений; это потребовало вычисления вероятностей с помощью теоремы Байеса, а именно вероятностей в полуразделяющем равновесии. Совокупность концепций, необходимых для идентификации равновесий в таких играх с асимметричной информацией, оправдывает их обозначение термином байесовские равновесия Нэша. И наконец, хотя это и была весьма незначительная часть примера, мы выполнили анализ методом обратных рассуждений, или совершенного равновесия подыгры. Использование обратных рассуждений дает основания назвать данное равновесие совершенным байесовским равновесием. Наш пример содержит все эти концепции равновесия; вы встретитесь с несколько более сложным вариантом некоторых из них в следующих главах, а также в более полном контексте в ходе дальнейшего изучения теории игр.

 

Резюме

Столкнувшись с несовершенной или неполной информацией, игроки с разным отношением к риску или разным объемом имеющейся информации могут прибегнуть к стратегическим действиям в целях управления и манипулирования риском и информацией в соответствующей игре. Игроки могут уменьшить риск посредством применения различных схем платежей или его разделения с другими, хотя последний способ осложняют такие аспекты, как моральный риск и неблагоприятный отбор. Иногда риском можно манипулировать в пользу игрока в зависимости от сложившихся в игре обстоятельств.

Игроки, владеющие личной информацией, могут захотеть ее скрыть или обнародовать, тогда как игроки, у которых такой информации нет, могут попытаться ее получить или не делать этого. При наличии асимметричной информации дела убедительнее слов. Для того чтобы раскрыть информацию, необходимо подать достоверный сигнал. Когда обычных слов для достоверной передачи информации достаточно, может возникнуть равновесие дешевого разговора; в его достижении важную роль играет степень согласованности интересов игроков. Когда информационное содержание слов игрока не принимается во внимание, в игре наблюдается равновесие пустого разговора.

В более общем смысле информацию передают любые конкретные действия, предпринятые игроками. Сигнализирование обеспечивает требуемый результат, только если сигнальное действие влечет за собой различные издержки для игроков с разной информацией. Когда простой постановки вопросов для получения правдивой информации недостаточно, может понадобиться схема скрининга, предназначенная для обнаружения конкретного действия. Скрининг обеспечивает требуемые результаты, только когда инструмент скрининга стимулирует других игроков раскрыть правдивую информацию о своем типе; разделение типов возможно лишь при наличии совместимости стимулов. Иногда достоверное сигнализирование или скрининг могут оказаться невозможны; в таком случае равновесие может повлечь за собой объединение типов или вероятен полный крах рынка или сделки для одного из типов. Многочисленные примеры сигнализирования и скрининга можно наблюдать в обычных ситуациях, таких как рынок труда или страхование. Фактические данные о способности игроков достигать совершенного байесовского равновесия говорят о том, что, несмотря на трудности вычисления необходимых вероятностей, такие равновесия встречаются достаточно часто. Различные экспериментальные данные, по всей видимости, в значительной мере зависят от схемы проведения эксперимента.

В равновесии игры с асимметричной информацией игроки должны не только использовать свои наилучшие действия с учетом имеющейся информации, но и делать правильные выводы (обновлять информацию) в процессе наблюдения за действиями других игроков. Этот тип равновесия известен как байесовское равновесие Нэша. При необходимости выполнить требование об оптимальности действий во всех узлах (как в ходе анализа методом обратных рассуждений) данное равновесие становится совершенным байесовским равновесием. Исход такой игры может подразумевать объединение, разделение и частичное разделение типов в зависимости от особенностей структуры выигрышей и способов уточнения информации, используемых игроками. В некоторых диапазонах параметров такие игры могут иметь различные типы совершенных байесовских равновесий.

 

Ключевые термины

Байесовское равновесие Нэша

Инструмент скрининга

Моральный риск

Неблагоприятный отбор

Объединение типов

Ограничения совместимости стимулов

Отрицательная корреляция

Положительная корреляция

Полуразделяющее равновесие

Равновесие дешевого разговора

Равновесие пустого разговора

Разделение типов

Самоотбор

Сигнал

Сигнализирование

Скрининг

Совершенное байесовское равновесие

Совместимость стимулов

Типы игроков

Условия совместимости стимулов

Условия участия

Частично раскрывающее равновесие

 

Упражнения с решениями

S1. В примере с торговлей рисками из у вас был рискованный доход в сумме 160 000 долларов в случае удачи (вероятность 0,5) и 40 000 долларов в случае неудачи (вероятность 0,5). При наличии у вашего приятеля гарантированного дохода 100 000 долларов мы вывели схему, в соответствии с которой вы могли устранить весь свой риск и в то же время немного повысить ожидаемую полезность для приятеля. Предположим, для каждого из вас полезность по-прежнему равна квадратному корню из соответствующего дохода. Однако теперь пусть вероятность удачи составляет 0,6. Придумайте контракт, который позволит вам получить доход в размере 100 000 долларов, когда вас постигнет неудача. Пусть x — это сумма, которую вы выплатите при этом приятелю.

a) При каком минимальном значении x (с точностью до цента) ваш приятель отдаст хотя бы малейшее предпочтение заключению контракта его полному отсутствию?

b) При каком максимальном значении x (с точностью до цента) такой контракт обеспечит вам чуть более высокую ожидаемую полезность, чем его полное отсутствие?

S2. Местная благотворительная организация получила пожертвование на бесплатные обеды для бездомных в своем городе, но ее руководство обеспокоено тем, что этой программой могут воспользоваться студенты близлежащего колледжа, которые не прочь бесплатно поесть. И бездомный, и студент получают за бесплатную еду выигрыш 10. Издержки в связи с необходимостью стоять в очереди за обедом составляют t2/320 для бездомного и t2/160 для студента, где t — количество времени (в минутах), проведенного в очереди. Предположим, сотрудники благотворительной организации не могут определить истинный тип тех, кто приходит бесплатно поесть.

a) При каком минимальном значении времени ожидания t будет достигнуто разделение типов?

b) Через какое-то время сотрудники благотворительной организации уже могут успешно идентифицировать студентов и отказать им в обеде в половине случаев. Студенты, получившие отказ, несут дополнительные издержки в размере 5 в связи с потерей времени в очереди и испытанным стыдом. Уменьшит или увеличит частичная идентификация студентов колледжа ответ, полученный в пункте а? Обоснуйте свой вывод.

S3. Рассмотрим рынок подержанных автомобилей марки Citrus 2011 года, о котором шла речь в . Теперь спрос на них резко вырос, и покупатели готовы выложить 18 000 за «апельсин» и 8000 за «лимон». Все остальные показатели те же, что и в примере в .

a) Какую цену покупатели были бы готовы заплатить на Citrus 2011 года неизвестного типа, если бы доля «апельсинов» f в общей совокупности подержанных автомобилей Citrus составила 0,6?

b) Сформируется ли рынок «апельсинов» при f = 0,6? Обоснуйте свой ответ.

c) Какую цену покупатели были бы готовы заплатить, если бы значение f равнялось 0,2?

d) Сформируется ли рынок «апельсинов» при f = 0,2? Обоснуйте ответ.

e) При каком минимальном значении f рынок «апельсинов» не рухнет?

f) Объясните, почему повышение готовности покупателей платить приводит к изменению порогового значения f, при котором наступает крах рынка «апельсинов».

S4. Представим, что электрики бывают двух типов: компетентные и некомпетентные. Оба типа электриков могут получить сертификаты, но некомпетентным электрикам для этого понадобится больше времени и усилий. Компетентным электрикам нужно С месяцев, чтобы подготовиться к экзамену на получение сертификата; некомпетентным — в два раза больше. Сертифицированные электрики могут зарабатывать 100 (тысяч долларов) в год, работая на строительных площадках лицензированных подрядчиков. Электрики без сертификата могут зарабатывать только 25 (тысяч долларов) в год, работая на себя (лицензированные подрядчики их не наймут). Каждый тип электрика получает выигрыш, равный √S — M, где S — заработная плата, выраженная в тысячах долларов, а M — количество месяцев, потраченных на получение сертификата. При каком диапазоне значений C компетентный электрик примет решение подать сигнал посредством этого инструмента, тогда как некомпетентный решит этого не делать?

S5. Вернемся к примеру с компаниями Tudor и Fordor из , когда издержки Tudor на единицу продукции составляют 5. Пусть z — вероятность того, что в Tudor действительно низкий уровень затрат на единицу продукции.

a) Перепишите таблицу на  с учетом значения z.

b) Сколько равновесий в чистых стратегиях существует при z = 0? Обоснуйте ответ.

c) Сколько равновесий в чистых стратегиях существует при z = 1? Обоснуйте ответ.

d) Докажите, что равновесие Нэша в этой игре — это разделяющее равновесие при любом значении z в диапазоне от 0 до 1 (включительно).

S6. Опять же, вернувшись к примеру с Tudor и Fordor, предположим, что старая, авторитетная компания Tudor не расположена к риску, тогда как потенциальный участник рынка Fordor (планирующий финансировать свой проект за счет венчурного капитала) относится к нему нейтрально. Иными словами, полезность для Tudor неизменно равна квадратному корню из общей прибыли за оба периода. Полезность в случае Fordor — просто объем прибыли (если она есть), полученной за второй период. Допустим, издержки Tudor на единицу продукции составляют 5, как и в .

a) Представьте игру в экстенсивной форме (как показано на ), указав соответствующие выигрыши для компании Tudor, не расположенной к риску.

b) Пусть вероятность z того, что Tudor — компания с низким уровнем издержек, составляет 0,4. Будет ли равновесие в такой игре разделяющим, объединяющим или полуразделяющим? (Подсказка: используйте таблицу, эквивалентную представленной на .)

c) Выполните задание пункта b при z = 0,1.

S7. Вернемся к ситуации, в которой компания Tudor нейтральна к риску, но с низкими затратами на единицу продукции, равными 6 (вместо 5 или 10, как в ). Если в Tudor низкий уровень издержек, то компания заработает 90 в рамках монополии, обеспечивающей максимальную прибыль. Если Fordor выйдет на рынок, Tudor заработает 59 в рамках сформировавшейся дуополии, тогда как Fordor — 13. Если в Tudor на самом деле высокий уровень издержек (то есть затраты на единицу продукции составляют 15), а цены установлены на таком уровне, как если бы он был низкий (издержки на единицу продукции составляют 6), то в случае монополии она заработает 5.

a) Нарисуйте дерево этой игры, эквивалентное представленному на или , изменив соответствующие выигрыши.

b) Составьте нормальную форму этой игры исходя из предположения, что вероятность низкой цены в Tudor равна 0,4.

c) Найдите равновесие игры. Оно разделяющее, объединяющее или полуразделяющее? Обоснуйте свой ответ.

S8. Феликс и Оскар играют в упрощенную версию покера. Каждый делает начальную ставку в размере 8 долларов. Затем каждый по отдельности тянет карту, которая с равной вероятностью может оказаться старшей или младшей. Каждый видит свою карту, но не видит карты соперника.

Далее Феликс решает, какое действие выбрать — «выйти из игры» или «поднять ставку» (добавить в банк 4 доллара). Если «выйти из игры», обе карты открываются и сравниваются. Если карты разные, то игрок со старшей картой забирает весь банк. В банке 16 долларов, из которых 8 долларов внес сам победитель, то есть его чистый выигрыш 8 долларов. Выигрыш проигравшего равен −8 долларам. Если карты одинаковые, банк делится поровну и каждый игрок получает свои 8 долларов (выигрыш 0) назад.

Если Феликс сыграет «повысить ставку», Оскару необходимо решить, какое действие выбрать — «сбросить карту» (сдаться) или «раскрыть карту» (добавить в банк сумму в 4 доллара). Если «сбросить карту», то Феликс забирает весь банк независимо от того, какие у него карты. Если «раскрыть карту», то карты открываются и сравниваются. Процедура та же, что описана в предыдущем абзаце, только теперь в банке больше денег.

a) Представьте эту игру в экстенсивной форме (будьте внимательны с информационными множествами).

Если отобразить эту игру в нормальной форме, в распоряжении Феликса есть четыре стратегии: 1) «выйти из игры» в любом случае (сокращенно ВВ); 2) «поднять ставку» в любом случае (ПП); 3) «поднять ставку», если своя карта старшая, и «выйти из игры», если своя карта младшая (ПВ); 4) наоборот (ВП). В распоряжении Оскара тоже четыре стратегии: 1) «сбросить карту» в любом случае (СС); 2) «раскрыть карту» в любом случае (РР); 3) «раскрыть карту», если своя карта старшая, и «сбросить карту», если своя карта младшая (РС); 4) наоборот (СР).

b) Покажите, что таблица выигрышей Феликса выглядит следующим образом.

(В каждом случае вам необходимо определить ожидаемое значение посредством вычисления средних результатов по каждой из четырех возможных комбинаций вытягивания карт.)

a) Исключите как можно больше доминируемых стратегий. Найдите в оставшейся таблице равновесие в смешанных стратегиях, а также определите в нем ожидаемый выигрыш Феликса.

b) Основываясь на своих знаниях теории сигнализирования и скрининга, дайте интуитивное объяснение того, почему в этом равновесии присутствуют смешанные стратегии.

S9. Феликс и Оскар играют в другую версию упрощенного покера и делают начальную ставку в один доллар. Феликс (и только Феликс) тянет одну карту, которая с равной вероятностью может оказаться либо королем, либо дамой (всего есть четыре короля и четыре дамы). У Феликса есть выбор: либо «сбросить карту», либо «сделать ставку». Если он выберет «сбросить карту», игра закончится и Оскар получит доллар Феликса в дополнение к своему доллару. Если Феликс сыграет «сделать ставку», он вносит в банк еще один доллар и уже Оскар решает, что делать: «сбросить карту» или «ответить».

Если Оскар выберет «сбросить карту», Феликс выигрывает банк (в котором начальная ставка Оскара один доллар и два доллара Феликса). Если Оскар выберет «ответить», он вносит в банк еще один доллар в ответ на ставку Феликса, а Феликс открывает карту. Если это король, Феликс выигрывает банк (в котором по два доллара с каждого игрока). Если дама, банк выигрывает Оскар.

a) Представьте эту игру в экстенсивной форме (будьте внимательны с информационными множествами).

b) Сколько стратегий в распоряжении каждого игрока?

c) Представьте эту игру в стратегической форме, где указанные в каждой ячейке выигрыши — это ожидаемые выигрыши с учетом соответствующей стратегии каждого игрока.

d) Исключите доминируемые стратегии, если они есть. Найдите равновесие в смешанных стратегиях. Определите в нем ожидаемый выигрыш Феликса.

S10. Ванда работает официанткой и, соответственно, имеет возможность получать чаевые наличными, о которых ее работодатель не отчитывается перед налоговым управлением. Но доход Ванды от чаевых нестабильный. В хороший год (Х) он высокий, поэтому сумма налога, который она должна выплатить, равна 5000 долларов. В плохой год (П) — низкий, и обязательства Ванды перед налоговым управлением составляют 0 долларов. Налоговое управление знает, что вероятность хорошего года у Ванды равна 0,6, а вероятность плохого — 0,4, но ему неизвестно, как именно сложился у нее текущий налоговый год.

В этой игре Ванда сперва решает, о какой сумме дохода отчитаться перед налоговым управлением. Если она сообщит о получении высокого дохода (В), то заплатит налоговому управлению 5000 долларов, если о низком, то 0 долларов. Налоговое управление, в свою очередь, должно решить, проводить ли аудит доходов Ванды. В случае высокого дохода в нем нет необходимости, поскольку налоговое управление автоматически узнает о выплате Вандой соответствующего налога. Если же доход низкий, то налоговое управление может либо провести (А), либо не проводить (Н) аудит. Процедура аудита обходится налоговому управлению в 1000 долларов административных издержек, а Ванде — в 1000 долларов альтернативных издержек в связи с потраченным временем на сбор банковских выписок и встречи с аудитором. Если налоговое управление проводит аудит в плохой год (П), Ванда не должна выплачивать никаких налогов, хотя и она, и налоговое управление несут издержки по 1000 долларов в связи с данной процедурой. Если налоговое управление проводит аудит в хороший год (Х), Ванде придется выплатить 5000 долларов, которые она должна налоговому управлению, помимо издержек, которые она и налоговое управление понесут вследствие аудита.

a) Представим, что у Ванды был хороший год (Х), но она отчитывается в получении низкого дохода (Н). Предположим также, что налоговое управление проводит налоговый аудит (А). Определите общий выигрыш Ванды и общий выигрыш налогового управления.

b) У кого из участников игры есть стимул блефовать (то есть подавать ложный сигнал)? К чему будет сводиться этот блеф?

c) Представьте эту игру в экстенсивной форме (будьте внимательны с информационными множествами).

d) Сколько чистых стратегий есть в распоряжении каждого игрока в этой игре? Обоснуйте свой ответ.

e) Составьте матрицу игры в стратегической форме. Найдите все равновесия Нэша в этой игре. Определите, являются ли они разделяющими, объединяющими или полуразделяющими.

f) Пусть x — вероятность того, что у Ванды хороший год. В исходной версии игры x = 0,6. Найдите такое значение x, при котором Ванда всегда будет сообщать о низком доходе в случае равновесия.

g) Определите весь диапазон значений x, при которых Ванда всегда будет сообщать о низком доходе в случае равновесия.

S11. Структура системы здравоохранения включает несколько аспектов, касающихся вопросов информации и стратегии. Потребители медицинских услуг (потенциальные и фактические пациенты) располагают более полной информацией о состоянии своего здоровья, образе жизни и т. д., чем могут выяснить страховые компании. Поставщики медицинских услуг (врачи, больницы и пр.) знают о потребностях пациентов больше, чем сами пациенты или страховые компании. Кроме того, врачи больше знают о собственной квалификации и затратах труда, а больницы — о своей материальной базе. Страховые компании могут владеть определенным объемом статистической информации о результатах лечения или хирургических процедурах, полученной на основании данных за прошедший период. Но результаты зависят от множества ненаблюдаемых, случайных факторов, поэтому правильные выводы об уровне квалификации, затратах труда или материальной базе не могут быть сделаны только исходя из наблюдений. Фармацевтические компании больше других знают об эффективности лекарственных препаратов. Как правило, у всех этих игроков нет естественных стимулов делиться с другими полной или точной информацией. В процессе разработки данной схемы необходимо попытаться рассмотреть все эти вопросы и найти наиболее приемлемые решения.

Проанализируйте с этой точки зрения сравнительные преимущества различных схем оплаты: оплата за предоставленные услуги или выплата гонораров врачам, комплексные премии за год или оплата каждого визита к пациентам и т. д. Какие схемы наиболее выгодны для потребителей медицинских услуг? А для поставщиков медицинских услуг? Проанализируйте также сравнительные преимущества индивидуального страхования и покрытия расходов за счет общих налоговых поступлений.

S12. В телевизионном рекламном ролике известной торговой марки растворимого капучино мужчина принимает подругу у себя в квартире. Он хочет произвести на нее впечатление и предлагает кофе с десертом. Когда дама принимает предложение, мужчина идет на кухню готовить растворимый капучино и одновременно двигает ящики, выбрасывает что-то в мусорную корзину и т. д., чтобы создать такие звуки, как будто их издает первоклассная (и дорогая) кофемашина. Пока он делает все это, из комнаты слышится голос: «Я хочу увидеть эту машину…»

Используйте свои знания игр с асимметричной информацией, чтобы прокомментировать действия этой пары. Обратите внимание на их попытки применить сигнализирование и скрининг и укажите на конкретные примеры каждой стратегии. Выскажите свое мнение по поводу того, кто из участников этой игры лучший стратег.

S13 (дополнительное упражнение; необходимо ознакомиться с приложением). В примере с генетическим тестом предположим, что тест дает отрицательный результат (наблюдается последствие Y). Какова вероятность того, что у этого человека нет дефекта (что соответствует событию B)? Вычислите ее с помощью правила Байеса, а затем проверьте ответ, выполнив перебор 10 000 членов данной совокупности.

S14 (дополнительное упражнение; необходимо ознакомиться с приложением). Вернемся к примеру с автомобилями марки Citrus 2011 года из . У покупателя нет возможности по внешнему виду отличить надежные «апельсины» от незадачливых «лимонов». В этом примере, если доля «апельсинов» f в общей совокупности подержанных автомобилей Citrus меньше 0,65, продавец «апельсина» не захочет с ним расставаться за максимальную цену, которую готовы заплатить покупатели, поэтому рынок «апельсинов» обвалится.

Но что если у продавца есть дорогостоящий способ сигнализировать о типе автомобиля? Хотя «апельсины» и «лимоны» почти во всех отношениях идентичны, ключевое различие между ними — это то, что «лимон» ломается гораздо чаще. Зная об этом, владельцы «апельсинов» могут сделать следующее предложение. По запросу покупателя продавец за один день совершит на автомобиле поездку туда и обратно на расстояние 500 миль. (Предположим, это можно проверить по показаниям спидометра и по квитанции с временной меткой, полученной на заправочной станции, расположенной в 250 милях.) Для продавцов автомобилей Citrus обоих типов затраты на эту поездку (с учетом расходов на бензин и потраченное время) составляют 0,50 доллара на одну милю (то есть 250 долларов на поездку длиной в 500 миль). Однако «лимон» в ходе такой поездки выйдет из строя с вероятностью q. Если автомобиль сломается, затраты составят 2 доллара на милю общей длины пути, который он попытался преодолеть (то есть 1000 долларов). Кроме того, поломка автомобиля будет верным признаком того, что это «лимон», поэтому он будет продан всего за 6000 долларов.

Допустим, доля «апельсинов» f в общей совокупности подержанных автомобилей Citrus составляет 0,6, вероятность поломки «лимона» q равна 0,5, а владельцы «лимонов» нейтрально относятся к риску.

a) С помощью теоремы Байеса определите значение fуточ. — долю автомобилей Citrus, успешно преодолевших 500 миль и оказавшихся «апельсинами». Предположим, владельцы всех автомобилей Citrus предпримут такую поездку. Значение fуточ. больше или меньше f? Обоснуйте свой ответ.

b) Используйте fуточ. для определения цены pуточ., которую покупатели готовы заплатить за автомобиль Citrus, успешно проехавший 500 миль.

c) Владелец «апельсина» согласится совершить такую поездку и продать автомобиль по цене pуточ.? Почему да или почему нет?

d) Чему равен ожидаемый выигрыш продавца «лимона» от попытки совершить такую поездку?

e) Как бы вы описали исход данного рынка — как объединяющий, разделяющий или полуразделяющий? Обоснуйте свой вывод.

 

Упражнения без решений

U1. Джек — талантливый инвестор, но его доходы существенно варьируются год от года. В следующем году он рассчитывает заработать 250 000 долларов, если ему повезет, и 90 000 долларов в случае неудачи. Возможно, это несколько странно для человека с такой профессией, но Джек не расположен к риску, поэтому полезность его доходов равна квадратному корню из полученного дохода. Вероятность того, что Джеку улыбнется удача, составляет 0,5.

a) Какова ожидаемая полезность дохода Джека в следующем году?

b) Какая сумма верного дохода обеспечила бы такой же уровень полезности для Джека, что и ожидаемая полезность в пункте а?

Джек встречает Дженет, чья ситуация во всех отношениях совпадает с его. Дженет тоже инвестор и заработает в следующем году 250 000 долларов, если ей повезет, и 90 000 долларов в случае неудачи; она не расположена к риску, поэтому полезность ее дохода равна квадратному корню из суммы дохода, а вероятность того, что ей будет сопутствовать удача, составляет 0,5. Крайне важно, что Джек и Дженет инвестируют таким образом, что их везение носит совершенно независимый характер. Они договариваются о следующей сделке и вне зависимости от того, кому повезет, всегда будут объединять свои доходы, а затем делить их поровну.

c) Перечислите четыре возможные пары удачных исходов и определите вероятность достижения каждого из них.

d) Какова ожидаемая полезность дохода для Джека или Дженет в рамках их договоренности?

e) Какая сумма верного дохода обеспечила бы тот же уровень полезности для Джека и Дженет, что и ожидаемая полезность, полученная в пункте d?

Как бы невероятно это ни звучало, но Джек и Дженет знакомятся с Крисси, ситуация которой аналогична их ситуации в плане дохода, полезности и удачи. Вероятность того, что Крисси повезет, не зависит от удачи Джека и Дженет. После небольшого обсуждения они решают, что Крисси следует присоединиться к соглашению между Джеком и Дженет, согласно которому все трое будут объединять свои доходы и делить их на три равные части.

f) Перечислите восемь возможных троек удачных исходов и определите вероятность достижения каждого из них.

g) Какова ожидаемая полезность дохода для каждого из инвесторов в рамках их расширенной договоренности?

h) Какая сумма верного дохода обеспечила бы всем троим не расположенным к риску инвесторам тот же уровень полезности, что и ожидаемая полезность, полученная в пункте g?

U2. Снова рассмотрим пример с подержанными автомобилями Citrus 2011 года. Почти все автомобили со временем обесцениваются, то же касается и Citrus. По истечении каждого месяца все продавцы (независимо от типа автомобиля) готовы сбросить цену на 100 долларов, а покупатели, в свою очередь, готовы заплатить за «апельсин» максимальную цену на 400 долларов меньше, а за «лимон» — на 200 долларов меньше. Предположим, события в исходном примере происходят на протяжении месяца 0. Восемьдесят процентов автомобилей Citrus — «апельсины», и эта доля не меняется.

a) Заполните три варианта следующей таблицы для месяца 1, месяца 2 и месяца 3:

b) Постройте график готовности продавцов «апельсинов» принять максимальную цену покупателей на протяжении следующих 12 месяцев. На том же рисунке постройте график цен, которые готовы платить покупатели за подержанный автомобиль Citrus неизвестного типа (с учетом того, что доля «апельсинов» составляет 80 %). (Подсказка: на вертикальной оси отложите значения от 10 000 до 14 000.)

c) Существует ли рынок сбыта «апельсинов» на протяжении месяца 3? Почему да или почему нет?

d) В каком месяце произойдет обвал рынка «апельсинов»?

e) Если бы владельцы «лимонов» не сталкивались с их обесцениванием (то есть никогда бы не соглашались принять цену меньше 3000 долларов), это повлияло бы на момент обвала рынка «апельсинов»? Почему да или почему нет? В каком месяце рухнул бы рынок «апельсинов» в таком случае?

f) Если бы покупатели «лимонов» не сталкивались с их обесцениванием (то есть всегда были бы готовы заплатить за «лимон» до 6000 долларов), это повлияло бы на момент обвала рынка «апельсинов»? Почему да или почему нет? В каком месяце рухнул бы тогда рынок «апельсинов»?

U3. В экономике есть два типа работы — хорошая и плохая, а также два типа работников — квалифицированные и неквалифицированные. Общая совокупность состоит из 60 % квалифицированных и 40 % неквалифицированных работников. На плохой работе работник любого типа производит 10 единиц продукции. На хорошей квалифицированный работник производит 100 единиц продукции, а неквалифицированный — 0 единиц. Спрос на работников достаточно высокий, п оэтому в случае каждого типа работы компании должны оплачивать труд работников в объеме, соответствующем ожидаемому.

Компаниям приходится нанимать каждого работника, не имея данных о его типе и оплачивая его труд до того, как станет известна его фактическая производительность. Однако квалифицированные работники могут подать сигнал о своей квалификации, получив образование. Для квалифицированного работника затраты на повышение образования до уровня n составляют n2 / 2, тогда как для неквалифицированного n2. Эти издержки исчисляются в тех же единицах, что и объем выпущенной продукции, поэтому n должно быть целым числом.

a) При каком минимальном значении n будет достигнуто разделение типов?

b) Предположим, такой сигнал невозможен. Какие рабочие места будут заполнены работниками каких типов и при какой заработной плате? Кто выиграет и кто проиграет в данной ситуации?

U4. Будучи деканом одного из факультетов Университета Сент-Энфорд, вы нанимаете старших преподавателей с семилетним испытательным сроком, после которого рассматривается вопрос о заключении с ними бессрочного контракта и их либо повышают и зачисляют в штат на постоянной основе, либо увольняют.

Существует два типа старших преподавателей — хорошие и блестящие. Преподаватели, тип которых ниже хорошего, уже отсеяны в процессе найма, но у вас нет возможности непосредственно провести различие между хорошими и блестящими преподавателями. Каждый отдельный преподаватель, безусловно, знает, к какому типу он относится. Вы бы хотели заключить бессрочный контракт только с блестящими преподавателями. Если преподаватель зачислен в штат Университета Сент-Энфорд на постоянной основе, его выигрыш составляет 2 миллиона долларов; эта сумма включает в себя ожидаемую дисконтированную текущую стоимость заработной платы, гонорары за консультации и авторские гонорары за публикацию книг плюс денежный эквивалент чувства гордости и радости, испытываемых преподавателем и членами его семьи в случае получения пожизненной должности в Университете Сент-Энфорд. Тот преподаватель, кому будет отказано в заключении бессрочного контракта, получит должность в Колледже Бундокса; текущая стоимость такой карьеры составляет 0,5 миллиона долларов.

Ваши преподаватели могут проводить научные исследования и публиковать их результаты. Но каждая такая публикация требует усилий и времени, а также порождает напряженность в семье. Все это обходится преподавателю достаточно дорого. Денежный эквивалент таких издержек составляет 30 000 долларов на одну публикацию для блестящего преподавателя и 60 000 долларов для хорошего преподавателя. Вы можете установить минимальное количество публикаций N, которое преподаватель должен предоставить, чтобы получить бессрочный контракт.

a) Не выполняя никаких математических вычислений, максимально подробно опишите, что произошло бы в случае полуразделяющего равновесия в данной игре.

b) Существует два возможных типа объединяющих исходов в данной игре. Не выполняя никаких математических вычислений, как можно подробнее опишите, как бы выглядели эти исходы.

c) А теперь предлагаем выполнить некоторые математические вычисления. Найдите множество возможных значений N, при которых вы достигли бы своей цели — отличить блестящих профессоров от просто хороших.

U5. Вернитесь к задаче с компаниями Tudor и Fordor из , где низкий уровень затрат Tudor на единицу продукции составляет 10. Пусть z — вероятность того, что в Tudor действительно низкие издержки на единицу продукции.

a) Перепишите таблицу на  с учетом значения z.

b) Сколько равновесий в чистых стратегиях существует при z = 0? Какой тип равновесия (разделяющее, объединяющее или полуразделяющее) наблюдается при z = 0? Обоснуйте свой ответ.

c) Сколько равновесий в чистых стратегиях существует при z = 1? Какой тип равновесия (разделяющее, объединяющее или полуразделяющее) наблюдается при z = 1? Обоснуйте свой ответ.

d) При каком минимальном значении z существует объединяющее равновесие?

e) Объясните на интуитивном уровне, почему объединяющее равновесие не может существовать при слишком низком значении z.

U6. Предположим, компания Tudor не расположена к риску и в ее случае полезность равна квадратному корню из общей прибыли (см. ), а компания Fordor нейтральна к риску. Кроме того, допустим, что низкий уровень издержек Tudor на единицу продукции составляет 10, как в .

a) Представьте игру в экстенсивной форме (как показано на ), указав соответствующие выигрыши для компании Tudor, не расположенной к риску.

b) Пусть вероятность z того, что Tudor — компания с низким уровнем издержек, составляет 0,4. Будет ли равновесие в такой игре разделяющим, объединяющим или полуразделяющим? (Подсказка: используйте таблицу, эквивалентную представленной на .)

c) Выполните задание пункта а при z = 0,1.

d) (дополнительное задание). Изменит ли нерасположенность Tudor к риску ответ, полученный в ? Объясните, почему да или почему нет.

U7. Вернитесь к ситуации в , в которой компания Tudor нейтральна к риску, а ее низкий уровень издержек на единицу продукции составляет 6.

a) Составьте нормальную форму этой игры с учетом значения z, то есть вероятности того, что Tudor установит низкую цену.

b) Найдите равновесие игры при z = 0,1. Это разделяющее, объединяющее или полуразделяющее равновесие?

c) Выполните задание пункта b при z = 0,2,

d) Выполните задание пункта b при z = 0,3.

e) Сравните ответы, полученные в пунктах b, c и d, с ответом в . Когда низкий уровень издержек Tudor 6 вместо 10, можно ли достичь объединяющего равновесия при более низких значениях z? Или для объединяющих равновесий требуются более высокие значения z? Объясните на интуитивном уровне, почему это действительно так.

U8. Иногда корпоративные судебные споры могут выступать в качестве сигнальных игр. Вот один пример. В 2003 году компания AT&T подала иск против компании eBay, утверждая, что ее электронные платежные системы Billpoint и PayPal нарушают оформленный в 1994 году патент AT&T на «посредничество в проведении транзакций с помощью системы связи».

Проанализируем эту ситуацию с момента подачи иска. В ответ на этот иск, как и в случае большинства исков о нарушении патентных прав, eBay может предложить AT&T урегулировать ситуацию без обращения в суд. Если AT&T примет предложение eBay, судебного разбирательства не будет; если отклонит, результат определит суд.

Сумма убытков, заявленная AT&T, не подлежит огласке. Поэтому предположим, что AT&T подает иск на сумму 300 миллионов долларов. Кроме того, допустим, что, если дело дойдет до судебного разбирательства, обе стороны понесут судебные издержки (на оплату услуг адвокатов и консультантов) в размере 10 миллионов каждая.

Поскольку eBay действительно занимается бизнесом, связанным с обработкой электронных платежей, она наверняка больше AT&T знает о том, какова ее вероятность выиграть это дело в суде. Для простоты давайте исходить из того, что eBay точно известно, признают ли ее невиновной (н) или виновной (в) в нарушении патентных прав. С точки зрения AT&T, вероятность того, что eBay виновна (в) составляет 25 %, а невиновна (н) — 75 %.

Допустим, в распоряжении eBay есть два возможных действия: щедрое предложение об урегулировании претензий (Щ) в размере 200 миллионов долларов или скупое предложение об урегулировании претензий (С) в размере 20 миллионов долларов. Если eBay сделает щедрое предложение, AT&T примет его и тем самым избежит дорогостоящего судебного разбирательства. Если eBay сделает скупое предложение, то AT&T предстоит решить, принять его (П) и избежать судебного разбирательства или отклонить (О) и отправить дело в суд. Если в ходе судебного разбирательства компанию eBay признают виновной, помимо оплаты судебных издержек ей придется выплатить AT&T 300 миллионов долларов. Если eBay признают невиновной, она не должна AT&T ничего, зато AT&T придется оплатить все судебные издержки.

a) Представьте эту игру в экстенсивной форме (правильно обозначьте информационные множества).

b) У кого из участников игры есть стимул блефовать (другими словами, подавать ложный сигнал)? В чем будет состоять этот блеф? Объясните логику своих рассуждений.

c) Представьте игру в стратегической форме (составьте таблицу игры) Найдите в этой игре все равновесия Нэша. Вычислите ожидаемые выигрыши каждого игрока в случае равновесия.

U9. Вернемся к игре в упрощенный покер между Феликсом и Оскаром из . Каким должно быть соотношение королей и дам, чтобы игра была справедливой? Иными словами, какая доля королей сделает ожидаемый выигрыш равным нулю для обоих игроков?

U10. Феликсу и Оскару наскучила упрощенная версия покера, поэтому они решили сделать ее более интересной, добавив в игру третью карту — валет. Теперь помимо четырех королей и четырех дам в колоде есть еще и четыре валета. Все правила игры остаются прежними, за одним исключением — последствиями ситуации, когда Феликс делает ставку, а Оскар отвечает. При таком раскладе Феликс выигрывает банк, если у него есть король, оба игрока «сравнивают счет» и каждый получает свои деньги обратно, если у Феликса дама, и Оскар выигрывает банк, если эта карта — валет.

a) Представьте игру в экстенсивной форме (правильно обозначьте информационные множества).

b) Сколько чистых стратегий у Феликса в этой игре? Объясните логику своих рассуждений.

c) Сколько чистых стратегий в этой игре у Оскара? Объясните логику своих рассуждений.

d) Представьте игру в стратегической форме. Это должна быть таблица ожидаемых выигрышей каждого игрока в случае той или иной пары стратегий.

e) Найдите единственное равновесие Нэша в чистых стратегиях в этой игре.

f) Можно ли назвать его объединяющим, разделяющим или полуразделяющим?

g) В случае равновесия чему равен ожидаемый выигрыш Феликса в этой игре? Действительно ли это честная игра?

U11. Рассмотрим модель сигнализирования на рынке труда (модель Спенса) со следующими уточнениями. Существуют два типа работников — 1 и 2. Производительность их труда определяется как функции уровня образования E:

W 1 ( E )  = E; W 2 ( E ) = 1,5 E .

Затраты на образование двух типов работников как функции уровня образования составляют

C 1 ( E )  = E 2 /2; C 2 ( E )  = E 2 /3.

Полезность каждого работника равна его доходу минус затраты на образование. Компании, которые пытаются их нанять, поддерживают совершенную конкуренцию на рынке труда.

a) Если информация о типах работников открыта для ознакомления (то есть поддается наблюдению и проверке), найдите выражения для уровней образования, доходов и полезности двух типов работников.

Теперь предположим, что тип работника — это его личная информация.

b) Убедитесь в том, что если в данной ситуации с асимметричностью информации будет предпринята попытка заключить контракты, то тип 2 не захочет получить контракт, предназначенный для типа 1, а тип 1 захочет получить контракт, предназначенный для типа 2; следовательно, «естественное» разделение типов не может преобладать.

c) Если оставить контракт для типа 1 как в пункте а, при каком диапазоне контрактов (пар «образование / заработная плата») для типа 2 может быть достигнуто разделение?

d) Какой, по вашему мнению, из всех возможных разделяющих контрактов получит приоритет?

e) Кто выиграет или проиграет из-за асимметричности информации? В какой степени?

U12. «Господин Робинсон фактически приходит к выводу, что бизнес-школы — это своего рода инструменты отсева: степень MBA есть не что иное, как профсоюзный билет для яппи. Но, пожалуй, самый важный факт о Стэнфордской школе бизнеса состоит в том, что весь серьезный отсев происходит еще до начала первого занятия. В стенах учебного заведения не проводится грязная работа по прополке сорняков. “Они не хотят тебя проваливать. Они хотят, чтобы после выпуска ты со временем разбогател и пожертвовал своей альма-матер кучу денег”. Однако здесь возникает вопрос: если компании перекладывают на приемную комиссию Стэнфордской школы бизнеса ответственность за подбор молодых менеджеров, почему бы им просто не заменить сотрудников своего отдела управления персоналом членами приемной комиссии Стэнфорда и исключить это фиктивное образование? Неужели сам факт выбрасывания больших денег и двух лет жизни демонстрирует ту приверженность бизнесу, которую работодатели находят столь привлекательной?» (Из рецензии Майкла Льюиса на книгу Питера Робинсона Snapshots from Hell: The Making of an MBA («С “Поляроидом” в аду: как получают MBA»), опубликованной в разделе «Книжное обозрение» газеты New York Times 8 мая 1994 года.) Какой ответ на вопрос Льюиса вы можете дать с учетом анализа стратегий в ситуациях с асимметрией информации?

U13 (дополнительное упражнение; необходимо ознакомиться с приложением). Налоговый инспектор анализирует последнюю налоговую декларацию Ванды (см. ), в которой она сообщает, что у нее выдался плохой год. Предположим, Ванда применяет равновесную стратегию и налоговый инспектор это знает.

a) С помощью правила Байеса найдите вероятность того, что у Ванды был хороший год, при условии, что в налоговой декларации указано обратное.

b) Объясните, почему вероятность, полученная в пункте а, больше или меньше исходной вероятности хорошего года, составляющей 0,6.

U14 (дополнительное упражнение; необходимо ознакомиться с приложением). Вернитесь к . Предположим (вполне обоснованно), что вероятность поломки «лимона» повышается с увеличением пройденного пути. В частности, пусть q = m / (m + 500), где m — длина пути в милях.

a) Найдите минимальное целое количество миль m, позволяющее предотвратить крах рынка «апельсинов». Другими словами, при каком минимальном значении m продавец «апельсина» готов его продать по рыночной цене на автомобили марки Citrus, успешно совершившие поездку? (Подсказка: не забудьте вычислить fуточ. и pуточ..

b) Какое минимальное целое количество миль m позволит добиться полного разделения действующих рынков сбыта «апельсинов» и «лимонов»? То есть при каком минимальном значении m владелец «лимона» так и не решится совершить такую поездку?

 

Приложение. Отношение к риску и теорема Байеса

1. Отношение к риску и ожидаемая полезность

В мы указали на трудности с использованием вероятностей для вычисления среднего или ожидаемого выигрыша игроков в той или иной игре. Рассмотрим игру, участники которой получают или теряют деньги; предположим, выигрыш в ней равен определенной сумме. Если вероятность не получить ничего составляет 75 %, а вероятность получить 100 долларов — 25 %, то ожидаемый выигрыш рассчитывается как взвешенное по вероятности среднее; иными словами, он равен среднему значению различных выигрышей, рассчитанному с использованием вероятности в качестве веса. В данном случае мы имеем 0 долларов с вероятностью 75 %, что дает в среднем 0,75 × 0 = 0, и 100 долларов с вероятностью 25 %, что дает в среднем 0,25 × 100 = 25. Этот же выигрыш игрок получил бы в результате неслучайного исхода, гарантирующего ему 25 долларов каждый раз, когда он играет. Считается, что люди нейтральны по отношению к риску, если для них не имеет значения, что выбирать из различных вариантов с одинаковой денежной стоимостью, но разным уровнем риска. В нашем примере в одном варианте риск отсутствует (игрок получит 25 долларов в любом случае), тогда как другой вариант сопряжен с риском, обеспечивая 0 долларов с вероятностью 0,75 и 100 долларов с вероятностью 0,25, с тем же средним показателем 25 долларов. С другой стороны, есть люди, не расположенные к риску, то есть те, кто из двух вариантов с одинаковой средней денежной стоимостью выберет менее рискованный. В нашем примере они предпочли бы получить 25 долларов наверняка, чем сталкиваться с рискованной перспективой «100 долларов или ничего», и при наличии возможности выбора остановились бы на более безопасном варианте. Такая нерасположенность к риску встречается повсеместно, поэтому нам нужна теория принятия решений в условиях неопределенности, учитывающая этот факт.

В мы также говорили, что незначительное изменение процедуры вычисления выигрышей позволяет обойти эту трудность. Мы сказали, что выигрыши можно измерять не в денежных суммах, а с помощью нелинейной шкалы денежных сумм. В данном приложении мы покажем, как составить такую шкалу и почему это решает нашу проблему.

Предположим, когда человек получает D долларов, мы исходим из того, что его выигрыш составляет не просто D, а, например, √D. Тогда выигрыш от 0 долларов равен 0, а выигрыш от 100 долларов равен 10. Такое преобразование не меняет способа оценки двух выигрышей в размере 0 долларов и 100 долларов, а просто определенным образом меняет шкалу выигрышей.

Теперь проанализируем рискованную перспективу получения 100 долларов с вероятностью 0,25 и отсутствия какого бы то ни было выигрыша в противном случае. После изменения шкалы ожидаемый выигрыш (представляющий взвешенное по вероятности среднее двух выигрышей) составляет (0,75 × 0) + (0,25 × 10) = 2,5. Он эквивалентен квадратному корню из полученной денежной суммы. Поскольку 2,5 = √625, выигрыш человека, который наверняка получит 6,25 доллара, также составит 2,5. Другими словами, в случае применения шкалы выигрышей в виде квадратного корня человек был бы одинаково рад получить 6,25 доллара наверняка и 100 долларов с вероятностью 25 процентов. Подобное безразличие к гарантированным 6,25 доллара и 100 долларам в одном из четырех случаев свидетельствует о сильной нерасположенности к риску: этот человек готов пожертвовать разностью между 25 долларами и 6,25 доллара ради того, чтобы его избежать. На рис. 8П.1 показана эта нелинейная шкала (квадратный корень), ожидаемый выигрыш и безразличие человека к выбору между беспроигрышным и рискованным вариантом развития событий.

Рис. 8П.1. Вогнутая шкала: нерасположенность к риску

Но что если нелинейная шкала, используемая нами для изменения шкалы долларовых выигрышей, содержит кубический, а не квадратный корень? Тогда выигрыш от получения 100 долларов равен 4,64, а ожидаемый выигрыш от рискованного варианта составляет (0,75 × 0) + (0,25 × 4,64) = 1,16, то есть кубический корень из 1,56. Следовательно, человек с такой шкалой выигрышей наверняка получит только 1,56 доллара вместо рискованного варианта, обеспечивающего ему в среднем 25 долларов. Это означает, что у такого человека действительно очень высокий уровень нерасположенности к риску. (Для того чтобы понять, почему ситуация обстоит именно так, сравните график кубического корня из x с графиком квадратного корня из x.)

А что если изменение шкалы выигрышей, исчисляемых в x долларов, выполнить с помощью функции x2? Ожидаемый выигрыш от рискованного варианта составит (0,75 × 0) + (0,25 × 10 000) = 2500, что равно 50 в квадрате. Стало быть, при такой шкале выигрышей человеку будет безразлично, получит ли он 50 долларов в любом случае или рискнет с ожидаемой денежной стоимостью всего 25 долларов. Этот человек должен быть склонен к риску, поскольку не желает отдавать деньги в обмен на его снижение; напротив, ему необходимо дать дополнительных 25 долларов в качестве компенсации за потерю риска. На рис. 8П.2 изображена нелинейная шкала, которой соответствует функция x2.

Рис. 8П.2. Выгнутая шкала: склонность к риску

Таким образом, использование разных вариантов нелинейной шкалы выигрышей вместо чистых денежных выигрышей позволяет определить разные степени неприятия риска или склонности к нему. Вогнутая шкала () соответствует нерасположенности к риску, а выгнутая (рис. 8П.2) — склонности к риску. Вы можете поэкспериментировать с другими простыми вариантами нелинейной шкалы (такими как логарифмы, экспоненциальные функции и другие корни и степени), чтобы выяснить, что они говорят об отношении к риску.

Этот метод оценки рискованных перспектив имеет давнюю традицию в теории принятия решений и обозначается термином «метод ожидаемой полезности». Нелинейная шкала, которая позволяет вычислить выигрыши как функцию денежной стоимости, называется функцией полезности; квадратный и кубический корни и квадрат — простые примеры такой функции. Математическое ожидание, или взвешенное по вероятности среднее значений полезности различных денежных сумм при случайном варианте развития событий, называется ожидаемой полезностью этого варианта. Различные случайные варианты сравниваются друг с другом по их ожидаемой полезности; варианты с более высокой ожидаемой полезностью считаются более приемлемыми, чем варианты с более низкой ожидаемой полезностью.

Почти вся теория игр основана на методе ожидаемой полезности, и он действительно чрезвычайно полезен, хотя и не лишен недостатков. Мы возьмем его на вооружение в данной книге, а более подробный анализ оставим для научных трудов повышенного уровня сложности.

2. Вывод вероятностей из наблюдаемых последствий

Когда участники игры владеют разным объемом информации, они попытаются использовать какой-то инструмент для выяснения личной информации соперника. Как мы говорили в данной главы, иногда непосредственная коммуникация позволяет достичь равновесия дешевого разговора. Но более типична ситуация, когда игрокам приходится определять информацию соперников посредством наблюдения за их действиями. В таком случае они должны оценить вероятность исходной информации с помощью этих действий или их наблюдаемых последствий. Такая оценка требует относительно сложных манипуляций с правилами исчисления вероятностей, и мы изучим этот процесс более подробно.

Правила вычисления вероятности событий, изложенные в , в частности правило определения комбинации вероятностей, весьма полезны для вычисления выигрышей в случаях, когда игроки располагают разным объемом информации. В играх с асимметричной информацией участники пытаются выяснить информацию, имеющуюся у соперников, посредством наблюдения за их действиями и последующих выводов (оценивания) вероятности исходной информации на основе наблюдаемых действий или их результатов.

Лучше всего это проиллюстрировать на примере. Предположим, у 1 % населения есть генетический дефект, который может вызвать определенное заболевание. Тест, позволяющий обнаружить этот дефект, имеет 99 % точности: при наличии дефекта тест не сможет его выявить в 1 % случаев, а при отсутствии может ошибочно найти в 1 % случаев. Другими словами, мы не можем непосредственно наблюдать этот дефект у человека (исходное условие), но можем наблюдать результаты теста на его наличие (последствия) — вот только тест не идеальный индикатор дефекта. В какой степени, учитывая наши наблюдения, мы можем быть уверены, что исходное условие действительно выполняется?

Для того чтобы ответить на этот вопрос в контексте нашего конкретного примера, мы можем произвести простые численные расчеты. Рассмотрим совокупность из 10 000 человек, в которой у 100 человек (1 %) есть дефект, а у 9900 — нет. Предположим, все они пройдут тест. Из 100 человек с дефектом тест даст правильный положительный результат у 99 человек. Из 9900 человек без дефекта тест покажет ошибочный положительный результат тоже у 99 человек. Итого будет получено 198 положительных результатов, из которых половина правильные и половина неправильные. Если человек получит положительный результат теста, это может произойти как потому, что тест действительно выявил патологию, так и по причине ошибки. Следовательно, риск того, что у человека с положительным результатом теста на самом деле есть дефект, составляет всего 50 %. (Именно поэтому тесты на обнаружение редких патологий необходимо разрабатывать так, чтобы они обеспечивали очень низкий коэффициент получения ложных положительных результатов.)

Для ответа на общие вопросы такого типа мы используем алгебраическую формулу под названием «теорема Байеса», которая позволяет поставить задачу и произвести необходимые вычисления. Для этого обобщим наш пример, допустив два варианта исходных условий, A и B (скажем, есть генетический дефект или нет), и два наблюдаемых последствия, X и Y (например, положительный или отрицательный результат теста). Предположим, что при отсутствии информации (по всей популяции) вероятность выполнения условия А равна p, а значит, вероятность выполнения условия B составляет (1 — p). В случае выполнения условия A вероятность наблюдения X равна a, стало быть, вероятность наблюдения Y составляет (1 — a). (В терминах, сформулированных нами в , a — это вероятность X при условии A, тогда как (1 — a) — это вероятность Y при условии A.) Аналогичным образом при выполнении условия B вероятность наблюдения X равна b, а вероятность наблюдения Y — (1 — b).

Это описание указывает на возможные четыре альтернативные комбинации событий: 1) выполняется A, наблюдается X; 2) выполняется A, наблюдается Y; 3) выполняется B, наблюдается X; 4) выполняется B, наблюдается Y. Модифицированное правило умножения позволяет определить вероятности этих четырех комбинаций: pa, p(1 — a), (1 — p)b и (1 — p)(1 — b) соответственно.

Теперь предположим, что наблюдается X: человек проходит тест на наличие генетического дефекта и получает положительный результат. Тогда мы фокусируемся на подмножестве вышеперечисленных возможностей, а именно на первой и третьей комбинации, включающих в себя наблюдение X. В этом подмножестве исходов с наблюдаемым X вероятность того, что A также выполняется, составляет pa, как показано выше. Таким образом, нам известно, с какой вероятностью мы можем наблюдать только X и с какой вероятностью — как X, так и A.

Но нас больше интересует определение вероятности того, что A выполняется при условии, что мы наблюдали X, то есть что у человека есть генетический дефект в случае положительного результата теста. Вычисление этой вероятности довольно сложное. Согласно модифицированному правилу умножения, вероятность того, что имеет место как A, так и X, равна произведению вероятности того, что имеет место X, на вероятность A при условии X. Нас интересует именно эта последняя вероятность. Воспользовавшись выведенными выше формулами для вычисления «A и X» и «только X», получим

Prob( A и  X ) = Prob(только X ) × Prob( A при условии X ),

pa  = [ pa  + (1 — p ) b ] × Prob( A при условии X ),

Формула дает оценку вероятности того, что A выполнялось при условии, что мы наблюдали X (и поэтому поставили все в зависимость от этого факта). Этот результат известен как теорема Байеса (а также как правило, или формула, Байеса).

В нашем примере с тестированием на наличие генетического дефекта были такие значения: Prob(A) = p = 0,01, Prob(X при условии A) = a = 0,99 и Prob(X при условии B) = b = 0,01. Мы можем подставить их в формулу Байеса и получим вероятность наличия дефекта при условии положительного результата теста = Prob(A при условии X)

Алгебраические операции с вероятностями, проведенные с помощью правила Байеса, подтверждают результат арифметических вычислений (основанных на перечислении всех возможных случаев), которые мы использовали выше. Преимущество формулы состоит в том, что ее можно применять механически, что позволяет избежать трудоемкого и подверженного ошибкам процесса перечисления всех возможных вариантов и определения всех необходимых вероятностей.

На рис. 8П.3 правило Байеса представлено в виде таблицы, так его легче запомнить и использовать, чем формулу. В строках таблицы отображаются истинные альтернативные условия, которые могут существовать, например «генетический дефект» и «отсутствие генетического дефекта». У нас всего два варианта, A и B, но этот метод можно обобщить на любое количество возможных исходов. В столбцах таблицы отображаются наблюдаемые события — например, «положительный результат теста» и «отрицательный результат теста».

Рис. 8П.3. Правило Байеса

В каждой ячейке таблицы представлена совместная вероятность соответствующей комбинации исходного условия и наблюдения; это и есть вероятности перечисленных выше четырех комбинаций возможных вариантов. В последнем столбце справа отображена сумма по первым двум столбцам каждой из верхних двух строк. Она представляет собой общую вероятность каждого истинного условия (так, например, вероятность A равна p, как мы уже видели). В последней строке отображена сумма первых двух строк в каждом столбце. Например, запись в последней строке столбца X — это общая вероятность наблюдения X, либо когда A — истинное условие (правильный положительный результат в примере с генетическим тестом), либо когда B — истинное условие (ошибочный положительный результат).

Для того чтобы вычислить вероятность того или иного условия с учетом определенного наблюдения, согласно правилу Байеса, необходимо взять запись из ячейки, соответствующей комбинации этого условия и наблюдения, и разделить данное значение на сумму по столбцу в последней строке этого наблюдения. В качестве примера можно привести

Prob( B при условии X ) = (1 — p ) b  / [ pa  + (1 — p ) b ].

Резюме

Оценка последствий на основании ожидаемых денежных выигрышей подразумевает нейтральное отношение к риску. Нерасположенность к риску можно учесть с помощью метода ожидаемой полезности, который требует использования функции полезности, представляющей вогнутую шкалу денежных выигрышей, а также принятия взвешенного по вероятности среднего значения в качестве меры ожидаемого выигрыша.

Если участники игры располагают асимметричной информацией, они могут попытаться вывести вероятности скрытых исходных условий посредством наблюдения за действиями или их последствиями. Теорема Байеса предоставляет формулу для определения таких вероятностей.

Ключевые термины

Нейтральное отношение к риску

Нерасположенность к риску

Ожидаемая полезность

Теорема Байеса

Функция полезности

 

Глава 9. Стратегические ходы

 

* * *

Игра определяется вариантами выбора, или ходами, доступными игрокам, и порядком (при его наличии) их выполнения, а также выигрышами, полученными в результате всех возможных комбинаций вариантов выбора, имеющихся у всех игроков. В мы наблюдали, как изменение порядка ходов с последовательного на одновременный (или наоборот) может повлиять на исход игры. Использование или исключение доступных игроку ходов или изменение выигрышей в некоторых концевых узлах или ячейках таблицы игры также может сказаться на исходе игры. Если правила игры не зафиксированы извне, у каждого игрока есть стимул манипулировать ими, с тем чтобы обеспечить более выгодный для себя результат. Инструменты, позволяющие манипулировать игрой таким способом, называются стратегическими ходами; это и есть тема данной главы.

Стратегический ход меняет правила исходной игры в целях создания новой двухэтапной игры. В этом смысле стратегические ходы подобны прямому обмену информацией, рассмотренному в . Но в случае их применения второй этап и есть исходная игра, зачастую с некоторыми изменениями порядка ходов и выигрышей (в играх с непосредственной коммуникацией таких изменений нет). Различные действия, выполняемые на первом этапе, соответствуют разным стратегическим ходам; мы их разделим на три категории: обязательства, угрозы и обещания. Цель всех трех — изменить исход второго этапа игры в свою пользу. Какая из этих категорий согласуется с вашей целью, зависит от контекста. Но самое главное — все три категории обеспечивают требуемый результат, только если другой игрок убежден, что на втором этапе вы действительно сделаете то, о чем заявили на первом. Иными словами, достоверность стратегического хода находится под вопросом. Только достоверный стратегический ход может обеспечить требуемый результат, и, как мы убедились в , простых заявлений для этого недостаточно. На первом этапе вы должны предпринять ряд дополнительных действий, обеспечивающих достоверность заявленных вами действий на втором этапе игры. Мы проанализируем оба типа действий второго этапа, приносящих вам пользу, а также дополнительные ходы, которые делают их заслуживающими доверия.

По всей вероятности, вы знакомы с применением достоверных стратегических ходов в большей степени, чем вам кажется. Например, родители постоянно пытаются контролировать поведение детей, используя угрозы («никакого десерта, пока не съешь овощи») и обещания («в конце учебного года получишь новый гоночный велосипед, если заработаешь хотя бы средний балл»). Детям прекрасно известно, что многие из этих угроз и обещаний недостоверны: ребенок может избежать наказания за плохое поведение, мило пообещав больше этого не делать, даже если такое обещание не заслуживает доверия. Кроме того, когда дети взрослеют и начинают беспокоиться по поводу своей внешности, они дают себе слово заниматься физическими упражнениями и придерживаться правильного режима питания, но многие из этих обязательств тоже лишены достоверности. Все эти инструменты (обязательства, угрозы и обещания) — примеры стратегических ходов. Их цель — изменить действия другого игрока (возможно, даже вашего собственного будущего «я») на более позднем этапе игры. Однако они не достигнут поставленной цели, если не будут достоверными. В этой главе мы используем теорию игр, чтобы узнать, как применять такие стратегии и как сделать их достоверными.

Но имейте в виду, обеспечение достоверности — весьма тонкая и трудная задача. Мы предлагаем вам ряд общих принципов и общее понимание того, как работают стратегические ходы, то есть науку о стратегии. Но сможете ли вы действительно заставить их работать, зависит от адекватной оценки соответствующего контекста, причем ваш соперник может получить преимущество перед вами, если лучше поймет концепции, или этот контекст, или и то и другое. Следовательно, практическое применение стратегических ходов во многом сродни искусству. Кроме того, оно сопряжено с риском, особенно при использовании стратегии балансирования на грани, которая порой способна привести к катастрофе. Вы можете добиться успеха и хорошо провести время, пытаясь применить все эти идеи на практике, но примите к сведению наше предостережение: вы будете использовать такие стратегии на свой страх и риск.

 

1. Классификация стратегических ходов

Поскольку использование стратегических ходов в значительной мере зависит от порядка ходов, для их изучения необходимо уяснить, что означает «сделать первый ход». До сих пор мы считали эту концепцию самоочевидной, но теперь она требует уточнения. Данная концепция имеет две составляющие: во-первых, ваше действие должно поддаваться наблюдению другим игроком, во-вторых, оно должно быть необратимым.

Рассмотрим стратегическое взаимодействие между двумя игроками, А и Б, в котором игрок А ходит первым. Если действие игрока А не поддается наблюдению игроком Б, то игрок Б не может на него отреагировать, а значит, хронология действий сама по себе не имеет значения. Например, предположим, что А и Б — это компании, принимающие участие в аукционе. В понедельник в компании А проводится тайное совещание, чтобы определить размер своей заявки на торгах; компания Б проводит такое совещание во вторник. Запечатанные конверты с заявками отсылают по почте организатору торгов, и тот открывает их в пятницу. Когда компания Б принимает решение, она не знает о решении компании А, а следовательно, со стратегической точки зрения ходы обеих компаний такие же, как если бы они были одновременными.

Если бы ход игрока А был обратимым, то он мог бы сделать вид, что делает что-то одно, спровоцировать игрока Б на ответное действие, а затем изменить свое действие с выгодой для себя. Игрок Б должен предвидеть подобную уловку и не поддаваться на провокацию; в таком случае он не ответит на выбор игрока А. И снова в сугубо стратегическом смысле игрок А не делает первый ход.

Такие факторы, как наблюдаемость и необратимость, влияют на характер и типы стратегических ходов, а также на их достоверность. Мы начнем с систематизации стратегических ходов, доступных игрокам.

А. Безусловные стратегические ходы

Предположим, именно игрок А делает стратегический (наблюдаемый и необратимый) ход на первом этапе игры. Он может заявить: «В предстоящей игре я выполню ход X». Это заявление говорит о том, что будущий ход игрока является безусловным, то есть игрок А сделает его независимо от действий игрока Б. Подобное заявление (если оно достоверно) равносильно изменению порядка игры на втором этапе таким образом, что игрок А ходит первым, а игрок Б — вторым, причем ход игрока А — это X. Данный стратегический ход называется обязательством.

Если правила игры на втором этапе уже предписывают игроку А сделать первый ход, тогда это заявление не играет никакой роли. Но если на втором этапе игры ходы делаются одновременно или игрок А должен ходить вторым, то такое заявление (в случае его достоверности) может изменить ее исход, поскольку меняет убеждение игрока Б в отношении последствий его действий. Следовательно, обязательство — это простое использование преимущества первого хода в случае, если таковое существует.

В игре три женщины играют в игру с последовательными ходами, в которой каждая решает, вносить ли ей вклад в создание общественного сада на их улице; при этом для посадки красивого сада требуется вклад двух или более игроков. Анализ методом обратных рассуждений показывает, что первая участница игры (Эмили) предпочитает не вносить вклад, тогда как две ее соседки (Нина и Талия) его внесут. Однако взяв на себя достоверное обязательство не вносить вклад, Талия (или Нина) могла бы изменить исход игры. Хотя Талия и не может объявить о своем решении до тех пор, пока Эмили и Нина не огласят свои, она могла бы поставить всех в известность, что вложила все свои сбережения (и энергию) в крупный проект по ремонту дома, поэтому у нее совсем не осталось средств на сад. В таком случае Талия, по сути, возьмет на себя обязательство не вносить вклад независимо от выбора Эмили и Нины еще до того, как они его сделают. Другими словами, Талия меняет исходную игру на такую, в которой она, по сути, делает первый ход. Вы можете без труда проверить, что новый анализ методом обратных рассуждений дает такой результат: Эмили и Нина внесут вклад в создание сада; при этом равновесный выигрыш каждой из них составит 3, тогда как Талии — 4. Такой равновесный исход в игре может быть получен, если Талия ходит первой. Несколько более подробные примеры обязательств рассматриваются в следующих разделах.

Б. Условные стратегические ходы

На первом этапе игрок А может также заявить: «В предстоящей игре я отвечу на ваш выбор следующим образом: если вы выберете Y1, я выберу Z1, если вы сыграете Y2, то я Z2… То есть игрок А может применить ход, зависящий от действия игрока Б; мы называем такой тип ходов правилом ответа или функцией реакции. Заявление игрока А означает, что, хотя на втором этапе игры он будет ходить вторым, то, как именно он ответит на действия игрока Б в этот момент, уже предопределено его заявлением на первом этапе. Для того чтобы подобные заявления были значимыми, у игрока А должна быть физическая возможность повременить с выполнением хода на втором этапе до тех пор, пока он не увидит необратимый ход игрока Б. Иными словами, на втором этапе игрок Б должен иметь возможность сделать истинный первый ход в том смысле, о котором говорилось выше.

Условные стратегические ходы принимают разные формы в зависимости от того, на достижение какой цели они направлены и как должны обеспечить ее реализацию. Когда игрок А хочет помешать игроку Б что-то сделать, мы говорим, что игрок А пытается удержать игрока Б от совершения соответствующего действия, или обеспечить сдерживание. Когда игрок А хочет склонить игрока Б что-то сделать, мы говорим, что игрок А пытается принудить игрока Б к совершению соответствующего действия, или добиться принуждения. Мы вернемся к различию между этими ходами позже. А пока нас больше интересует метод, используемый для достижения любой из этих целей. Когда игрок А заявляет: «Если ваше действие (или бездействие, в зависимости от обстоятельств) не будет соответствовать моему желанию, я отвечу на это способом, который причинит вам вред», — это угроза. Когда игрок А говорит: «Если ваше действие (или бездействие, в зависимости от обстоятельств) будет соответствовать моему желанию, я отвечу на это способом, который обеспечит вам вознаграждение», — это обещание. «Вред» и «вознаграждение» оцениваются с точки зрения выигрышей в самой игре. Когда игрок А наносит вред игроку Б, он совершает действие, снижающее выигрыш игрока Б; когда игрок А вознаграждает игрока Б, он совершает действие, увеличивающее выигрыш игрока Б. Угрозы и обещания — два условных стратегических хода, на которых мы сфокусируем наш анализ.

Для того чтобы понять природу этих стратегий, рассмотрим ранее упомянутую игру «обед». В ней при естественном хронологическом порядке ходов ребенок сперва решает, съесть ли ему овощи, после чего родитель решает, давать ли ребенку десерт. Анализ методом обратных рассуждений показывает нам исход игры: ребенок отказывается есть овощи, зная, что родитель все равно даст ему десерт. Однако родитель, предвидя подобный исход, может попытаться изменить его, сделав начальный ход, а именно сформулировав правило условного ответного хода так: «Никакого десерта, пока не съешь овощи». Это заявление таит в себе угрозу. Это первый ход перед началом игры, который закрепляет ваш второй ход в предстоящей игре. Если ребенок вам поверит, это изменит его обратные рассуждения. В итоге он отсечет ту ветвь дерева игры, в которой родитель даст ему десерт, даже если он не съест овощи. Это может изменить поведение ребенка; родитель надеется, что это заставит ребенка вести себя в соответствии с его указаниями. Точно так же в игре «учеба» обещание купить велосипед может стимулировать ребенка учиться более усердно.

 

2. Достоверность стратегических ходов

Мы уже видели, что стратегический ход одного игрока может изменить выигрыши другого игрока, а как насчет выигрышей того, кто делает этот ход? Игрок А получает более высокий выигрыш, когда игрок Б действует в соответствии с его пожеланиями. Однако ответное действие игрока А может повлиять и на его собственный выигрыш. Что касается угрозы, ответное действие игрока А на отказ игрока Б сделать то, что хотел бы игрок А, может иметь определенные последствия и для выигрышей самого игрока А: родителя может расстроить вид несчастного ребенка, которому отказали в десерте. Аналогично обещание игрока А вознаградить игрока Б за выполнение действия, соответствующего его пожеланию, может повлиять на выигрыш игрока А: родителю, который вознаграждает ребенка за усердную учебу, придется потратить деньги на подарок, но зато радость ребенка от его получения доставит радость и родителю, что еще больше усиливает радость от успехов ребенка в школе.

Влияние стратегических ходов игрока А на его выигрыши влечет за собой одно важное следствие с точки зрения их эффективности. Рассмотрим в данном контексте угрозу. Если выигрыш игрока А действительно увеличивается в результате выполнения действия, которым он угрожает, то игрок Б приходит к выводу, что игрок А выполнит свою угрозу, даже если игрок Б удовлетворит его требования. Это лишает игрока Б стимула подчиняться желаниям игрока А, поэтому угроза А становится неэффективной. Например, если родитель — садист, которому нравится видеть страдания ребенка, оставшегося без десерта, ребенок рассуждает так: «Я все равно не получу сладкого, так зачем мне есть овощи?»

Таким образом, важным аспектом угрозы является то, что выполнение соответствующего действия должно дорого обходиться игроку, выдвигающему ее. В игре «обед» родитель должен предпочесть дать ребенку десерт. Угрозы в истинном стратегическом смысле, как правило, имеют определенные последствия и для высказывающего их человека, стало быть, их суть сводится к нанесению взаимного вреда.

В техническом отношении угроза закрепляет вашу стратегию в предстоящей игре. Стратегия должна оговаривать, что вы будете делать в случае каждого возможного варианта развития событий, присутствующего на дереве игры. Следовательно, фраза «никакого десерта, пока не съешь овощи» — не полное описание стратегии, и его следует дополнить фразой «и получишь десерт, если съешь овощи». В большинстве угроз вторая часть не озвучивается. Почему? Потому что она подразумевается автоматически, по умолчанию. Но для того чтобы угроза возымела действие, вторая часть стратегии (в данном случае подразумеваемое обещание) тоже должна быть автоматически достоверной.

Таким образом, угроза «никакого десерта, пока не съешь овощи» содержит подразумеваемое обещание «и получишь десерт, если съешь овощи». И чтобы оно возымело желаемый эффект, оно также должно быть достоверным. В нашем примере его достоверность подтверждается автоматически, когда родитель предпочитает видеть, как ребенок наслаждается десертом. Другими словами, подразумеваемое обещание автоматически воспринимается как достоверное именно потому, что выполнение угрозы обойдется родителю дорого.

Если сформулировать эту ситуацию несколько иначе, то угроза содержит такую оговорку: если обстоятельства сложатся так, что вам придется совершить определенное действие в случае, если ваше желание не будет выполнено, вы будете сожалеть об этом. Тогда зачем делать эту оговорку на первом этапе? Зачем связывать себе этим руки, тогда как, казалось бы, было бы лучше оставить себе свободу выбора? Дело в том, что в теории игр наличие большего количества вариантов не всегда предпочтительно. Что касается угрозы, отсутствие свободы выбора на втором этапе игры имеет стратегическое значение, поскольку это меняет ожидания другого игрока в отношении ваших будущих ответных действий и вы можете использовать такое изменение ожиданий себе во благо.

Аналогичный эффект возникает и в случае обещания. Если ребенок знает, что родителям нравится дарить ему подарки, он может рассчитывать на получение гоночного велосипеда по какому-либо иному поводу — например, на день рождения. Но в такой ситуации обещание подарить велосипед не усиливает мотивацию ребенка усерднее учиться. Для того чтобы обещание дало желаемый стратегический эффект, вознаграждение должно быть достаточно дорогостоящим, чтобы другой игрок не надеялся получить его в любом случае. (Это важный урок в плане применения стратегий, на который вы можете указать своим родителям: обещанное ими вознаграждение должно быть более крупным и дорогостоящим, чем то, что они подарили бы вам исключительно ради удовольствия видеть вас счастливыми.)

То же касается и безусловных стратегических ходов (обязательств). Например, во время переговоров другие участники знают, что если у вас есть свобода действовать, то есть и возможность капитулировать, так что обязательство «никаких уступок» позволит вам добиться более выгодной сделки. Если вы хотите получить 60 % «пирога», а другая сторона предлагает вам 55 %, у вас может возникнуть соблазн согласиться. Но если вы сумеете заранее достоверно заявить, что не примете меньше 60 %, такого искушения у вас не возникнет и в итоге вы сможете добиться большего.

Следовательно, сама природа стратегических ходов такова, что постфактум (то есть когда этого потребует игра на втором этапе) вы не захотите выполнять ранее заявленное действие. Это верно в отношении всех типов стратегических ходов, и именно это делает достоверность столь проблематичной. Для того чтобы ваш стратегический ход оказался эффективным, вы еще на первом этапе игры должны что-то предпринять для обеспечения достоверности — то, что покажет сопернику: вы ни при каких обстоятельствах не отступите от оговоренного действия. Именно поэтому отказ от свободы действий может быть стратегически выгоден. С другой стороны, достоверности можно достичь посредством изменения своих выигрышей на втором этапе игры таким образом, что выполнение заявленного действия становится для вас действительно оптимальным.

Стало быть, существует два общих способа обеспечить достоверность стратегических ходов: 1) исключить из набора будущих действий ходы, которые могут вызвать у вас искушение предпринять их; 2) уменьшить свои выигрыши от таких ходов с тем, чтобы оговоренный ход действительно был наилучшим. В следующих разделах мы прежде всего проанализируем принцип действия стратегических ходов, исходя из их достоверности, и по мере их изучения будем делать некоторые комментарии по поводу достоверности, однако ее общий анализ отложим до .

 

3. Обязательства

В мы изучили игру в труса и нашли в ней два равновесия Нэша в чистых стратегиях. Каждый игрок предпочитает равновесие, в котором он едет прямо, а соперник сворачивает. В мы увидели, что если бы это была игра с последовательными, а не одновременными ходами, то игрок, делающий ход первым, выбрал бы «ехать прямо», предоставив другому игроку возможность извлечь из сложившейся ситуации максимальную пользу, применив стратегию «свернуть» и тем самым избежав столкновения. Теперь рассмотрим этот вопрос с иной позиции. Хотя сама игра сводится к одновременному выполнению ходов, если один игрок сможет сделать стратегический ход (создать первый этап, на котором он делает достоверное заявление о своем действии непосредственно в игре в труса, разыгрываемой на втором этапе), он получит такое же преимущество, как и при выполнения первого хода, взяв на себя обязательство действовать жестко (выбрать вариант «ехать прямо»).

Хотя это достаточно простая идея, мы проведем формальный анализ данной ситуации, что поможет вам углубить ее понимание и развить навыки, которые пригодятся в дальнейшем для анализа более сложных примеров. Вспомним, что герои игры Джеймс и Дин. Предположим, возможность сделать стратегический ход есть у Джеймса. (Дерево двухэтапной игры показано на рис. 9.1.) На первом этапе Джеймс должен решить, брать ли на себя обязательство. Согласно верхней ветви, исходящей из первого узла, он его не берет. В результате на втором этапе разыгрывается игра с одновременными ходами, таблица которой уже вам знакома по и . В этой игре множество равновесий, но Джеймс получает максимальный выигрыш только в одном из них. Вторая ветвь дерева отображает ситуацию, когда Джеймс берет на себя обязательство, под которым в данном случае подразумевается его отказ от свободы выбора в том смысле, что стратегия «ехать прямо» остается для него единственно возможной на данном этапе. Таким образом, таблица игры на втором этапе содержит только одну строку Джеймса, соответствующую заявленному им выбору варианта «ехать прямо». Согласно этой таблице, наилучший ход Дина — «свернуть»; стало быть, такое равновесие обеспечивает Джеймсу максимальный выигрыш. Следовательно, на первом этапе Джеймс считает оптимальным взять на себя обязательство; этот стратегический ход гарантирует ему максимальный выигрыш, тогда как при отсутствии обязательства ситуация остается неопределенной.

Рис. 9.1. Игра в труса: обязательство в виде ограничения свободы действий

Как Джеймсу сделать это обязательство достоверным? Как и любой первый ход, на котором игрок связывает себя обязательством, он должен быть: 1) необратимым; 2) видимым для других игроков. Нам предлагали ряд экстремальных и забавных идей. Джеймс может отсоединить руль автомобиля и выбросить его в окно так, чтобы Дин видел, что Джеймс больше не может свернуть в сторону. (Джеймс мог бы просто привязать руль так, чтобы его нельзя было повернуть, но тогда ему было бы труднее продемонстрировать Дину, что руль действительно привязан и узел невозможно быстро развязать.) Такие уловки позволяют исключить вариант «свернуть» из совокупности стратегий, доступных Джеймсу на втором этапе игры, оставляя «ехать прямо» как единственное действие, которое он может предпринять.

Более правдоподобный сценарий выглядит так. Если эти игры еженедельно проводятся по выходным, Джеймс может создать себе репутацию храбреца, которая будет выступать гарантией его действий в любой день. Иными словами, Джеймс может изменить свой выигрыш от выбора варианта «свернуть», если вычтет из него величину, отражающую потерю репутации. Если эта величина достаточно большая (скажем, 3), то в игре на втором этапе, когда Джеймс берет на себя обязательство, таблица выигрышей будет другой. Полное дерево этой версии игры представлено на рис. 9.2.

Рис. 9.2. Игра в труса: обязательство в виде изменения выигрышей

Теперь, на втором этапе игры, для Джеймса, связавшего себя обязательством, вариант «ехать прямо» становится поистине оптимальным; фактически это его доминирующая стратегия на данном этапе. Соответственно, оптимальная стратегия Дина — «свернуть». Заранее предвидя этот исход на этапе 1, Джеймс понимает, что получит выигрыш 1, связав себя обязательством (изменив свои выигрыши на этапе 2), тогда как без обязательства он не может быть уверен в выигрыше 1 и получит гораздо худший результат. Таким образом, анализ методом обратных рассуждений показывает, что Джеймсу следует взять на себя обязательство.

В игру с обязательствами могут сыграть оба игрока (или все игроки), поэтому успех будет зависеть как от скорости, с которой вы сможете использовать преимущество первого хода, так и от достоверности, с которой вы сумеете сделать этот ход. Если два игрока делают наблюдения с задержкой, они рискуют связать себя несовместимыми обязательствами: каждый отсоединит руль и выбросит его в окно, тут же увидев руль, вылетающий из окна соперника, как следствие — столкновение неизбежно.

Даже если у одного из игроков есть преимущество во взятии обязательства, другой может сорвать его попытку это сделать, демонстративно исключив возможность «увидеть» обязательство первого игрока, например, прервав с ним все контакты.

Возможно, игра в труса — это анахронизм 1950-х годов, но наш второй пример более универсален и хорошо знаком. Преподаватель во время занятий может использовать две стратегии в отношении соблюдения сроков сдачи студенческих работ — мягкость или жесткость, при этом студенты могут уложиться в сроки или нет. На рис. 9.3 эта игра представлена в стратегической форме. Преподавателю не нравится быть жестким; для него лучший исход (с выигрышем 4) — когда студенты сдают работы вовремя, даже если он с ними не слишком строг, а худший (выигрыш 1) — когда он со студентами предельно принципиален, а они все равно задерживают сдачу. Из двух промежуточных стратегий преподаватель, осознавая важность пунктуальности, предпочитает «жесткость»/«вовремя» «мягкости» / «с опозданием». Студенты отдают предпочтение исходу «мягкость» / «с опозданием», позволяющему им почти все выходные развлекаться и при этом не понести никакого наказания за задержку работ. Худший вариант для студентов — «жесткость»/«вовремя», как и для преподавателя. Что касается промежуточных исходов, то они предпочитают «мягкость» / «с опозданием» варианту «жесткость»/«вовремя», поскольку у них повышается самооценка, когда они считают, что сдали работу вовремя по собственной воле, а не из-за угрозы наказания.

Рис. 9.3. Таблица выигрышей для игры в соблюдение сроков

Если игра проводится как игра с одновременными ходами или если преподаватель делает второй ход, его доминируемой стратегией становится «мягкость» и тогда студент выбирает «с опозданием». Равновесный исход представляет собой комбинацию стратегий «мягкость» / «с опозданием», а выигрыши составляют 2, 4. Однако преподаватель может добиться более благоприятного исхода, изначально связав себя обязательством придерживаться стратегии «жесткость». Мы не приводим здесь дерево этой игры, как делали на и , поскольку оно очень похоже на дерево предыдущей игры в труса, и предоставляем вам возможность построить его самостоятельно. Без обязательства игра на втором этапе протекает так же, как и раньше, и преподаватель получает выигрыш 2. Когда преподаватель связан обязательством вести себя жестко, студенты понимают, что им лучше ответить стратегией «вовремя» на втором этапе, поэтому выигрыш преподавателя составит 3.

Преподаватель берет на себя обязательство совершить действие, отличающееся от того, что он бы сделал в игре с одновременными ходами, или от его наилучшего второго хода в случае, если бы сначала ходили студенты. Именно здесь на первый план выходит стратегическое мышление. Преподаватель ничего не выиграет, заявив, что будет придерживаться мягкой стратегии; студенты в любом случае рассчитывают на это и без заявлений. Для того чтобы добиться преимущества посредством выполнения стратегического хода, он должен связать себя обязательством не придерживаться стратегии, которая была бы равновесной в игре с одновременными ходами. Такой стратегический ход меняет ожидания студентов, а значит, и их действия. Как только они поверят в то, что преподаватель не шутит, они предпочтут уложиться в сроки выполнения заданий. Если бы студенты решили это проверить, сдав работы с опозданием, у преподавателя могло бы возникнуть искушение их простить, придумав себе в оправдание нечто вроде «только на этот раз». Именно существование соблазна отступить от взятого на себя обязательства делает его достоверность проблематичной.

Еще более неожиданно, что в данном случае преподавателю выгодно сделать стратегический ход, обязывающий его придерживаться доминируемой стратегии. Он связывает себя обязательством применить стратегию «жесткость», которая доминируема стратегией «мягкость». Если вы считаете парадоксальной ситуацию, в которой можно извлечь пользу из выбора доминируемой стратегии, значит, вы расширяете концепцию доминирования за надлежащие рамки ее применимости. Доминирование подразумевает любое из следующих двух предположений: 1) как я отреагирую на действие другого игрока и будет ли тот или иной вариант выбора наилучшим (или наихудшим) с учетом всех возможностей; 2) если другой игрок одновременно выполняет действие X, что для меня предпочтительнее (или хуже всего) и будет ли оно одним и тем же в случае всех действий X, которые может предпринять другой игрок? Ни одно из этих рассуждений не имеет значения, если вы ходите первым. Вместо этого вы должны заглянуть вперед и проанализировать вероятную реакцию другого игрока. Следовательно, преподаватель не сравнивает свои выигрыши в вертикальных смежных ячейках таблицы (с учетом возможных действий студентов по одному за раз), а вместо этого анализирует, как студенты отреагируют на его ходы. Если он связал себя обязательством придерживаться стратегии «жесткость», студенты будут придерживаться стратегии «вовремя», а если преподаватель привержен стратегии «мягкость» (или вообще не свяжет себя никакими обязательствами), они выберут «с опозданием». Следовательно, единственное уместное сравнение — верхняя правая и нижняя левая ячейки, из которых преподаватель предпочтет вторую.

Для того чтобы обязательство преподавателя было достоверным, оно должно касаться всего, что должен представлять собой первый ход. Во-первых, его необходимо взять до того, как другой игрок сделает свой ход. Преподаватель должен установить основные правила контроля за соблюдением сроков до того, как студенты получат задание. Во-вторых, обязательство должно быть наблюдаемым — студенты обязаны знать правила, которые следует соблюдать. Последнее и, пожалуй, самое важное: оно должно быть необратимым; студенты должны знать, что преподаватель ни при каких обстоятельствах не станет менять свою точку зрения и проявлять снисходительность. Преподаватель, который оставляет подобные лазейки и нечетко оговаривает непредвиденные ситуации, просто создает условия для изобретательных оправданий, которые сопровождаются неискренними извинениями и утверждениями «этого больше не повторится».

Преподаватель может обеспечить достоверность взятых на себя обязательств, сославшись на общие университетские правила, — это просто исключит вариант «мягкость» из совокупности стратегий, доступных ему на втором этапе игры. Или, как в случае игры в труса, он может создать себе репутацию жесткого человека, изменив свои выигрыши от стратегии «мягкость» посредством достаточно высоких издержек в связи с потерей репутации.

 

4. Угрозы и обещания

Обратите внимание, что угрозы и обещания — это правила ответа: ваше будущее фактическое действие зависит от того, что сделают другие игроки, но ваша свобода действий в дальнейшем ограничена обязательным соблюдением установленного правила. Еще раз повторяем: цель — изменить ожидания (а значит, и действия) других игроков с выгодой для себя. Связать себя правилом, которого вы не стали бы придерживаться при наличии полной свободы действий, — важный элемент данного процесса. Следовательно, первоначальное заявление о намерениях должно быть достоверным. На этот раз мы снова проанализируем ряд принципов обеспечения достоверности таких ходов, но хотим напомнить, что их фактическая реализация во многом остается искусством.

Вспомните классификацию стратегических ходов, представленную в . Угроза — это правило ответа, приводящее к негативным последствиям для других игроков, если они действуют вопреки вашим интересам. Обещание — правило ответа, в соответствии с которым вы предлагаете обеспечить другим игрокам положительный исход, если их действия согласуются с вашими интересами. Каждый из этих ответов может либо удержать других игроков от действий, которые они стали бы делать (сдерживание), либо склонить их к действиям, которые они не совершили бы в противном случае (принуждение). Мы проанализируем эти свойства по очереди.

А. Пример угрозы: торговые отношения между США и Японией

Наш пример связан с неизменной составляющей международной экономической политики США, а именно с торговыми трениями с Японией. Каждая страна может держать свои рынки либо открытыми, либо закрытыми для товаров другой страны. Но предпочтения двух стран относительно исходов этой игры несколько разнятся.

На рис. 9.4 представлена таблица выигрышей торговой игры. Для Соединенных Штатов наилучший исход (с выигрышем 4) — когда оба рынка открыты; это объясняется отчасти общей приверженностью США к рыночной системе и свободной торговле, а отчасти самими преимуществами от торговли с Японией: американские потребители получают высококачественные автомобили и бытовую технику, а производители США могут экспортировать сельскохозяйственную и высокотехнологичную продукцию. Худший исход для США (с выигрышем 1) — если оба рынка закрыты. Из двух исходов, в которых один рынок открыт, Соединенные Штаты предпочли бы, чтобы это был собственный рынок, поскольку японский рынок меньше, поэтому потеря доступа на него не столь важна, как потеря доступа к автомобилям Honda и видеоиграм.

Рис. 9.4. Таблица выигрышей в торговой игре между США и Японией

Что касается Японии, то в этом примере будем исходить из протекционистской, ориентированной на производителя торговой политики Японии, получившей в свое время прозвище Japan, Inc. Для Японии наилучший исход — когда рынок США открыт, а японский закрыт, а худший — когда складывается противоположная ситуация. Из двух оставшихся исходов Япония предпочитает тот, в котором оба рынка открыты, поскольку это обеспечивает ее производителям доступ к гораздо большему американскому рынку.

У обеих сторон есть доминирующие стратегии. Независимо от того, как проводится игра (одновременно или последовательно с любым порядком ходов), равновесный исход — «открытый американский рынок» / «закрытый японский рынок», а выигрыши 3, 4. Кроме того, такой исход соответствует общему представлению американцев о реальной торговой политике двух стран.

Япония уже получает свой лучший выигрыш в данном равновесии, поэтому ей не надо предпринимать каких бы то ни было стратегических ходов. А вот Соединенные Штаты могут побороться за выигрыш 4 вместо 3. Но в этом случае обычное безусловное обязательство не сработает. Каким бы оно ни было, наилучший ответ Японии — закрыть свой рынок. В таком случае для Соединенных Штатов лучше связать себя обязательством открыть свой рынок, а это и есть равновесие, полученное без всяких стратегических ходов.

Но допустим, США выберут следующее условное правило ответа: «Мы закроем свой рынок, если вы закроете свой». В результате мы получим двухэтапную игру, показанную на рис. 9.5. Если Соединенные Штаты не прибегнут к угрозе, второй этап будет таким же, как и раньше, и приведет к равновесию, в котором американский рынок останется открытым и США получат выигрыш 3, тогда как японский рынок будет закрыт и выигрыш Японии составит 4. Если Соединенные Штаты все же прибегнут к угрозе, то на втором этапе свобода выбора будет лишь у Японии; с учетом ее действий США просто предпримут действия, которых требует правило ответа. В связи с этим на данной ветви дерева мы отображаем только активного игрока и записываем выигрыши обеих сторон: если Япония закроет рынок, Соединенные Штаты также закроют, при этом США получат выигрыш 1, а Япония 2. Если Япония откроет рынок, значит, угроза Соединенных Штатов возымела действие, тогда США с радостью тоже откроют рынок и получат выигрыш 4, а Япония 3. Из этих двух сценариев второй для Японии предпочтительнее.

Рис. 9.5. Дерево торговой игры между США и Японией с применением угрозы

Теперь можем воспользоваться хорошо знакомым методом обратных рассуждений. Зная, какие результаты обеспечит второй этап во всех возможных случаях, Соединенным Штатам лучше применить угрозу на первом этапе. Она приведет к открытию Японией рынка, а США получат самый лучший исход.

Итак, описав механизм угрозы, теперь укажем на ряд ее важных свойств.

1. Когда Соединенные Штаты достоверно применят угрозу, Япония не будет следовать своей доминирующей стратегии «закрытый рынок». Еще раз напоминаем, что концепция доминирования применима только в контексте одновременных ходов или когда Япония делает второй ход. В данной ситуации Японии известно, что США предпримут действия, не соответствующие доминирующей стратегии. В таблице выигрышей у Японии только два варианта выбора — верхняя левая и нижняя правая ячейки, причем Япония отдаст предпочтение второму.

2. Достоверность угрозы проблематична, поскольку, если Япония попытается ее проверить и закроет рынок, у Соединенных Штатов возникнет соблазн отказаться от ее осуществления. Фактически, если бы действие, составляющее суть угрозы, было наилучшим ответом США постфактум, то не было бы необходимости заранее выдвигать эту угрозу (хотя США могли бы сделать предупреждение, чтобы убедиться, что японцы понимают сложившуюся ситуацию). Стратегический ход играет особую роль именно потому, что он заставляет игрока делать не то, что он хотел бы сделать на самом деле. Как говорилось ранее, выполнение угрозы в истинном стратегическом смысле обязательно должно дорого обходиться тому, кто ее выдвигает, а действие, составляющее суть угрозы, наносить взаимный вред.

3. Условное правило «Мы закроем свой рынок, если вы закроете свой» не полностью определяет стратегию США. Для того чтобы ее описание было полным, необходимо включить в него дополнительную оговорку о том, что именно предпримут Соединенные Штаты в ответ на открытый японский рынок: «…и откроем свой рынок, если вы откроете свой». Это дополнительное условие, представляющее собой подразумеваемое обещание, на самом деле часть угрозы, но его нет надобности формулировать в явном виде, поскольку его достоверность подтверждается автоматически. Учитывая выигрыши на втором этапе игры, в интересах США открыть рынок, если Япония откроет свой. Если бы это было не так, то есть если бы Соединенные Штаты ответили закрытием рынка даже при условии, что Япония откроет свой рынок, подразумеваемое обещание необходимо было бы сделать явным и каким-то образом обеспечить его достоверность. Иначе угроза США стала бы равносильна безусловному обязательству «Мы закроем свой рынок», что не вызвало бы требуемой реакции со стороны Японии.

4. Достоверное применение угрозы приводит к изменению действий Японии. Мы можем рассматривать это как сдерживание или принуждение, в зависимости от ситуации. Если японский рынок изначально открыт и японцы планируют переход к политике протекционизма, то угроза удержит их от этого действия. Но если японский рынок изначально закрыт, то угроза заставит их его открыть. Стало быть, будет стратегический ход сдерживающим или принуждающим, зависит от сложившегося положения вещей. Это различие может показаться вопросом семантики, но в действительности оно оказывает большое влияние на достоверность стратегического хода и способ его реализации. Мы вернемся к этому вопросу чуть ниже.

5. Вот несколько способов, позволяющих Соединенным Штатам сделать свою угрозу достоверной. Во-первых, США могут принять закон, требующий ее выполнения при определенных обстоятельствах. Это исключает действие, которое может стать соблазном для США, из совокупности доступных вариантов выбора на втором этапе. Такой результат обеспечивают некоторые положения о взаимности, содержащиеся в соглашениях Всемирной торговой организации, но используемые при этом процедуры очень медленные и неопределенные. Во-вторых, Соединенные Штаты могут делегировать полномочия по выполнению угрозы Министерству торговли США, находящемуся под влиянием американских производителей, ратующих за закрытие рынка США, чтобы тем самым ослабить конкурентное давление на себя. Это изменит выигрыши США на втором этапе (место истинных выигрышей США займут выигрыши Министерства торговли) и приведет к тому, что действие, составляющее суть угрозы, станет на самом деле оптимальным. (Опасность состоит в том, что Министерство торговли будет сохранять протекционистскую позицию, даже если Япония откроет рынок; а это означает, что обеспечение достоверности угрозы может обусловить потерю достоверности подразумеваемого обещания.)

6. Если угроза обеспечивает требуемый результат, ее не нужно приводить в исполнение. В действительности риск возможной ошибки в расчетах или в выполнении действия, составляющего суть угрозы, даже если другой игрок подчинится вашим требованиям, — веское основание воздержаться от использования более серьезных, чем необходимо, угроз. Для того чтобы выразить эту мысль в более резкой форме, Соединенные Штаты могли бы пригрозить выйти из оборонительного союза с Японией, если она откажется покупать американский рис и полупроводники, но эта угроза слишком «большая» и опасная, чтобы США вообще когда-либо воплотили ее в жизнь, поэтому она недостоверна. Если единственная возможная угроза кажется «слишком большой», игрок может уменьшить ее размер, поставив ее реализацию в зависимость от обстоятельств. Вместо того чтобы говорить Японии: «Если вы не откроете рынки, мы откажемся защищать вас в будущем», Соединенные Штаты могут сказать: «Если вы не откроете рынки, отношения между нашими странами ухудшатся до той степени, когда Конгресс может отказать вам в помощи, если на вас будет совершено нападение, даже несмотря на наличие соглашения». На самом деле Соединенные Штаты могут намеренно способствовать распространению таких настроений, которые повысят вероятность того, что Конгресс поступит именно так, с тем чтобы японцы острее ощутили возможную опасность. Подобная угроза, создающая риск, но не определенность неблагоприятного исхода, называется балансированием на грани. Это чрезвычайно тонкий и весьма опасный вариант стратегического хода. В мы рассмотрим его подробнее.

7. Когда Соединенные Штаты прибегают к угрозе, Япония получает более неблагоприятный исход, чем при ее отсутствии, поэтому она хотела бы предпринять стратегические действия, предотвращающие попытки США использовать угрозу. Например, предположим, что в настоящее время японский рынок закрыт и США пытаются применить такой стратегический ход, как принуждение. Японцы в принципе могут уступить, но на практике пытаться сорвать план другой стороны, ссылаясь на неизбежные задержки в связи с формированием политического консенсуса, чтобы на законодательном уровне закрепить решение об открытии рынка, затем на промедление в связи с подписанием административных нормативных актов, необходимых для обеспечения выполнения соответствующего закона, и т. д. Поскольку Соединенные Штаты не спешат с выполнением своей угрозы, в каждом из этих случаев у них возникает соблазн принять такое промедление. Или Япония может заявить, что ее внутренняя политика не позволяет полностью открыть все рынки, поэтому не согласятся ли Соединенные Штаты на то, чтобы Япония защитила несколько отраслей своей промышленности? Затем Япония постепенно начнет расширять этот список, но предпринятого в какой-то момент небольшого дополнительного шага недостаточно для того, чтобы США развязали торговую войну. Такой способ преодоления принуждающей угрозы посредством мелких шагов, или «ломтик за ломтиком», называется тактикой салями.

Б. Пример обещания: игра «ценообразование в ресторанах»

Теперь проиллюстрируем обещание на примере игры . Там эта игра представляла собой дилемму заключенных; здесь мы ее упростим, предположив, что есть только два варианта цен: лучшая цена для обоих игроков 26 долларов и цена в случае равновесия Нэша 20 долларов. Прибыль каждого ресторана в этой версии игры можно вычислить с помощью функций, представленных в ; результаты показаны на рис. 9.6. Без стратегических ходов в игре наблюдается обычное равновесие в доминирующих стратегиях, в которых оба ресторана назначают низкую цену 20 долларов и оба получают более низкую прибыль, чем в случае более высокой цены 26 долларов.

Рис. 9.6. Таблица выигрышей в игре «ценообразование в ресторанах» (выигрыши выражены в сотнях долларов в месяц)

Если любая из сторон сможет дать достоверное обещание «Я назначу высокую цену, если вы тоже», это позволит достичь кооперативного исхода. Например, если ресторан Xavier’s даст такое обещание, то ресторан Yvonne’s будет знать, что в случае выбора 26 долларов ресторан Xavier’s ответит тем же (и это приведет к получению выигрышей, показанных в нижней правой ячейке таблицы), а выбор 20 долларов повлечет за собой обычные действия ресторана Xavier’s (а именно, назначение цены 20 долларов), что даст выигрыши в верхней левой ячейке. Из этих двух вариантов ресторан Yvonne’s предпочитает первый, поэтому выбирает высокую цену.

Этот анализ можно выполнить более корректно, построив дерево двухэтапной игры, в которой у ресторана Xavier’s есть выбор: давать или не давать обещание на первом этапе. Мы не приводим здесь это дерево игры отчасти потому, чтобы вы глубже поняли процесс, построив его самостоятельно, а отчасти, чтобы показать, что такой подробный анализ становится ненужным, если вы усвоили соответствующие концепции.

Достоверность обещания ресторана Xavier’s находится под вопросом. Для того чтобы ответить на действия Yvonne’s, ресторан Xavier’s должен ходить вторым на втором этапе игры; соответственно, ресторан Yvonne’s должен на втором этапе ходить первым. Не забывайте, что первый ход — это необратимое действие, поддающееся наблюдению. Следовательно, если ресторан Yvonne’s сделает его и установит высокую цену, он останется уязвимым к обману со стороны ресторана Xavier’s, и нет гарантии, что у того не появится искушения отказаться от своего обещания установить высокую цену. Ресторан Xavier’s должен каким-то образом убедить ресторан Yvonne’s, что он не поддастся такому соблазну.

Как это лучше сделать? Владелец ресторана может доверить решение о цене местному управляющему, дав ему четкие указания назначить высокую цену в ответ на назначение высокой цены рестораном Yvonne’s. Владелец Xavier’s может предложить представителям Yvonne’s проконтролировать выполнение этих инструкций, после чего отправиться в одиночное кругосветное путешествие на яхте, чтобы избежать соблазна отменить свои указания. (Но даже в таком случае у менеджеров ресторана Yvonne’s могут остаться сомнения: а вдруг он тайно пронесет на борт телефон или ноутбук.) Такой сценарий равносилен исключению обмана из совокупности вариантов выбора, имеющихся в распоряжении ресторана Xavier’s на втором этапе игры.

Кроме того, Xavier’s может заслужить репутацию ресторана, который верен своему слову, в деловых кругах и во всем городе. В случае повторяющихся отношений этот факт может сыграть свою роль, поскольку даже один случай нарушения обещания способен привести к полному прекращению сотрудничества. По сути, поддержание постоянных отношений означает разделение игры на более мелкие фрагменты, в каждом из которых преимущества от нарушения обещания слишком незначительны, чтобы оправдать возможные негативные последствия. В такой игре издержки, связанные с разрывом деловых отношений в будущем, меняют выигрыш от обмана.

Мы уже говорили, что каждая угроза содержит подразумеваемое обещание. Точно так же каждое обещание содержит подразумеваемую угрозу. В данном случае угроза состоит в следующем: «Я назначу низкую цену, если это сделаете вы». Формулировать такую угрозу в явном виде нет необходимости, поскольку ее достоверность подтверждается автоматически: это действие представляет собой наилучший ответ ресторана Xavier’s на низкую цену ресторана Yvonne’s.

Между угрозой и обещанием есть одно важное различие. Если угроза возымела действие, ее нет необходимости выполнять, а значит, она не влечет за собой никаких издержек для того, кто ее выдвигает. Следовательно, угроза может быть более серьезной, чем требуется для ее эффективности (хотя, как отмечалось выше, чрезмерно большая угроза может оказаться слишком опасной, вплоть до потери ее достоверности). С обещанием все несколько иначе. Если обещание успешно меняет действие другого игрока в нужном направлении, игрок, давший его, должен его выполнить, что повлечет за собой определенные издержки. В предыдущем примере они связаны с отказом от искушения прибегнуть к обману и получить максимальный выигрыш; в других ситуациях, когда игрок предлагает другому игроку реальный подарок или стимул, эти издержки могут быть более существенными. В любом случае игрок, дающий обещание, заинтересован обещать не слишком много — ровно столько, сколько понадобится, чтобы сделать обещание эффективным.

В. Пример сочетания угроз и обещаний: совместные действия США и Китая в области политики

Когда мы рассматривали угрозы и обещания по отдельности, точная формулировка угрозы содержала подразумеваемое обещание, достоверность которого подтверждалась автоматически, и наоборот. Однако встречаются ситуации, в которых достоверность обоих аспектов находится под сомнением; в таком случае стратегический ход должен определять оба аспекта в явной форме и обеспечивать их достоверность.

Наш пример сочетания угроз и обещаний, выраженных в явной форме, связан с сотрудничеством нескольких стран в рамках достижения общей цели в контексте опасной ситуации, сложившейся в соседней стране. В частности, он касается обсуждения Соединенными Штатами и Китаем возможности совершения действий, направленных на принуждение Северной Кореи отказаться от планов по созданию ядерного оружия. На рис. 9.7 представлена таблица выигрышей США и Китая в условиях выбора между действием и бездействием.

Рис. 9.7. Таблица выигрышей в игре «совместные действия США и Китая в области политики»

Каждая страна хотела бы взвалить все бремя разбирательств с Северной Кореей на другую страну; в верхней правой ячейке отображен максимальный выигрыш Китая (4), а в нижней левой ячейке — максимальный выигрыш США (4) в этом случае. Для Соединенных Штатов наихудшая ситуация — отсутствие каких бы то ни было действий, поскольку повышенная угроза ядерной войны была бы для США неприемлемой. Для Китая наихудший исход — когда только он предпринимает действия, поскольку они сопряжены с высокими затратами. Обе страны считают совместное совершение действий вторым лучшим исходом (выигрыш 3). США присваивают выигрыш 2 ситуации, где действуют только они. А Китай присваивает выигрыш 2 ситуации, в которой бездействует.

Без стратегических ходов эта игра во вмешательство разрешима по доминированию. «Бездействие» — доминирующая стратегия Китая, а «действие» — наилучший выбор Соединенных Штатов. Равновесный исход отображен в верхней правой ячейке таблицы, с выигрышами 2 для США и 4 для Китая. Поскольку Китай получает свой наилучший исход, у него нет оснований использовать стратегические ходы. Однако Соединенные Штаты могут побороться за более высокий выигрыш, чем 2.

Какой стратегический ход позволит им повысить свой равновесный выигрыш? Безусловный ход (обязательство) не сработает, потому что Китай ответит стратегией «бездействие» на любой первый ход США. Одна только угроза («Мы не будем предпринимать никаких действий, если этого не сделаете вы») также не поможет повысить выигрыш, так как подразумеваемое обещание («Мы будем действовать, если это сделаете вы») недостоверно: если Китай действительно предпримет необходимые действия, Соединенные Штаты предпочли бы отступить и переложить все на Китай, получив выигрыш 4 вместо 3 в случае выполнения обещания. Обещание само по себе также не возымеет действия, поскольку Китай знает, что Соединенные Штаты вмешаются, если он этого не сделает, обещание американцев «Мы вмешаемся, если вы сделаете это» становится равносильным простому обязательству вмешаться; в таком случае Китай может оставаться в стороне, получив максимальный выигрыш 4.

В этой игре выраженное в явной форме обещание Соединенных Штатов должно содержать подразумеваемую угрозу «Мы будем действовать, если этого не сделаете вы», но она не является автоматически достоверной. Аналогичным образом, выраженная в явной форме угроза США должна включать подразумеваемое обещание «Мы будем действовать, если это сделаете вы», но его достоверность тоже не подтверждается автоматически. Следовательно, Соединенные Штаты должны выразить в явной форме и угрозу, и обещание, то есть выдвинуть угрозу в сочетании с обещанием: «Мы будем действовать только при условии, что вы тоже будете действовать». При этом необходимо обеспечить достоверность обоих утверждений. Как правило, это делается посредством договора, который охватывает все аспекты отношений между странами, а не просто путем заключения отдельных соглашений в каждом конкретном случае.

 

5. Некоторые дополнительные вопросы

А. Когда стратегические ходы приносят пользу

Мы уже рассмотрели несколько примеров, в которых стратегический ход обеспечивает кому-то из игроков более благоприятный исход по сравнению с оригинальной игрой, в которой такие ходы отсутствуют. А что можно сказать об их целесообразности в целом?

Безусловный ход (обязательство) не всегда выгоден тому, кто его делает. В действительности, если преимущество в игре имеет игрок, делающий второй ход, то было бы ошибкой заранее связывать себя обязательством выполнять тот или иной ход, тем самым фактически становясь тем, кто ходит первым.

Наличие возможности сделать условный ход (в виде угрозы или обещания) не может быть невыгодным для игрока. В худшем случае игрок может связать себя обязательством совершить согласно правилу ответа действие, которое и так было бы оптимальным. Однако если подобные ходы приносят игроку реальную пользу, это происходит из-за выбора им правила ответа, иногда требующего выполнить действие, отличающееся от того, что этот игрок посчитал бы оптимальным впоследствии. Стало быть, всякий раз, когда угрозы и обещания обеспечивают игроку положительный выигрыш, это происходит именно тогда (кто-то мог бы сказать, именно по той причине), когда их достоверность неочевидна и должна обеспечиваться посредством того или иного «инструмента» ее достижения. Мы уже упоминали несколько таких инструментов в предыдущих примерах, а немного ниже проанализируем вопрос достижения достоверности в более общем случае.

А что можно сказать о целесообразности быть принимающей стороной в случае стратегического хода? Никогда не позволяйте другому игроку вам угрожать. При наличии малейшей вероятности угрозы имеет смысл поискать другое предварительное действие, которое бы снизило степень угрозы или ее достоверность. Вскоре мы рассмотрим ряд таких действий. Вместе с тем зачастую желательно позволить другому игроку давать достоверные обещания, как в примере с дилеммой заключенных в контексте игры «ценообразование в ресторанах», в которой обещание позволило достичь кооперативного исхода. Следовательно, у игроков может быть взаимный интерес в том, чтобы один из них (или оба) дал определенные обещания.

Б. Сдерживание и принуждение

Теоретически как угроза, так и обещание могут обеспечить либо сдерживание, либо принуждение. Например, родитель, который хочет, чтобы его ребенок хорошо учился (принуждение), может либо пообещать вознаграждение (новый гоночный велосипед) за успехи в школе, либо пригрозить наказанием (ограничить время пребывания вне дома), если оценки будут низкими. Точно так же родитель, желающий оградить ребенка от плохой компании (сдерживание), может применить либо вознаграждение (обещание), либо наказание (угроза). На практике оба типа стратегических ходов действуют несколько по-иному, и это влияет на окончательное решение о том, какой именно ход использовать. Как правило, сдерживание более эффективно обеспечивается угрозой, а принуждение — обещанием. Причина состоит в особенностях выбора момента для выполнения хода и его инициатора.

Сдерживающая угроза может носить пассивный характер: вам не нужно ничего делать до тех пор, пока другой игрок не предпринимает действий, которые вы пытаетесь предотвратить. Кроме того, такая угроза может носить статический характер, то есть вам не придется вводить никаких временных ограничений. Таким образом, вы можете обозначить границы дозволенного, а остальное предоставить другому игроку. Так, родитель, желающий оградить ребенка от плохой компании, может сказать: «Если я когда-либо увижу тебя вместе с Х, то ты весь следующий учебный год будешь возвращаться домой не позже семи часов вечера». После этого родителю остается просто ждать и наблюдать. Родитель должен реализовать угрозу только в случае непослушания ребенка. Попытка добиться аналогичного сдерживающего эффекта посредством обещания потребовала бы применения более сложных методов мониторинга и повторяющегося действия: «В конце каждого месяца я буду давать тебе 25 долларов, если увижу, что в этом месяце ты не общался с Х».

Принуждение должно предусматривать какой-то конечный срок, иначе оно теряет смысл: другая сторона может нарушить все ваши планы, пытаясь тянуть время или постепенно свести вашу угрозу на нет (тактика салями). Это делает практическую реализацию принуждающей угрозы более трудной, чем принуждающего обещания. Родитель, который хочет, чтобы его ребенок хорошо учился, может просто сказать: «Каждый учебный год, за который ты получишь не ниже средней оценки, я буду дарить тебе диски или игры на сумму 500 долларов». В результате ребенок будет всякий раз стараться продемонстрировать родителю, что он выполнил все условия. Попытка обеспечить аналогичный результат посредством угрозы («За каждый учебный год с оценкой ниже средней я буду забирать у тебя по одной компьютерной игре») потребует от родителя гораздо большей бдительности и активности. Ребенок будет до последнего оттягивать момент предъявления табеля успеваемости или попытается спрятать игры.

Концепции вознаграждения и наказания соотносятся со статус-кво. Если у ребенка есть бессрочное право играть в игры, то лишить его такого права — это наказание; а если ребенку предоставляется временное право играть в игры в зависимости от успехов в школе, то возобновление такого права — это вознаграждение. Следовательно, вы можете превратить угрозу в обещание и наоборот, изменив статус-кво. И использовать такое изменение с выгодой для себя при выполнении стратегического хода. Если хотите добиться принуждения, попытайтесь выбрать статус-кво таким образом, чтобы то, что вы делаете, когда другой игрок действует в соответствии с вашими требованиями, стало вознаграждением, то есть вы используете при этом принуждающее обещание. Вот более драматичный пример: уличный грабитель может превратить угрозу «Если ты не отдашь мне свой кошелек, я достану нож и перережу тебе горло» в обещание «Нож у твоего горла, но как только ты отдашь мне кошелек, я его уберу». Но если вы хотите добиться сдерживания, попытайтесь выбрать статус-кво так, чтобы то, что вы сделаете в ответ на действия другого игрока, не совпадающие с вашими пожеланиями, было наказанием, то есть вы используете при этом сдерживающую угрозу.

 

6. Обеспечение достоверности

Мы постоянно подчеркивали важность достоверности стратегических ходов и сопровождали каждый пример краткими замечаниями о том, как ее обеспечить в соответствующем контексте. Инструменты достижения достоверности действительно часто зависят от контекста, поэтому их поиск или создание — в значительной мере искусство. Несколько общих принципов помогут вам организовать такой поиск.

Мы выделили два общих подхода к обеспечению достоверности стратегических ходов: 1) ограничить вашу собственную свободу действий в будущем таким образом, чтобы у вас не было иного выбора, кроме выполнения действий, предписываемых вашим стратегическим ходом; 2) изменить ваши собственные выигрыши в будущем таким образом, чтобы выполнение действий, предписываемых стратегическим ходом, было для вас оптимальным. Теперь рассмотрим ряд практических методов реализации каждого из этих подходов.

А. Ограничение свободы действий

I. Автоматическое выполнение. Предположим, вы отказываетесь на первом этапе игры от выбора на втором этапе и перекладываете эту задачу на механическое устройство либо аналогичную процедуру или механизм, который запрограммирован на выполнение обязательства, угрозы или обещания при соответствующих обстоятельствах, а затем демонстрируете другому игроку, что сделали это. В результате он наверняка поверит, что у вас нет возможности изменить свое решение, что обеспечит достоверность вашего стратегического хода. Самый известный пример такого устройства — машина судного дня, ядерное взрывное устройство, которое взорвется и загрязнит атмосферу всей планеты, если враг нанесет ядерный удар. (Устройство получило широкую известность в начале 1960-х годов после выхода на экраны художественных фильмов Fail Safe [ «Система безопасности»] и Dr. Strangelove [ «Доктор Стрейнджлав»].) К счастью, эта машина так и осталась в мире фантастики. Тем не менее в сфере торговой политики широко распространены автоматические процедуры введения ответных пошлин на импорт в случае попыток другой страны субсидировать свой экспорт в вашу страну (речь идет о компенсационных пошлинах).

II. Делегирование. Инструмент выполнения обязательств, угроз или обещаний не обязательно бывает механическим. Вы можете делегировать полномочия по выполнению тех или иных действий другому человеку или организации с требованием придерживаться определенных, заранее установленных правил или процедур. На самом деле именно так работают компенсационные пошлины. Их устанавливают два государственных органа (Министерство торговли и Комиссия по международной торговле), регламент работы которых закреплен общим торговым законодательством страны.

Агент не должен иметь собственных целей, способных помешать достижению цели стратегического хода. Например, если один игрок поручает агенту осуществить наказание в соответствии с выдвинутой угрозой, а агент склонен к насилию, то он может действовать даже тогда, когда для этого нет оснований — иными словами, когда второй игрок выполнил требования первого игрока. Если второй игрок заподозрит это, угроза потеряет эффективность, поскольку превратится в нечто наподобие ситуации «сделаешь — плохо и не сделаешь — плохо».

Инструменты делегирования не дают полной гарантии достоверности. Даже машина судного дня может ее утратить, если другая сторона заподозрит, что вы контролируете кнопку перехода на ручное управление, позволяющую предотвратить риск катастрофы. Кроме того, делегирование полномочий и предписания всегда можно изменить. Например, правительство США не раз аннулировало оговоренные компенсационные пошлины и разрабатывало иные формы соглашений с другими странами, чтобы избежать разорительных торговых войн.

III. Сжигание мостов. Многие захватчики, от Ксенофонта в Древней Греции до Вильгельма Завоевателя в Англии и Кортеса в Мексике, якобы намеренно отрезали своим армиям пути к отступлению, чтобы те сражались гораздо ожесточеннее. Некоторые из них в буквальном смысле слова сжигали за собой мосты, другие сжигали корабли, но с тех пор фраза «сжечь мосты» стала крылатой. Последними военными, применявшими этот метод, были японские пилоты-камикадзе Второй мировой войны, которые заливали в свои самолеты ровно столько топлива, сколько требовалось для того, чтобы долететь до американских военных кораблей и протаранить их. Этот принцип упоминается в самом раннем трактате о войне, в словах, которых приписывают принцу Фу Чай: «Дикие звери, загнанные в угол, отчаянно дерутся. Насколько же это верно в случае людей! Зная, что у них нет выбора, они будут сражаться до конца».

Аналогичные инструменты используются и в других играх с высокими ставками. Хотя Европейский валютный союз мог бы сохранить отдельные денежные единицы и просто зафиксировать обменные курсы, тем не менее была введена единая валюта, чтобы сделать процесс необратимым и создать для стран-членов гораздо более серьезный стимул построить успешный союз. (На самом деле именно степень необходимых обязательств удержала некоторые страны, например Великобританию, от вступления в Европейский валютный союз.) Отказ от общей валюты и возврат к национальной валюте полностью не исключаются, но это непомерно дорого. Однако, если внутри союза ситуация существенно ухудшится, одна или более стран все же могут принять решение о выходе. Как и в случае с автоматическими инструментами, сжигание мостов — это не ситуация «все или ничего», а вопрос степени достоверности.

IV. Прекращение коммуникации. Если вы сообщаете другому игроку о своем обязательстве и в то же время отрезаете любые пути к общению с ним, то он не сможет спорить или торговаться с вами, с тем чтобы изменить ваше действие. Опасность прекращения отношений состоит в том, что если оба игрока разорвут их одновременно, то они могут взять на себя взаимоисключающие обязательства, что нанесет обоим большой вред. Кроме того, прекращение коммуникации проблематично и в случае угрозы, поскольку вам необходимо знать о том, выполнил ли другой игрок ваше требование и нужно ли реализовывать угрозу. Помимо всего прочего, в наше время человеку практически невозможно полностью избегать контактов.

Однако если игроки — большие команды или организации, они могут прибегнуть к применению разных вариантов этого инструмента. Возьмем профсоюз, который принимает решения на общих собраниях своих членов. Проведение такого собрания требует серьезной подготовки (связанной с резервированием зала, установлением связи с членами профсоюза и т. д.). Скажем, цель собрания — выдвинуть требование о повышении заработной платы. Если компания не удовлетворит его в полном объеме, руководство профсоюза имеет право объявить забастовку, а затем провести еще одно собрание, чтобы рассмотреть встречное предложение. Этот процесс вынуждает руководство компании вести переговоры с профсоюзом в узких временных рамках, зная, что профсоюз не будет доступен для общения на протяжении нескольких недель подряд. В данной ситуации мы видим, что прекращение коммуникации на длительный период может обеспечить определенный уровень достоверности, но не абсолютную достоверность. Инструмент, используемый профсоюзами, не делает коммуникацию совершенно невозможной, а лишь создает задержку в несколько недель.

Б. Изменение выигрышей

I. Репутация. Вы можете создать себе репутацию человека, который всегда выполняет угрозы и обещания. Она особенно выигрышна в случае повторяющейся игры с одним и тем же человеком. Кроме того, она может оказаться полезной и в разных играх с разными участниками, если каждый из них имел возможность наблюдать за вашими действиями в играх с другими людьми. Приобретению такой репутации способствуют те же обстоятельства, что и при достижении сотрудничества в дилемме заключенных, и по тем же причинам. Чем выше вероятность продолжения отношений и чем сильнее обеспокоенность в отношении будущего по сравнению с настоящим, тем больше вероятность того, что игроки пожертвуют сиюминутными соблазнами ради будущих достижений.

В техническом плане этот инструмент устанавливает связь между различными играми, при наличии которой действия в одной игре меняются под влиянием возможных негативных последствий в другой. Если вы не смогли выполнить свою угрозу или обещание в одной игре, это сказывается на вашей репутации и выигрышах в других играх. Следовательно, анализируя любую из игр, вы должны скорректировать свои выигрыши с учетом подобного негативного воздействия на них в сопряженных играх.

Преимущество репутации в продолжительных отношениях объясняет, почему то, что вас обманет автомеханик, услугами которого вы регулярно пользуетесь, выполнив ненужный, или излишне дорогостоящий, или некачественный ремонт, менее вероятно по сравнению со случайной мастерской, куда вы обратитесь в экстренном случае. Но что выиграет ваш постоянный автомеханик от такой репутации, если конкуренция вынуждает его назначать настолько низкую цену, что он вообще не получает прибыли ни с одного заказа? Честность механика при выполнении ремонта вашего автомобиля имеет свою цену: вы должны быть готовы позволить ему взять с вас немного больше, чем в самой дешевой мастерской, рекламируемой в вашем городе.

Этим же объясняется тот факт, что, находясь вдалеке от дома, вы предпочитаете питаться в известной вам сети ресторанов, вместо того чтобы рисковать и идти в незнакомый местный ресторан. А универмаг, представляющий новую линию товаров, может использовать свою репутацию, приобретенную на основе существующего ассортимента, для гарантии их высокого качества.

В играх, в которых достоверные обещания одной или обеих сторон могут быть взаимовыгодны, игроки могут договориться и даже вместе работать над созданием механизмов завоевания репутации. Однако, если известно, что взаимодействие в определенный момент прекратится, возникает проблема завершающего этапа игры.

В рамках ближневосточного мирного урегулирования, начавшегося в 1993 году с соглашений в Осло, достаточно долго продолжался первый этап, в ходе которого Израиль передал контроль над частью сектора Газа и небольшими изолированными территориями западного берега реки Иордан властям Палестинской автономии, а та, в свою очередь, признала существование Израиля и ослабила антиизраильскую риторику, а также сократила применение силы. Однако по мере приближения завершающего этапа данного процесса взаимная достоверность следующих шагов стала проблематичной и к 1998 году процесс застопорился. В этой ситуации можно было бы задействовать весьма привлекательные внешние вознаграждения; например, Соединенные Штаты или Европа могли бы сделать обеим сторонам предложения об экономической помощи или открыть перспективы расширенной торговли. В 1978 году США уже предложили Египту и Израилю большую помощь, что позволило заключить Кэмп-Дэвидские соглашения. Однако в ситуации, сложившейся впоследствии, такие вознаграждения не были предложены, и в момент написания этой книги перспективы дальнейшего прогресса не внушают оптимизма.

II. Разделение игры на мелкие шаги. Иногда одну игру можно разделить на последовательность более мелких игр, чтобы создать условия для приведения механизма репутации в действие. В сфере жилищного строительства принято оплачивать строительство дома по частям по мере выполнения работ. В мирном процессе на Ближнем Востоке Израиль ни за что бы не согласился завершить передачу западного берега реки Иордан Палестинской автономии за один раз в обмен на одно обещание признать Израиль и прекратить террористические акции. Пошаговое развитие этого процесса позволило поддерживать его хотя бы на протяжении какого-то периода. Но это опять-таки иллюстрирует трудности с сохранением динамики процесса по мере приближения завершающего этапа.

III. Командная работа. Командная работа — еще один способ встроить игру поменьше в более крупную игру в целях повышения достоверности стратегических ходов. Этот метод требует от игроков, входящих в состав группы, контролировать действия друг друга. Если один из игроков не выполнит угрозы или обещания, другие должны применить к нему наказание, в противном случае к ним могут применить аналогичное наказание и т. д. Стало быть, выигрыши игрока в более крупной игре меняются таким образом, чтобы это обеспечивало достоверность соблюдения принципов всей команды.

Во многих университетах действуют кодексы чести, которые выступают в качестве инструментов обеспечения достоверности. Преподаватели не следят за тем, что происходит на экзаменах; студенты сами обязаны сообщать в студенческий комитет о выявленных случаях обмана. Затем студенческий комитет проводит заседание, где принимает решение о виде наказания (вплоть до временного отстранения от учебы на год или даже немедленного исключения), если студента действительно признают виновным. Студенты весьма неохотно ставят своих товарищей в столь опасное положение. Для того чтобы укрепить их решимость сделать это, в кодексы чести включается дополнительное условие, согласно которому отказ сообщить о нарушении — уже само по себе нарушение кодекса. Тем не менее большинство студентов считают эту систему несовершенной. По результатам опроса, проведенного в Принстонском университете, было установлено, что только треть студентов готовы сообщить о замеченном нарушении, особенно если они знакомы с тем, кто это сделал.

IV. Иррациональность. Вашей угрозе может не хватать достоверности по той причине, что другой игрок знает вас как рационального человека, которому слишком дорого обойдется ее реализация. В связи с этим другие игроки считают, что вы не станете выполнять угрозу, если подвергнуть вас такому испытанию. Вы можете решить эту проблему, заявив о свойственной вам иррациональности с тем, чтобы другие игроки поверили в то, что ваши выигрыши отличаются от их первоначальных оценок. Впоследствии, когда достоверность вашей угрозы окажется под вопросом, вы можете превратить свою мнимую иррациональность в стратегическую рациональность. Точно так же на первый взгляд иррациональные мотивы, например не запятнать свою честь или сохранить лицо, могут подтвердить достоверность того, что вы выполните обещание, даже если у вас возникнет соблазн его нарушить.

Другой игрок может распознать такую рациональную иррациональность. Тогда, если вы попытаетесь придать угрозе достоверность, заявив о своей иррациональности, он может не поверить вам. Следовательно, вам необходимо создать себе репутацию иррационального человека, например, поступая иррационально в какой-либо сопряженной игре. Кроме того, вы можете использовать одну из стратегий, описанных в , и предпринять действие, подающее достоверный сигнал о вашей иррациональности с тем, чтобы достичь равновесия, в котором вы сможете избавиться от этой ложной иррациональности.

V. Контракты. Вы можете сделать невыполнение угрозы или обещания весьма дорогостоящим для себя за счет подписания контракта, по условиям которого вам при этом придется выплатить достаточно большую сумму. Если такой контракт составлен правильно, то суд или другой уполномоченный орган может потребовать его выполнения, что в связи с изменением выигрышей будет для вас оптимальным и обеспечит достоверность вашей угрозы или обещания.

Что касается обещания, то здесь другой игрок может выступать в качестве противной стороны договора. Он заинтересован в том, чтобы вы выполнили обещание, поэтому заставит вас придерживаться условий контракта. Контракт, направленный на выполнение угрозы, более проблематичен. Другому игроку не нужно, чтобы вы приводили ее в исполнение, поэтому он не станет настаивать на соблюдении условий договора, если не получает более долгосрочных преимуществ в сопряженных играх из-за своей подверженности достоверной угрозе в данной игре. Следовательно, в случае угрозы контракт необходимо заключать с третьей стороной. Однако если вы привлечете третью сторону только ради гарантий выполнения угрозы, она не извлечет никакой выгоды из невыполнения вами оговоренного действия. Таким образом, контракт не защищен от пересмотра условий, которые бы обеспечивали третьей стороне какие-то преимущества. Если другой игрок подвергнет вас испытанию, вы можете сказать третьей стороне: «Послушайте, я не хочу выполнять эту угрозу. Однако перспектива взыскания по условиям контракта вынуждает меня это сделать, и в итоге вы ничего не получите. Я готов заплатить вам реальные деньги в обмен на освобождение от обязательств по контракту». Следовательно, сам контракт не достоверен, а значит, недостоверна и угроза. Третья сторона должна иметь более долгосрочные основания (например, потребность сохранить репутацию) для того, чтобы потребовать от вас соблюдения условий договора в случае, если он защищен от их пересмотра, а значит, достоверен.

Письменные контракты обычно более обязательны к исполнению, чем устные, но даже устные могут представлять собой обязательства. Когда во время президентской кампании 1988 года Джордж Буш сказал: «Читайте по губам: новых налогов не будет», американцы восприняли это обещание как контракт, имеющий обязательную силу, и после того как в 1990 году Буш отказался его выполнять, во время выборов 1992 года народ ему этого не простил.

VI. Балансирование на грани. В ходе анализа игры в торговую политику между США и Японией мы обнаружили, что угроза может быть слишком большой, чтобы быть достоверной. Если более мелкую, но эффективную угрозу нельзя найти естественным способом, размер крупной угрозы можно уменьшить, поставив ее выполнение в зависимость от обстоятельств. Соединенные Штаты не могут прямо заявить Японии: «Если вы не откроете свои рынки для американских товаров, мы не станем защищать вас в случае нападения русских или китайцев». Однако США могут сделать более завуалированное достоверное заявление: «Если вы не откроете свои рынки для американских товаров, отношения между нашими странами ухудшатся, что создаст риск того, что в случае нападения на вас Конгресс не даст разрешения на военное вмешательство США для оказания вам помощи». Как уже говорилось ранее, такое намеренное создание риска обозначается термином «балансирование на грани». Это тонкая труднореализуемая на практике концепция. Балансирование на грани лучше всего понять, понаблюдав за ним в действии; подробный анализ представленного в Карибского ракетного кризиса служит именно этой цели.

Мы описали ряд инструментов для обеспечения достоверности стратегических ходов и проанализировали их эффективность. И в заключение хотим обратить особое внимание на один важный общий аспект всего вышесказанного. На практике достоверность — это не ситуация «все или ничего», а вопрос степени. Хотя теория позволяет сделать однозначные выводы (анализ методом обратных рассуждений показывает, сработает угроза или нет), в случае практического применения следует учитывать тот факт, что между этими двумя экстремальными значениями лежит целый диапазон возможностей и вероятностей.

 

7. Противодействие стратегическим ходам соперника

Когда ваш соперник связывает себя обязательством или выдвигает угрозу, которая ставит вас в невыгодное положение, вы можете сделать встречный стратегический ход до того, как он это действительно осуществит. Для этого можно снизить эффективность будущего стратегического хода соперника, например, исключив его необратимость или нарушив достоверность. В данном разделе мы проанализируем инструменты, позволяющие решить такую задачу. Некоторые из них подобны тем, которые другая сторона может использовать для своих нужд.

А. Иррациональность

Иррациональность может сослужить потенциальному получателю угрозы или обязательства такую же службу, как и другому игроку. Если у вас репутация иррационального человека, который не сдастся перед лицом опасности и готов понести любой ущерб, если соперник осуществит свою угрозу, то он не станет спешить с ее выполнением, поскольку это навредит и ему самому. Все, что уже говорилось в отношении трудностей с убеждением другой стороны в вашей иррациональности, справедливо и в данном случае.

Б. Прекращение коммуникации

Если вы сделаете передачу вам сообщения другим игроком о его обязательстве или угрозе невозможной, то для него такое действие теряет смысл. Томас Шеллинг иллюстрирует эту идею на примере ребенка, который слишком громко плачет, чтобы услышать угрозы одного из родителей. Таким образом, родителю бессмысленно предпринимать какие бы то ни было стратегические ходы, поскольку коммуникация с ребенком фактически прервана.

В. Открытые пути к отступлению

Если другой стороне выгодно сжечь за собой мосты, чтобы предотвратить отступление, то вы можете извлечь для себя пользу, погасив эти пожары и даже построив новые мосты или дороги, по которым ваш соперник мог бы отступить. Этот метод известен еще с древних времен. Сунь-цзы говорил: «Окружая врага, оставь ему путь к отступлению». Однако цель состоит не в том, чтобы действительно дать противнику уйти, а скорее в том, чтобы «показать ему, что есть путь к спасению и альтернатива смерти. А затем нанести удар».

Г. Подрыв мотивации соперника к поддержанию репутации

Предположим, человек, который вам угрожает, говорит следующее: «Послушайте, я не хочу выполнять эту угрозу, но я должен это сделать, чтобы сохранить репутацию в глазах окружающих». Вы можете ответить на это так: «Не в моих интересах обнародовать тот факт, что вы меня не наказали. Я буду хранить молчание, и мы оба избежим исхода, который наносит вред нам обоим, а ваша репутация останется незапятнанной». Аналогичным образом, если вы покупатель и торгуетесь с продавцом, который отказывается снизить цену на том основании, что, сделав это для вас, ему придется делать это и для остальных, вы также можете постараться его заверить, что не собираетесь никому ничего рассказывать. Однако это не всегда срабатывает, поскольку другой игрок может заподозрить, что вы расскажете обо всем нескольким друзьям, те расскажут своим друзьям и т. д.

Д. Тактика салями

Тактика салями — это инструмент, позволяющий уменьшить размер угрозы соперника так же, как нарезается салями: по одному ломтику за раз. Вы не выполняете пожеланий другого игрока в настолько малой степени (будь то в случае сдерживания или принуждения), что предпринимать в ответ какие-то радикальные действия для него не имеет никакого смысла. Если ваш шаг оказывается эффективным, вы совершаете еще одно небольшое нарушение, затем еще одно и т. д.

Такой подход вам прекрасно знаком с детства. Шеллинг замечательно его описывает:

Можно не сомневаться, что тактику салями изобрели дети. …Скажите ребенку, чтобы он не заходил в воду, — и он сядет на берегу, опустив в воду босые ступни; он все еще «не в воде». Закройте на это глаза — и ребенок поднимется на ноги; он так и не окунулся в воду в большей мере, чем раньше. Помедлите еще немного — и он начнет продвигаться дальше, почти не погружаясь в воду; поразмышляйте хотя бы минуту, чем это отличается от того, что было раньше, — и он войдет в воду немного глубже, утверждая, что, поскольку он ходит туда и обратно, в целом он в воду не окунается. Вскоре вы уже кричите ребенку, чтобы он не уплывал из вашего поля зрения, пытаясь понять, куда подевалась вся ваша дисциплина.

Тактика салями особенно эффективна в контексте противодействия принуждению, поскольку позволяет выгодно использовать такой аспект, как время. Когда ваша мама велит вам убрать в комнате, «не то хуже будет», вы можете отложить выполнение этого задания на час, заявив, что должны закончить домашнее задание, затем еще на полдня — потому что вам нужно на тренировку по футболу, а потом до вечера, поскольку вы не можете пропустить «Симпсонов» по ТВ, и т. д.

Для противодействия такому контрходу, как тактика салями, вы должны разделить угрозу на уровни и разработать шкалу наказаний, соответствующую шкале неподчинения или промедления. Этого также можно достичь путем постепенного повышения риска катастрофы, еще одного примера практического применения балансирования на грани.

 

Резюме

Действия, предпринимаемые игроками для того, чтобы зафиксировать правила ведения игры в будущем, обозначаются термином «стратегические ходы». Чтобы эти ходы стали истинными первыми ходами, они должны быть наблюдаемыми и необратимыми, а для того чтобы обеспечивали требуемый результат — достоверными. Обязательство — это безусловный первый ход, используемый для получения преимущества первого хода, если оно существует. Как правило, такой ход подразумевает выбор стратегии, которая не была бы равновесной в исходной версии игры.

Условные первые ходы, такие как угрозы, обещания и правила ответа, предназначены либо для того, чтобы сдерживать действия соперника и сохранить статус-кво, либо чтобы принудить его к ним и изменить статус-кво. Угрозы могут причинить вред обоим игрокам, но если они помогают достичь цели, то могут ничего не стоить тому, кто их выдвигает. Угрозы, лишь создающие риск неблагоприятного исхода, относятся к категории балансирования на грани. Обещания обходятся дорого тому, кто их дает, и только тогда, когда обеспечивают требуемый результат. Размер угрозы может быть каким угодно, однако чрезмерный размер угроз негативно сказывается на их достоверности. С другой стороны, обещания эффективны только в случае, когда они достаточно серьезны. Если подразумеваемое обещание (или угроза), связанное с угрозой (или обещанием), недостоверно, игроки должны сделать ход, который содержит и угрозу, и обещание, а затем определить, обе ли его составляющие достоверны.

Достоверность должна достигаться при любом стратегическом ходе. Существует ряд общих принципов и конкретных инструментов ее обеспечения. Как правило, они сводятся либо к ограничению свободы выбора игрока в будущем, либо к изменению его выигрышей от будущих действий. К числу таких инструментов можно отнести создание репутации, использование командной работы, демонстрацию мнимой иррациональности, сжигание мостов и заключение контрактов, хотя многое зависит от контекста. Имеются также аналогичные инструменты, предназначенные для противодействия стратегическим ходам соперников.

 

Ключевые термины

Балансирование на грани

Действие наблюдаемое

Действие необратимое

Достоверность

Контракт

Машина судного дня

Обещание

Обязательство

Правило ответа

Принуждение

Рациональная иррациональность

Сдерживание

Стратегические ходы

Тактика салями

Угроза

 

Упражнения с решениями

S1. «Можно было бы утверждать, что размер обещания ограничен, тогда как угроза теоретически может быть сколь угодно большой, если она достоверна (и не содержит ошибок)». Во-первых, кратко объясните, почему это утверждение истинно. Во-вторых, несмотря на его истинность, игроки могут обнаружить, что слишком серьезная угроза без достаточных на то оснований может не пойти им на пользу. Объясните, почему последнее утверждение тоже истинно.

S2. По каждой из представленных ниже таблиц игры ответьте на следующие вопросы:

a) Каким будет равновесие в этой игре в случае, если ни один из игроков не применит стратегические ходы?

b) Может ли один игрок повысить свой выигрыш, использовав стратегический ход (обязательство, угрозу или обещание) или их сочетание? Если да, то какой именно игрок выполнит такой стратегический ход (ходы)?

3.

4.

5.

S3. В классическом фильме «Мэри Поппинс» дети четы Бэнкс ведут стратегическую игру с разными нянями. По мнению детей, все няни слишком суровы и подшучивать над ними — это очень весело. То есть, с точки зрения детей, они ведут игру, в которой няня ходит первой, показав себя как строгую или мягкую, а затем дети делают второй ход, выбирая либо хорошее, либо плохое поведение. Няня предпочитает присматривать за хорошими детьми, но по своей природе она сурова, поэтому максимальный выигрыш 4 ей обеспечивает сочетание стратегий «строгость» / «хорошее поведение», а минимальный — «мягкость» / «плохое поведение»; сочетание стратегий «мягкость» / «хорошее поведение» обеспечивает ей выигрыш 3, а «строгость» / «плохое поведение» — выигрыш 2. Дети, естественно, предпочли бы добрую няню и возможность озорничать; они получат самые высокие выигрыши, если няня применит стратегию «мягкость» (выигрыш 4 при выборе стратегии «плохое поведение» и 3 — «хорошее поведение»), и самые низкие, если няня предпочтет стратегию «строгость» (2 при выборе стратегии «плохое поведение» и 1 — «хорошее поведение»).

a) Постройте дерево этой игры и найдите совершенное равновесие подыгры при отсутствии стратегических ходов.

b) В фильме перед прибытием Мэри Поппинс дети пишут собственное объявление в газету о поисках няни, в котором заявляют: «Если вы не будете нас ругать и притеснять, мы не дадим вам повода нас ненавидеть; мы не будем прятать ваши очки, класть лягушек вам в постель или перец в чай». Используйте дерево игры из пункта а, для того чтобы доказать, что это объявление содержит обещание. Каким был бы исход игры, если бы дети его выполнили?

c) В чем состоит подразумеваемая угроза, которая содержится в обещании в пункте b? Подтверждается ли ее достоверность автоматически? Обоснуйте свой ответ.

d) Как дети могут обеспечить достоверность угрозы из пункта b?

e) Обещание из пункта b сдерживающее или принуждающее? Обоснуйте свой ответ, сославшись на статус-кво в этой игре, а именно что произошло бы при отсутствии данного стратегического хода.

S4. Ниже представлена интерпретация борьбы между Соединенными Штатами Америки и Советским Союзом за геополитическое влияние в 1970-х и 1980-х годах. Каждая сторона располагает двумя возможными стратегиями: «агрессивная политика» и «сдержанная политика». Советский Союз стремится достичь мирового господства, поэтому «агрессивная политика» — его доминирующая стратегия. Соединенные Штаты хотят Советскому Союзу в этом помешать, поэтому будут отвечать на агрессию агрессией, а на сдержанность — сдержанностью. Таблица выигрышей в этой игре выглядит так:

В случае каждого игрока 4 — это максимальный, а 1 — минимальный выигрыш.

a) Проанализируйте эту игру в ситуации, когда обе страны ходят одновременно. Найдите в ней равновесие Нэша.

b) Далее проанализируйте три разных альтернативных способа ведения игры с последовательным выполнением ходов: 1) Соединенные Штаты ходят первыми, Советский Союз вторым; 2) Советский Союз ходит первым, США вторыми; 3) Советский Союз ходит первым, США вторыми, но у СССР есть дальнейший ход, который может изменить первый ход. Для каждого варианта постройте дерево игры и найдите совершенное равновесие подыгры.

c) Какие ключевые стратегические вопросы (обязательство, достоверность и т. д.) стоят перед двумя странами?

S5. Проанализируйте представленные ниже игры. В каждом случае выполните следующие задания: 1) определите, какой игрок может извлечь выгоду из выполнения стратегического хода; 2) установите характер стратегического хода, подходящего для достижения данной цели; 3) опишите концептуальные и практические трудности, которые могут возникнуть в процессе обеспечения достоверности этого стратегического хода; 4) объясните, преодолимы ли они и если да, то как.

a) Другие страны Европейского валютного союза (Франция, Германия и т. д.) хотели бы, чтобы Великобритания также присоединилась к единой валютной зоне и подчинялась правилам единого центрального банка.

b) Соединенные Штаты хотели бы, чтобы Северная Корея прекратила экспортировать ракеты и ракетные технологии в Иран и чтобы Китай присоединился к работе над достижением этой цели.

c) Профсоюз рабочих автомобильной промышленности США хотел бы, чтобы правительство США ограничило импорт автомобилей.

Упражнения без решений

U1. В одном из эпизодов фильма Manhattan Murder Mystery («Загадочное убийство в Манхэттене») герои Вуди Аллена и Дайан Китон находятся на хоккейном матче в Madison Square Garden. Героиня явно чувствует себя не в своей тарелке, но спутник говорит ей: «Не забывай о нашей сделке. Ты остаешься со мной до окончания матча, а на следующей неделе я иду с тобой в оперу и пробуду там до конца». Позже мы видим, как они выходят из театра Metropolitan Opera на безлюдную площадь Линкольн-центра, тогда как в театре все еще играет музыка. Героиня Китон расстроена: «Как же насчет сделки? Я посмотрела с тобой весь хоккейный матч, а ты обещал до конца оставаться в опере». Герой Аллена отвечает: «Видишь ли, я не могу долго слушать Вагнера. В конце первого акта я уже почувствовал желание захватить Польшу». На основании знаний теории стратегических ходов и обеспечения их достоверности прокомментируйте стратегический выбор, сделанный участниками этой игры.

U2. Рассмотрим игру между одним из родителей и ребенком. Ребенок может вести себя хорошо (Х) или плохо (П); родитель может наказать ребенка (Н) или воздержаться от наказания (В). Ребенок получает от плохого поведения удовольствие, имеющее для него ценность 1, но наказание наносит ему эмоциональную травму, ценность которой −2. Таким образом, если ребенок ведет себя хорошо и его не наказывают, он выигрывает 0, а если плохо и его наказывают, то 1 − 2 = −1 и т. д. Родитель получает выигрыш −2 от плохого поведения ребенка и −1, когда наказывает ребенка.

a) Сформулируйте эту игру как игру с одновременными ходами и найдите равновесие Нэша.

b) Предположим, сначала ребенок выбирает стратегию «хорошее поведение» или «плохое поведение», после чего родитель, исходя из выбора ребенка, применяет стратегию «наказать» или «воздержаться от наказания». Нарисуйте дерево игры и найдите совершенное равновесие подыгры.

c) Теперь допустим, что прежде чем ребенок начнет действовать, родитель берет на себя обязательство совершить определенный ход — например, применяет угрозу «Н, если П» («Если будешь вести себя плохо, я тебя накажу»). Сколько таких стратегий есть у родителя? Составьте таблицу этой игры. Найдите все равновесия Нэша в чистых стратегиях.

d) Чем отличаются ваши ответы в пунктах b и c? Объясните причину такого различия.

U3. Профессор Уильям Шаррон из Сент-Луисского университета описал общую стратегическую игру, представленную в труде Фукидида о Пелопоннесской войне, в терминах теории игр. Афины создали большую империю, в которую вошли города на побережье Эгейского моря, воспользовавшись своей ролью лидера по защите греческих государств от персидских завоевателей. Спарта, опасаясь афинского влияния, замыслила войну против Афин. Но если бы Спарта решила ее не начинать, Афинам пришлось бы решать, сохранять свою власть в империи или отказаться от нее. К тому же Афины опасались, что, получив независимость, города могут присоединиться к Спарте и образовать более мощный союз против Афин, за что Спарта предоставила бы им весьма выгодные условия. Таким образом, в игре есть три игрока — Спарта, Афины и малые города; игроки делают ходы именно в таком порядке. В этой игре существует четыре исхода с выигрышами, представленными в следующей таблице (4 — самый высокий выигрыш):

a) Нарисуйте дерево игры и найдите равновесие обратных рассуждений. Есть ли в этой игре исход, более благоприятный для всех игроков?

b) Какой стратегический ход или ходы могли бы обеспечить более благоприятный исход? Проанализируйте достоверность таких ходов.

U4. Конфигурацию выигрышей в игре из можно изменить так, чтобы сказанное в объявлении детей представляло собой угрозу, а не обещание.

a) Нарисуйте новое дерево игры из и запишите выигрыши обоих игроков таким образом, чтобы объявление детей стало угрозой в сугубо формальном смысле.

b) Найдите в игре статус-кво, а также определите, будет ли угроза сдерживающей или принуждающей.

c) Объясните, почему достоверность этой угрозы не подтверждается автоматически, с учетом вашей структуры выигрышей.

d) Объясните, почему достоверность подразумеваемого обещания подтверждается автоматически.

e) Объясните, почему дети больше всего хотели бы выдвинуть угрозу, и предложите способ, позволяющий сделать ее достоверной.

U5. Ответьте на вопросы, сформулированные в , в контексте следующих ситуаций.

a) Студенты вашего университета или колледжа хотят помешать администрации повысить плату за обучение.

b) Большинство участников конфликтов, так же как и другие страны, хотят добиться прочного мира в Афганистане, Ираке, Израиле и Палестине.

c) Почти все страны мира хотят, чтобы Иран закрыл свою ядерную программу.

U6. Составьте краткое описание игры с вашим участием, в которой были сделаны такие стратегические ходы, как обязательство, угроза или обещание; уделите особое внимание важному аспекту этих ходов, а именно достоверности. По возможности проиллюстрируйте игру и объясните, почему она закончилась именно так, а не иначе. Опирались ли игроки на глубокое стратегическое мышление при принятии решений?

 

Глава 10. Дилемма заключенных и повторяющиеся игры

 

* * *

В этой главе мы продолжим изучать широкий класс игр и остановимся на концепции «дилемма заключенных». Пожалуй, это классический пример теории стратегии и ее последствий для прогнозирования поведения участников игры, и большинство людей, изучающих теорию игр, с ним знакомы. Даже те, кто не имеет никаких знаний в данной области, наверняка наслышан об этой концепции или как минимум о ее существовании. Дилемма заключенных — это игра, в которой у каждого игрока есть доминирующая стратегия, но равновесие, возникающее в результате применения всеми игроками своих доминирующих стратегий, обеспечивает каждому из них худший исход, чем при использовании доминируемых стратегий. Парадоксальность этого равновесия поднимает ряд более сложных вопросов о характере взаимодействия участников игры, ответить на которые можно только посредством тщательного анализа. Цель данной главы — предоставить вам дополнительные инструменты такого анализа.

В мы уже сталкивались с дилеммой заключенных. Там же мы обратили внимание на любопытную природу равновесия, которое на самом деле «плохой» исход для игроков. «Заключенные» могут найти другой исход, более предпочтительный равновесному, но у них возникают трудности с выполнением этой задачи. В данной главе мы рассмотрим вероятность достижения такого исхода. Иными словами, проанализируем, могут ли (и каким образом) участники игры «дилемма заключенных» достичь и сохранить взаимовыгодный кооперативный исход, преодолев свою естественную заинтересованность в отказе от сотрудничества ради личной выгоды. Сначала разберем стандартную игру «дилемма заключенных», а затем сформулируем три категории решений. Первый и самый важный метод решения таких игр сводится к повторению стандартной однократной игры. Именно за разработку общей теории повторяющихся игр Роберт Ауманн (вместе с Томасом Шеллингом) в 2005 году получил Нобелевскую премию по экономике. Как обычно, на вводном этапе мы приведем несколько простых примеров этой общей теории, а затем проанализируем еще две категории возможных решений, в основе которых лежат схемы взыскания (или вознаграждения) и роль лидерства.

Глава заканчивается обзором некоторых экспериментальных данных, касающихся дилеммы заключенных, а также описанием примеров реальных дилемм в действии. Как правило, в ходе таких экспериментов игроки участвуют в различных вариантах дилеммы заключенных, при этом демонстрируют порой озадачивающее, а порой более предсказуемое поведение. Эксперименты, проведенные с использованием компьютерного моделирования, дали аналогичные результаты. Примеры реальных дилемм заключенных приведены для того, чтобы вы получили представление о разнообразии ситуаций, в которых они возникают, и увидели, что по крайней мере в одном случае игроки могут отыскать собственное решение такой дилеммы.

 

1. Исходная игра (обзор)

Прежде чем приступить к анализу методов, позволяющих избежать неблагоприятного исхода в дилемме заключенных, ознакомимся с кратким описанием основ этой игры, вспомнив , которых подозревают в убийстве. Мужа и жену допрашивают отдельно, при этом каждый из них может либо признаться в совершении преступления, либо полностью отрицать свою причастность к нему. Таблица выигрышей, которые они при этом получат, представлена на  и воспроизведена на рис. 10.1. Выигрыши исчисляются в годах тюремного заключения; следовательно, низкие значения более выгодны обоим игрокам.

Рис. 10.1. Таблица выигрышей в стандартной игре «дилемма заключенных»

В этой игре у обоих игроков есть доминирующая стратегия. Каждому из них выгоднее сознаться независимо от того, что сделает другой. В случае равновесного исхода оба игрока принимают решение признать свою вину и каждый получает 10 лет тюрьмы. Однако если бы оба решили все отрицать, это бы обеспечило им более благоприятный исход — всего по 3 года тюремного заключения.

В любой игре «дилемма заключенных» обязательно есть стратегия сотрудничества и стратегия обмана, или стратегия отказа от сотрудничества. На «отрицать вину» — это стратегия сотрудничества; ее использование обоими игроками обеспечивает им самый благоприятный исход. «Признать вину» — стратегия обмана, или отказа от сотрудничества; игроки обычно применяют ее в надежде на получение личной выгоды за счет соперника. Таким образом, участников игры «дилемма заключенных» можно обозначить в соответствии с их выбором стратегии либо как игроков, которые отказываются от сотрудничества, либо как игроков, которые идут на сотрудничество. Мы будем использовать эту классификацию при анализе возможных решений дилеммы заключенных.

Обратите внимание, что хотя мы говорим о стратегии сотрудничества, дилемма заключенных относится к числу некооперативных игр в том смысле, о котором шла речь в , а именно — игроки принимают решения и реализуют их отдельно друг от друга. Если бы два игрока могли обсуждать, выбирать и применять свои стратегии (например, если бы они находились в одном помещении и совместно решали, как им лучше поступить), у них не возникло бы проблем с получением исхода, предпочтительного для обоих. По сути, вопросы о том, когда и как может быть решена дилемма заключенных, сводятся к преодолению проблемы достижения кооперативного (предпочтительного для обоих игроков) исхода посредством некооперативных (индивидуальных) действий.

 

2. Категория решений I: повторение

Наиболее известный и естественный механизм, позволяющий поддерживать сотрудничество в дилемме заключенных, — это повторяющаяся игра. Повторяющееся или постоянное взаимодействие между игроками подразумевает наличие особых характеристик игр, которые они ведут друг с другом. В дилемме заключенных это проявляется в опасении каждого игрока по поводу того, что один случай отказа от сотрудничества приведет к его прекращению в будущем. Если ценность будущего сотрудничества достаточно велика и превышает выгоду, получаемую от отказа от него в краткосрочной перспективе, то долгосрочные личные интересы игроков могут автоматически удержать их от обмана без какой-либо необходимости в дополнительных мерах наказания или давления со стороны третьих лиц.

Проанализируем дилемму заключенных в контексте представленной в — Xavier’s Tapas и Yvonne’s Bistro. Для пущего эффекта мы решили ее упростить, оставив только два варианта цен: наилучшую цену (основанную на сговоре) для обоих ресторанов 26 долларов и цену 20 долларов в случае равновесия Нэша. Выигрыши (прибыль, выраженная в сотнях долларов в месяц; показаны на рис. 10.2) можно вычислить с помощью функций количества (спроса), приведенных в . Как и в любой дилемме заключенных, у каждого ресторана есть доминирующая стратегия — обмануть конкурента и назначить меньшую цену 20 долларов, хотя оба ресторана предпочли бы исход, предполагающий сотрудничество и более высокую цену в размере 26 долларов за блюдо.

Рис. 10.2. Дилемма заключенных в контексте игры в ценообразование (в сотнях долларов в месяц)

Для начала предположим, что два ресторана сотрудничают друг с другом, установив более высокую цену 26 долларов. Если один из них (скажем, Xavier’s) отклонится от данной стратегии ценообразования, он увеличит месячную прибыль с 324 до 360 (с 32 400 до 36 000 долларов). Однако это означает обман, поэтому у ресторана Yvonne’s (конкурент Xavier’s) не будет причин для дальнейшего сотрудничества. Как только договоренности будут нарушены, прибыль Xavier’s составит 288 (28 800 долларов) в месяц, а не 324 (32 400 долларов), которые он мог бы иметь, если бы держал слово. Получив за один месяц на 36 (3600 долларов) больше благодаря обману, ресторан Xavier’s с этого момента начинает терять по 36 (3600 долларов) ежемесячно, разрушив сотрудничество с конкурентом. Даже если эти рестораны поддерживают отношения всего на протяжении трех месяцев, обман все равно не отвечает интересам Xavier’s. Аналогичные аргументы актуальны и для ресторана Yvonne’s. Таким образом, если бы они конкурировали друг с другом хотя бы три месяца, по всей вероятности, мы наблюдали бы их согласованные действия и высокие цены, а не обман и низкие цены, что прогнозирует теория в случае однократной игры.

А. Конечное повторение

На самом деле решение данной дилеммы не такое простое, как кажется. Что если взаимодействие между игроками длится ровно три месяца? Тогда стратегически мыслящие владельцы ресторанов захотят проанализировать полную трехмесячную игру и выбрать оптимальную стратегию ценообразования. С помощью анализа методом обратных рассуждений каждый из них определит, какую цену следует назначать в каждом месяце. Начав анализ с третьего месяца, они бы поняли, что на этом этапе нет будущего взаимодействия, требующего рассмотрения. И каждый ресторан пришел бы к выводу, что его доминирующая стратегия — «отказ от сотрудничества». Исходя из этого, в течение второго месяца фактически также отсутствует взаимодействие, требующее анализа, а значит, и здесь в качестве доминирующей выступает стратегия «отказ от сотрудничества». Та же аргументация применима и к первому месяцу. Поскольку оба ресторана выбирают стратегию «отказ от сотрудничества» во втором и третьем месяце, сотрудничество теряет для них ценность и в первый месяц. Иными словами, оба игрока изначально выбирают стратегию «отказ от сотрудничества», а это означает, что дилемма по-прежнему не решена.

Этот результат носит общий характер. Если отношения между участниками игры «дилемма заключенных» длятся фиксированный и известный промежуток времени, равновесие в доминирующих стратегиях «отказ от сотрудничества» должно преобладать на последнем этапе игры. Когда игроки приближаются к ее концу, взаимодействие теряет для них ценность, поэтому они и отказываются от него. Тогда анализ методом обратных рассуждений предсказывает такой отказ на протяжении всего пути игры, вплоть до ее начала. Тем не менее на практике участники конечно повторяющихся игр категории «дилемма заключенных» демонстрируют склонность к сотрудничеству, но мы поговорим об этом более подробно чуть позже.

Б. Бесконечное повторение

Анализ конечно повторяющейся дилеммы заключенных показывает, что даже повторение игры не может гарантировать игрокам решения их дилеммы. Но что произойдет, если взаимодействие между участниками игры не будет иметь заранее оговоренной продолжительности? Что если рестораны планируют конкурировать друг с другом в течение неопределенного времени? Тогда наш анализ должен учитывать этот новый аспект их взаимодействия и мы увидим, что стимулы игроков также изменятся.

В повторяющихся играх любого типа последовательный характер отношений между игроками означает, что они могут выбирать стратегии в зависимости от поведения в предыдущих раундах игры. Такие стратегии известны как условные стратегии, а ряд их конкретных примеров часто используется в теории повторяющихся игр. Большинство условных стратегий относятся к категории триггерных стратегий. Игрок, применяющий триггерную стратегию, поддерживает сотрудничество до тех пор, пока соперник (соперники) тоже это делает, но любой обман со стороны последнего «запускает» период наказания определенной продолжительности, на протяжении которого этот игрок отказывается от сотрудничества в ответ. Две наиболее известные триггерные стратегии — это стратегия бесповоротного наказания и стратегия равноценных ответных действий. Первая подразумевает взаимодействие с соперником вплоть до его отказа от него; как только соперник хотя бы раз выберет «отказ от сотрудничества», вы наказываете его, применяя стратегию «отказ от сотрудничества» в каждом очередном раунде игры до ее завершения. Вторая, или стратегия «око за око», — не столь безжалостна и известна (или печально известна) своей способностью решать дилемму заключенных без необходимости применения бессрочного наказания. Стратегия «око за око» сводится к следующему: игрок выбирает сотрудничество в первом раунде игры, а затем в каждом очередном раунде выбирает действия, выбранные соперником в предыдущем раунде. Таким образом, в случае применения стратегии равноценных ответных действий вы взаимодействуете с соперником, если он тоже выбрал сотрудничество в предыдущем раунде игры, и отказываетесь от него (в качестве наказания), если соперник отказался. Вы вернетесь к сотрудничеству после того, как ваш соперник выберет его в предыдущем раунде игры.

Давайте посмотрим, как бы протекала повторяющаяся игра в ценообразование в ресторанах, если бы один из игроков использовал условную стратегию равноценных ответных действий. Мы уже видели, что если ресторан Xavier’s Tapas откажется от сотрудничества на протяжении одного месяца, это может увеличить его прибыль на 36 (то есть он получит выигрыш 360 вместо 324). Но если конкурент выберет стратегию «око за око», такой отказ приведет к тому, что в следующем месяце ресторан Yvonne’s Bistro накажет Xavier’s Tapas в качестве ответной меры. При этом у Xavier’s есть два варианта выбора. Первый — отказаться от сотрудничества, назначив цену 20 долларов, и подвергнуться наказанию со стороны ресторана Yvonne’s согласно стратегии «око за око»; в этом случае ресторан Xavier’s будет терять 36 (то есть его выигрыш составит 288 вместо 324) ежемесячно в обозримом будущем. Такой сценарий развития событий кажется весьма затратным. Но Xavier’s Tapas мог бы при желании восстановить сотрудничество. Вернувшись к кооперативной цене 26 долларов через месяц, ресторан Xavier’s подвергся бы наказанию со стороны ресторана Yvonne’s всего в течение одного месяца и понес бы за это время убытки в размере 108 (выигрыш 216 вместо 324, если бы не отказывался от сотрудничества). А на следующий месяц оба ресторана вернулись бы к кооперативной цене, которая приносила бы им ежемесячную прибыль 324. Такой одноразовый отказ от сотрудничества обеспечивает дополнительную прибыль в размере 36, но влечет за собой дополнительный убыток 108 на протяжении периода наказания. Очевидно, что это также весьма затратный вариант для ресторана Xavier’s Tapas.

Однако здесь важно понимать, что вследствие отказа от сотрудничества ресторан Xavier’s получает дополнительных 36 долларов на протяжении первого месяца, тогда как его убытки переносятся на будущее. Следовательно, относительная важность прибыли и убытков зависит от относительной важности настоящего по отношению к будущему. Поскольку в данном примере выигрыши исчисляются в долларах, можно выполнить объективное сравнение. Как правило, деньги (или прибыль), заработанные сегодня, лучше денег, заработанных завтра, потому что, если они вам какое-то время не понадобятся или у вас не будет желания их тратить, вы можете инвестировать их сейчас и получать на них доход до тех пор, пока они вам не понадобятся. В связи с этим Xavier’s Tapas должен определить, стоит ли отказываться от сотрудничества с конкурентом, воспользовавшись общей рентабельностью этой инвестиции (рассчитанной с учетом дохода от прироста капитала и (или) дивидендов и (или) процентов, в зависимости от типа инвестирования). Обозначим данный показатель доходности инвестиций символом r. Таким образом, один инвестированный доллар приносит r долларов в виде процентов и (или) дивидендов и (или) дохода от прироста капитала, или 100 долларов приносят 100r; поэтому иногда говорят, что норма прибыли составляет 100r процентов.

Обратите внимание, что мы можем определить, заинтересован ли ресторан Xavier’s в отказе от сотрудничества, благодаря тому, что его выигрыши выражены в денежных единицах, а не в обычных показателях степени важности исходов, как в некоторых играх, представленных в предыдущих главах книги (например, в главах 3–6). Это означает, что значения выигрышей в разных ячейках непосредственно сопоставимы: в данном примере выигрыш 4 (доллара) в два раза лучше выигрыша 2 (доллара), тогда как выигрыш 4 не всегда ровно в два раза лучше выигрыша 2 в любой игре два на два, в которой четыре возможных исхода имеют рейтинг от 1 (самый плохой исход) до 4 (самый лучший исход). Выигрыши участников игры, исчисляемые в единицах, поддающихся количественной оценке, позволяют определить, выбирать ли стратегию отказа от сотрудничества в дилемме заключенных.

I. Стоит ли один раз отказываться от сотрудничества в игре против соперника, выбирающего стратегию равноценных ответных действий? Один из вариантов выбора, имеющихся в распоряжении ресторана Xavier’s в повторяющейся игре против конкурента, использующего стратегию «око за око», — всего раз отказаться от кооперативного исхода, а затем вернуться к сотрудничеству. Это принесет ресторану прибыль 36 в первый месяц (при отказе от сотрудничества), но приведет к убыткам 108 во втором. На третий месяц сотрудничество возобновляется. Стоит ли отказываться от него всего на один месяц?

Мы не можем непосредственно сравнить прибыль 36 за первый месяц с убытком 108 за второй, поскольку в расчет необходимо включить дополнительную денежную стоимость времени. Иными словами, нам нужен способ, позволяющий определить, какую стоимость на протяжении первого месяца имеют 108 долларов убытка за второй месяц. Тогда мы сможем сопоставить полученное число с прибылью 36, чтобы решить, стоит ли отказываться от сотрудничества на один месяц. Величина, которую мы ищем, — это приведенная стоимость 108, или сумма прибыли, заработанной в текущем месяце (в настоящем), эквивалентная (имеющая такую же стоимость) 108, заработанным в следующем месяце. То есть нам необходимо вычислить, какая сумма, заработанная в текущем месяце, вместе с процентами составила бы 108 в следующем месяце. Мы называем это число приведенной стоимостью 108 (present value, PV).

Учитывая, что общая норма прибыли (за месяц) равна r, получение PV в этом месяце и инвестирование этой суммы до следующего месяца дает PV + rPV, где первый член — это основная сумма, возвращаемая инвестору, а второй — доход (в виде процентов, дивидендов или прироста капитала). Если общая сумма 108, тогда значение PV равно текущей стоимости 108. Равенство PV + rPV = 108 позволяет вычислить значение PV

Теперь при любом значении r мы можем определить точную сумму в долларах, которая, будучи заработанной в текущем месяце, будет иметь стоимость 108 в следующем месяце.

С точки зрения Xavier’s Tapas, вопрос о том, компенсирует ли прибыль 36 за текущий месяц убыток 108 в следующем месяце, остается открытым. Ответ зависит от значения PV. Ресторан Xavier’s должен сравнить прибыль 36 с приведенной стоимостью убытка 108. Отказаться от сотрудничества с конкурентом один раз (а затем возобновить его) целесообразно только если 36 > 108/(1 + r). Это равносильно утверждению о том, что однократный отказ от сотрудничества приносит пользу лишь в случае, если 36(1 + r) > 108, что позволяет сократить это выражение до r > 2. Стало быть, ресторан Xavier’s должен выбирать стратегию однократного отказа от сотрудничества в игре против конкурента, применяющего стратегию «око за око», только если общая норма прибыли за месяц больше 200 %. Такой исход весьма маловероятен; например, учетная ставка редко превышает 12 %. Это означает, что месячная процентная ставка составляет менее 1 % (и капитализируется один раз в год, а не ежемесячно), а это существенно меньше вычисленных нами 200 %. Таким образом, ресторану Xavier’s лучше продолжать сотрудничество с конкурентом, чем пытаться один раз отказаться от него из-за выбора рестораном Yvonne’s стратегии «око за око».

II. Стоит ли полностью отказываться от сотрудничества в игре против соперника, выбирающего стратегию равноценных ответных действий? А как насчет того, чтобы отказаться от сотрудничества раз и в дальнейшем продолжать делать это всегда? Этот вариант выбора сперва обеспечит ресторану Xavier’s прибыль 36, а затем ежемесячно начнет приносить убыток 36, если конкурент применит стратегию «око за око». Для того чтобы определить, отвечает ли такая стратегия интересам ресторана Xavier’s, снова необходимо вычислить приведенную стоимость понесенных убытков. Однако на этот раз они будут понесены за бесконечный интервал предстоящих месяцев конкуренции.

Бессрочный отказ ресторана Xavier’s от сотрудничества в игре с конкурентом, использующим стратегию «око за око», обеспечивает последовательность выигрышей (прибыли), эквивалентную тому, что получил бы этот ресторан при отказе сотрудничать в игре против конкурента, применившего триггерную стратегию бесповоротного наказания. А она требует, чтобы игроки наказывали любой отказ от сотрудничества ответным отказом на протяжении всех будущих периодов. В таком случае ресторану Xavier’s не стоит даже пытаться возобновлять взаимодействие после первого отказа, поскольку с этого момента конкурент неизменно будет выбирать отказ от сотрудничества в качестве наказания. Любой отказ от сотрудничества со стороны ресторана Xavier’s в этом случае приведет к получению им прибыли 36 за первый месяц и последующей ежемесячной потере 36 — точно такой же исход, как и при бессрочном отказе от сотрудничества в игре против конкурента, использующего стратегию равноценных ответных действий. Следовательно, представленный ниже анализ также позволяет выяснить, целесообразно ли вообще применять стратегию отказа от сотрудничества в игре против соперника, использующего стратегию строгого наказания.

Для того чтобы это определить, необходимо вычислить приведенную стоимость всех убытков 36, понесенных в предстоящие месяцы, суммировать эти значения и сопоставить полученную сумму с прибылью 36 за первый месяц отказа от сотрудничества. Приведенная стоимость убытка 36, понесенного за первый месяц наказания и продолжающегося отказа ресторана Xavier’s сотрудничать, равна 36 / (1 + r); расчеты идентичны используемым в для вычисления того, что приведенная стоимость 108 равна 108/(1 + r). В следующем месяце значение PV должно представлять собой такую сумму в долларах за текущий месяц, которая вместе со сложными процентами за два месяца составила бы 36 через два месяца. Если PV инвестировать сейчас, то через месяц инвестор получит эту основную сумму плюс прибыль rPV, то есть в сумме PV + rPV, как и ранее. Если оставить эту общую сумму инвестированной на второй месяц, к концу двух месяцев инвестор получит инвестированную сумму в начале второго месяца (PV + rPV) плюс прибыль на эту сумму в размере r(PV + rPV). Значение PV убытка 36, понесенного через два месяца начиная с текущего момента, должно удовлетворять уравнению PV + rPV + r(PV + rPV) = 36. Из этой формулы мы можем вывести значение PV: PV(1 + r)2 = 36, или PV = 36/(1 + r)2. По всей вероятности, вы уже увидели закономерность. Значение PV убытка 36, понесенного за третий месяц бессрочного отказа от сотрудничества, составляет 36/(1 + r)3, а за четвертый — 36/(1 + r)4. В действительности значение PV убытка 36, понесенного за энный месяц бессрочного отказа от сотрудничества, составляет 36/(1 + r)n . Ресторан Xavier’s несет бесконечную сумму убытков 36, причем приведенная стоимость каждого такого убытка с каждым месяцем уменьшается.

Точнее говоря, при значениях n от n = 1 до n = ∞ (где n — месяцы бессрочного отказа от сотрудничества начиная с первого месяца, то есть месяца с номером 0) ресторан Xavier’s терпит убытки 36/(1 + r)n . В математическом виде это можно записать как сумму бесконечного количества членов

Поскольку r — это норма прибыли, которая должна быть положительным числом, множитель 1/(1 + r) будет меньше 1. Как правило, его называют коэффициентом дисконтирования и обозначают греческой буквой δ. Математическое правило вычисления бесконечных сумм при δ = 1/(1+r)<1 гласит, что эта сумма сводится к конкретному значению, в данном случае к 36/r.

Теперь мы можем определить, решит ли Xavier’s Tapas навсегда отказаться от сотрудничества с конкурентом. Ресторан сравнит прибыль 36 с приведенной стоимостью всех убытков 36, то есть 36/r, и в итоге навсегда откажется от сотрудничества, только если 36 > 36/r, или r > 1. Иными словами, в данной игре отказ от сотрудничества принесет выгоду тогда, когда месячная норма прибыли превысит 100 %, что маловероятно. Следовательно, не стоит ожидать от ресторана Xavier’s отказа от взаимодействия в игре с сотрудничающим конкурентом, если оба используют стратегию «око за око». (То же самое касается ситуации, в которой оба разыгрывают стратегию бесповоротного наказания.) Когда оба ресторана применяют стратегию «око за око», кооперативный исход, при котором они устанавливают высокую цену, — и есть равновесие Нэша в этой игре. Выбор обоими игроками стратегии равноценных ответных действий создает равновесие Нэша, а значит, использование этой условной стратегии решает дилемму заключенных в игре между ресторанами.

Не забывайте о том, что стратегия равноценных ответных действий — лишь одна из многочисленных триггерных стратегий, применяемых игроками в повторяющихся дилеммах заключенных. И она одна из самых «мягких». Таким образом, если стратегия «око за око» подходит для решения дилеммы заключенных в игре между двумя ресторанами, значит, и другие, более жесткие стратегии, могут выполнить эту задачу. Как уже говорилось, стратегию бесповоротного наказания также можно использовать для поддержания сотрудничества как в этой бесконечно повторяющейся игре, так и в других играх.

В. Игры с неизвестной продолжительностью

В дополнение к анализу игр с конечной и бесконечной продолжительностью хотим предложить более сложный инструмент для решения игр с неизвестной продолжительностью. В некоторых повторяющихся играх участники могут не знать наверняка, сколько именно между ними будет длиться взаимодействие, но иметь определенное представление о вероятности того, что игра продлится еще один период. Например, наши рестораны могут считать, что их повторяющееся сотрудничество будет продолжаться только до тех пор, пока клиенты будут отдавать предпочтение комплексным обедам, но если в течение каждого месяца появляется вероятность того, что клиенты начнут выбирать блюда по меню, характер игры изменится.

Напоминаем, что приведенная стоимость убытка за следующий месяц уже равна произведению δ = 1/(1 + r) на заработанную сумму. Если в дополнение к этому существует только вероятность p (меньше 1) того, что игроки будут сотрудничать и в следующем месяце, то убыток за следующий месяц составит всего лишь произведение p на δ Для ресторана Xavier’s Tapas это означает, что PV убытка 36, понесенного при условии бессрочного отказа от сотрудничества, равно 36 × δ [то же, что и 36 / (1 + r)], когда предполагается, что игра точно продолжится, и всего 36 × p × δ, когда игра продолжится с вероятностью p. Включение в расчеты вероятности того, что игра может закончиться в следующем периоде, означает, что приведенная стоимость убытка 36 меньше (поскольку p < 1), чем в случае, когда игра точно будет продолжаться (то есть когда p предположительно равно 1).

Благодаря включению в расчеты вероятности p мы теперь дисконтируем будущие выигрыши на коэффициент p × δ, а не δ. Мы называем эту величину фактическим коэффициентом дисконтирования R, где 1/(1 + R) = p × δ; при этом между R и p и δ существует следующая зависимость:

Если фактическая норма прибыли на инвестиции составляет 5 % (r = 0,05, а значит, δ = 1/1,05 = 0,95), а вероятность того, что игра продолжится в следующем месяце, равна 50 % (p = 0,5), тогда R = [1 — (0,5)(0,95)] / [(0,5)(0,95)] = 1,1, или 110 %.

В этих примерах высокая норма прибыли, необходимая для расторжения сотрудничества, покажется более реалистичной, если назвать ее эффективной, а не фактической нормой прибыли. Теперь становится понятно, что бессрочный или даже однократный отказ от сотрудничества действительно может принести игроку выгоду при наличии достаточно большой вероятности того, что игра закончится в ближайшем будущем. Рассмотрим в качестве примера решение ресторана Xavier’s по поводу того, стоит ли навсегда отказываться от сотрудничества с конкурентом, использующим стратегию «око за око». Предыдущие расчеты показали, что бессрочный отказ от сотрудничества выгоден только тогда, когда r больше 1, или 100 %. Если фактическая норма прибыли ресторана Xavier’s составит 5 %, а вероятность того, что игра продолжится в следующем месяце, равна 50 %, как мы предположили выше, то норма прибыли в размере 110 % превышает критическое значение, необходимое для продолжения отказа от сотрудничества. Таким образом, кооперативное поведение, поддерживаемое стратегией «око за око», может оказаться под вопросом, если имеется довольно большая вероятность того, что повторяющаяся игра может закончиться к концу следующего раунда, а именно к моменту получения достаточно малого значения p.

Г. Общая теория

Мы можем без труда обобщить идеи в отношении целесообразности отказа от сотрудничества с соперниками, использующими стратегию «око за око», с тем чтобы вы могли применять их в любой дилемме заключенных. Для этого мы используем таблицу (рис. 10.3) с общими выигрышами (выраженными в надлежащих единицах), которые соответствуют стандартной структуре выигрышей в дилемме заключенных. Эти выигрыши должны удовлетворять условию B > K > О > H, где К — кооперативный исход; О — отказ обоих игроков от сотрудничества; В — высокий выигрыш, получаемый игроком, отказавшимся от сотрудничества, в случае если другой игрок продолжает сотрудничать; и Н — низкий выигрыш, получаемый проигравшим (игрок, продолжающий сотрудничать) в той же ситуации.

Рис. 10.3. Общая версия дилеммы заключенных

В этой общей версии дилеммы заключенных разовая прибыль игрока, полученная за счет отказа от сотрудничества, составляет (B — K). Убыток за один период, понесенный в связи с наказанием, когда вы возобновляете сотрудничество, равен (K — H), а убыток за каждый очередной период в случае бессрочного отказа от сотрудничества составляет (K — О). Для того чтобы максимально обобщить расчеты, примем во внимание ситуации, в которых существует вероятность p < 1 того, что игра продолжится и после окончания следующего периода; таким образом мы дисконтируем выигрыши с помощью фактической нормы прибыли R за каждый период. Если p = 1 (как в случае гарантированного продолжения игры), то R = r, простая процентная ставка, используемая нами в предыдущих вычислениях. Заменив r на R, мы увидим, что полученные ранее результаты обобщаются буквально сразу же.

Мы уже пришли к выводу, что игрок отказывается от сотрудничества ровно один раз в игре против соперника, использующего стратегию равноценных ответных действий, если разовая прибыль (B — K), полученная в результате, превышает приведенную стоимость убытка за один период, понесенного в связи с наказанием (приведенная стоимость K — H). В общей игре это означает, что игрок один раз отказывается от сотрудничества с соперником, применяющим стратегию равноценных ответных действий, только когда (B — K) > (K — H) / (1 + R), или (1 + R)(B — K) > K — H, или

Аналогичным образом мы выявили, что игрок навсегда отказывается от сотрудничества с соперником, использующим стратегию «око за око», только если полученная в результате разовая прибыль превышает приведенную стоимость бесконечной суммы убытков за отдельные периоды, понесенных в связи с бессрочным отказом от сотрудничества (где убыток за период составляет K — О). В общей версии игры игрок навсегда отказывается от сотрудничества с соперником, использующим стратегию «око за око» или стратегию бесповоротного наказания, только если (B — K) > (K — О) / R или

Как следует из этих двух формул, существует три важных аспекта принятия игроком решения об отказе от сотрудничества: непосредственная прибыль от такого отказа (B — K); будущие убытки, понесенные в связи с наказанием (K — H или K — О за период наказания), и значение фактической нормы прибыли (R, которая отражает важность настоящего по сравнению с будущим). При каких условиях по этим трем значениям игроки заинтересованы в отказе от сотрудничества?

Во-первых, предположим, что значения прибыли и убытков, связанных с отказом от сотрудничества, фиксированы. От изменения значения R зависит, откажется ли игрок от сотрудничества, причем чем больше значение R, тем выше вероятность отказа. Большие значения R связаны с малыми значениями p и δ (а также более высокими значениями r), поэтому вероятность отказа сотрудничать повышается при наличии незначительной перспективы продолжения или низкого коэффициента дисконтирования (или высокой процентной ставки). Об этом можно еще сказать так: отказ от сотрудничества более вероятен, когда настоящее важнее будущего или когда будущего не так много, чтобы его можно было принимать в расчет. Иными словами, отказ от сотрудничества более вероятен, если игроки нетерпеливы или считают, что игра быстро закончится.

Во-вторых, проанализируем ситуацию, когда фактическая норма прибыли будет фиксированной, как в случае прибыли за один период, полученной за счет отказа от сотрудничества. В такой ситуации целесообразность отказа от сотрудничества зависит от изменения величины убытков за каждый период, понесенных в связи с наказанием. Здесь именно меньшие значения К — Н или К — Н стимулируют отказ от сотрудничества, то есть он более вероятен, когда наказание не слишком суровое.

И наконец, допустим, что фактическая норма прибыли и убытки за каждый период, понесенные в связи с наказанием, — постоянные величины. Теперь игроки, скорее всего, откажутся от сотрудничества при высоком значении прибыли B — K. Эта ситуация более вероятна, когда отказ от сотрудничества обеспечивает игроку явные преимущества в ближайшем будущем.

Данный анализ также подчеркивает важность обнаружения случаев прекращения взаимодействия. Принятие решений о его продолжении зависит от того, как долго такой отказ не будет обнаружен, насколько точно он будет выявлен и сколько может длиться наказание, прежде чем будет предпринята попытка возобновить сотрудничество. Наша модель не учитывает всех этих факторов в явной форме, но позволяет сделать следующий вывод: если отказ от сотрудничества поддается быстрому и точному обнаружению, его преимущества не будут иметь долгосрочного эффекта, но впоследствии придется понести определенные издержки. Таким образом, эффективность любой триггерной стратегии в решении повторяющейся дилеммы заключенных зависит от того, насколько филигранно (как в плане оперативности, так и точности) игроки смогут обнаружить отказ от сотрудничества. Это одна из причин, почему стратегию равноценных ответных действий часто считают опасной: малейшая ошибка в выполнении действий или в их восприятии способна повлечь за собой бесконечный цикл наказания, вырваться из которого не удастся до тех пор, пока не будет совершена хотя бы малейшая ошибка противоположного типа.

Вы можете использовать все эти идеи для того, чтобы определить, когда ожидать более тесного сотрудничества между соперниками, а когда отказа от него, а то и более жестких действий. Например, в плохие времена, когда целая отрасль оказывается на грани краха и компании чувствуют, что у них нет будущего, конкурентная борьба может существенно ожесточиться (реже может наблюдаться кооперативное поведение). Даже когда временно наступает хороший период, но никто не рассчитывает на его длительность, компании могут воспользоваться этим, чтобы заработать быструю прибыль, поэтому кооперативное поведение может снова игнорироваться. Точно так же в отрасли, сформировавшейся под влиянием моды, крах которой неминуем, когда мода изменится, проявляется меньше склонности к сотрудничеству. Так, конкретный морской курорт может стать любимым местом отдыха туристов, но все местные отели должны знать, что такая ситуация вряд ли продлится вечно, поэтому они не могут себе позволить сговор по поводу ценообразования. С другой стороны, когда меняется мода на продукты, выпускаемые неизменной группой компаний, поддерживающих долгосрочные отношения, партнерство сохраняется. Например, даже если всех детей будут интересовать плюшевые мишки в течение одного года и боты-спасатели из «Трансформеров» в течение следующего года, сговор относительно ценообразования может иметь место только в случае, если одна и та же небольшая группа производителей выпускает оба продукта.

В мы более подробно проанализируем дилемму заключенных, возникающую в играх со многими участниками, и исследуем, когда и как игроки могут преодолеть эту дилемму и обеспечить более благоприятный для всех игроков исход.

 

3. Категория решений II: взыскание и вознаграждение

Хотя повторение — основной инструмент решения дилеммы заключенных, существует еще ряд инструментов, которые можно использовать для достижения этой цели. Один из самых простых способов предотвратить дилемму заключенных в однократной версии игры — наложить на игроков прямое взыскание в случае отказа от сотрудничества. Когда в выигрыши вносятся изменения с учетом издержек, понесенных в связи с наложением взыскания, игроки могут обнаружить, что дилемма уже решена.

Рассмотрим дилемму заключенных в игре с участием мужа и жены, о которой шла речь в . Если один игрок применит стратегию «отказ от сотрудничества», исход игры будет таким: 1 год тюрьмы для этого игрока и 25 лет тюрьмы для игрока, выбравшего стратегию «сотрудничество». Однако после окончания столь малого срока заключения игрока, который отказался от сотрудничества, у ворот тюрьмы могут ждать друзья другого игрока. Физический вред, причиненный ему этими друзьями, может быть эквивалентен дополнительным 20 годам лишения свободы. Если это действительно так и игроки учитывают вероятность подобного сценария, то структура выигрышей в исходной игре изменится.

Новая игра, в которой выигрыши рассчитаны с учетом физической расправы, представлена на рис. 10.4. Когда к приговору каждого игрока прибавляются еще 20 лет тюремного заключения, если один игрок сознаётся, а другой все отрицает, игра выглядит совсем по-другому.

Рис. 10.4. Дилемма заключенных с наложением взыскания в случае, если один игрок выберет стратегию «отказ от сотрудничества»

Поиск доминирующих стратегий на рисунке показывает, что их нет. Дальнейшее сравнение ячеек позволяет определить, что в игре появились два равновесия Нэша в чистых стратегиях. Одно — исход «признать вину» / «признать вину», другое — исход «отрицать вину» / «отрицать вину». Теперь каждый игрок понимает, что он заинтересован в сотрудничестве, если другой игрок тоже будет это делать. Игра изменилась: она перестала быть дилеммой заключенных и превратилась в игру в доверие, рассмотренную в . Решение новой игры требует выбора одного из двух существующих равновесий. Очевидно, что одно из них (кооперативный исход) лучше другого с точки зрения обоих игроков. Следовательно, если в игре достижима определенная сходимость ожиданий, это равновесие можно использовать в качестве фокальной точки.

Обратите внимание, что в этом сценарии взыскание налагается на игрока, отказавшегося сотрудничать, только тогда, когда его соперник не отказывается это делать. Однако в дилемме заключенных можно использовать более строгое взыскание, например взыскание за любое признание. Как правило, такие дисциплинарные меры должна принимать третья сторона, имеющая определенную власть над двумя игроками, а не друзья другого игрока, поскольку у них не будет полномочий наказывать первого игрока, если второй также откажется сотрудничать. Если оба заключенных — члены той или иной организации (например, банды или мафиозной группировки) и в ней действует правило, согласно которому ее члены ни при каких обстоятельствах не должны ни в чем сознаваться полиции, иначе их ждет жестокая физическая расправа, то игра снова меняется и превращается в игру, представленную на рис. 10.5.

Рис. 10.5. Дилемма заключенных с наложением взыскания в случае любого отказа от сотрудничества

Теперь выигрыш, эквивалентный дополнительным 20 годам тюремного заключения, прибавляется ко всем выигрышам, связанным со стратегией «признать вину» (сравните рис. 10.5 и ). В новой игре, как и в исходной, у каждого игрока есть доминирующая стратегия. Но разница в том, что изменение выигрышей делает стратегию «отрицать вину» доминирующей для каждого игрока. А исход «отрицать вину» / «отрицать вину» становится единственным равновесием Нэша в чистых стратегиях. Более строгая схема наложения взыскания, выполнение которой обеспечивает третья сторона, делает отказ от сотрудничества настолько невыгодным для игроков, что кооперативный исход становится в этой игре новым равновесием.

В более крупных играх категории «дилемма заключенных» возникают трудности с применением взысканий. В частности, схемы их наложения сложнее поддерживать, если в игре участвует много игроков и присутствует некоторая неопределенность. В таких играх труднее установить, действительно ли мы имеем дело с отказом от сотрудничества или это просто невезение или ошибочный ход. Кроме того, если кто-то из игроков на самом деле отказался сотрудничать, зачастую его бывает трудно вычислить среди других игроков. А в однократной игре отсутствует возможность в будущем скорректировать взыскание, если оно оказалось слишком строгим, или наложить взыскание, когда игрок, отказавшийся сотрудничать, все же был выявлен. Таким образом, в крупных однократных играх взыскание может быть менее эффективным, чем в игре с двум участниками, которую мы здесь анализируем. В мы более подробно рассмотрим различные примеры дилеммы заключенных с большим количеством игроков.

Еще одна интересная возможность возникает в случае, когда решенная с помощью схемы наложения взыскания дилемма заключенных рассматривается в контексте более крупного сообщества, в котором проходит эта игра. Может сложиться ситуация, когда равновесный исход дилеммы заключенных неблагоприятен для ее участников, но приносит пользу обществу в целом или его определенной группе. Поэтому не исключено социальное или политическое давление, направленное на минимизацию шансов игроков преодолеть дилемму. Если в качестве решения дилеммы заключенных выступает взыскание, налагаемое третьей стороной (как в случае мафии, требующей молчать при любых обстоятельствах), общество может разработать свою стратегию снижения его эффективности. Федеральная программа защиты свидетелей — один из примеров системы, созданной именно с этой целью. Правительство США устраняет угрозу расправы в обмен на признания и свидетельские показания в суде.

Аналогичные ситуации встречаются и в других примерах дилеммы заключенных, как, скажем, в игре в ценообразование между двумя ресторанами. Равновесие в ней подразумевало, что оба ресторана назначат низкую цену 20 долларов, хотя они получили бы более высокую прибыль, установив высокую цену 26 долларов. Хотя рестораны хотели бы предотвратить этот «неблагоприятный» исход (а мы уже видели, что использование триггерных стратегий позволяет им это сделать), низкие цены, которые обеспечивает равновесие Нэша в однократной игре, больше радуют их клиентов. Более того, клиенты заинтересованы снизить действенность любого механизма принуждения или процесса решения дилеммы, который могут использовать рестораны. Например, поскольку иногда компании, столкнувшиеся с дилеммой заключенных в контексте игры в ценообразование, пытаются решить ее посредством кампаний «не ищите дешевле» или «гарантия лучшей цены», клиенты могут потребовать принять законы, запрещающие применение подобных методов. Мы проанализируем последствия таких стратегий компенсации разницы в цене в .

Дилемму заключенных можно решить не только путем наказания игроков, отказавшихся от сотрудничества, но и посредством вознаграждения игроков, которые его предпочли. Поскольку такое решение трудно реализуемо на практике, мы лишь кратко остановится на нем.

Самый важный вопрос — кто должен выплачивать вознаграждение. Если третья сторона (один человек или группа), то ее заинтересованность в сотрудничестве между игроками должна быть достаточной, чтобы оправдать целесообразность такой выплаты. Один из редких примеров подобной ситуации — посредничество США при заключении Кэмп-Дэвидских соглашений между Израилем и Египтом, когда Штаты пообещали обеим странам солидную помощь.

Если выплачивать друг другу вознаграждение должны сами игроки, то его необходимо сделать условным (выплачивается только в случае сотрудничества другого игрока) и достоверным (гарантированно выплачивается в случае сотрудничества другого игрока). Для удовлетворения этим критериям следует заключить особое соглашение. Например, игрок, дающий обещание, должен заранее внести определенную сумму на счет условного депонирования, принадлежащий порядочному и нейтральному третьему лицу, которое передаст ее другому игроку, если тот выберет сотрудничество, или вернет первому игроку, если второй откажется взаимодействовать. В показано, как действуют такие договоренности.

 

4. Категория решений III: лидерство

Третий метод решения дилеммы заключенных относится к ситуациям, в которых один игрок берет на себя роль лидера во взаимодействии. В большинстве примеров дилеммы заключенных эта игра считается симметричной. Иными словами, все игроки теряют или получают одну и ту же сумму при отказе от сотрудничества и при согласии сотрудничать. Однако в реальных стратегических ситуациях один игрок может быть относительно «крупным» (лидером), а другой — «мелким». Если размер выигрышей неравноценен, отказ от сотрудничества способен нанести более крупному игроку такой вред, что он может пойти на сотрудничество, даже зная, что другой игрок может отказаться от него. Например, Саудовская Аравия много лет играла в ОПЕК (Организации стран — экспортеров нефти) роль «стабилизирующего производителя»: для поддержания высокой цены на нефть она сокращала ее добычу, в то время как один из более мелких производителей (таких как Ливия) увеличивал.

Как в примере с ОПЕК, лидерство чаще наблюдается в играх между странами, чем между компаниями или отдельными людьми. Именно поэтому в качестве примера игры, в которой лидерство можно использовать для решения дилеммы заключенных, мы выбрали игру между странами. Представьте, что населению двух стран, Дорминики и Софории, угрожает болезнь под названием SANE (Sudden Acute Narcoleptic Episodes — «внезапные резкие приступы нарколепсии»). Заболевание поражает одного человека из 2000, или 0,05 % от общей численности населения, и приводит к тому, что жертва впадает в состояние глубокого сна на целый год. У болезни нет осложнений, но издержки, связанные с выпадением работника из экономической жизни страны на год, составляют 32 000 долларов. В каждой стране по 100 миллионов трудоспособного населения, поэтому ожидаемое количество случаев заболевания в каждой составляет 50 000 (0,0005 × 100 000 000), а ожидаемые издержки в связи с распространением болезни равны 1,6 миллиарда долларов (50 000 × 32 000). Общий ожидаемый уровень издержек в связи с болезнью во всем мире (то есть в Дорминике и Софории) составляет при этом 3,2 миллиарда долларов.

Ученые убеждены, что интенсивная программа исследований стоимостью 2 миллиарда долларов позволит найти стопроцентно эффективную вакцину. Сравнение стоимости этой исследовательской программы с уровнем издержек в связи с распространением болезни во всем мире показывает, что, с точки зрения населения в целом, программу следует реализовать. Однако правительство каждой страны должно рассмотреть вопрос о том, стоит ли ему в одиночку финансировать всю исследовательскую программу. Правительства двух стран принимают решения независимо друг от друга, но от этих решений зависит исход игры для обеих стран. В частности, если правительство одной страны берется финансировать весь проект, население другой страны сможет получить доступ к информации и найдет вакцину без всяких затрат. Тем не менее выигрыш каждого правительства зависит только от издержек, понесенных населением его страны.

Матрица этой некооперативной игры представлена на рис. 10.6. Каждая страна выбирает из двух стратегий: «провести исследования» и «не проводить исследований»; выигрыши отображают выраженные в миллиардах долларов издержки двух стран в случае различных комбинаций стратегий. Несложно определить, что эта игра представляет собой дилемму заключенных и что «не проводить исследования» — доминирующая стратегия каждой страны.

Рис. 10.6. Выигрыши в игре «исследования по преодолению болезни SANE» между двумя странами с одинаковой численностью трудоспособного населения (выигрыши выражены в миллиардах долларов)

А теперь предположим, что в этих странах неодинаковая численность трудоспособного населения — 150 миллионов в Дорминике и 50 миллионов в Софории. В таком случае, если ни одно правительство не станет финансировать исследования, издержки Дорминики в связи с распространением SANE составят 2,4 миллиарда долларов (0,0005 × 150 000 000 × 32 000), а Софории — 0,8 миллиарда долларов (0,0005 × 50 000 000 × 32 000). Измененная матрица игры представлена на рис. 10.7.

Рис. 10.7. Выигрыши в игре «исследования по преодолению болезни SANE» между двумя странами с неодинаковой численностью трудоспособного населения (выигрыши выражены в миллиардах долларов)

В этой версии игры «не проводить исследований» по-прежнему доминирующая стратегия Софории. Однако теперь наилучший ответ Дорминики — «провести исследования». Что привело ее к изменению выбора стратегии? Очевидно, что ответ кроется в неравномерном распределении населения в измененной версии игры. Теперь на долю Дорминики может выпасть настолько большая часть общих издержек в связи с распространением болезни, что страна посчитает целесообразным самостоятельно провести необходимые исследования, причем даже в случае, если ей известно, что Софория намерена сыграть роль «безбилетника» и воспользоваться их результатами.

Игра в исследования, представленная на , — уже не дилемма заключенных. Здесь мы видим, что дилемма в каком-то смысле уже «решена» асимметричностью масштаба игроков. Более крупная страна предпочитает взять на себя роль лидера и принести пользу всему миру.

Ситуации с лидерством, в которых при иных обстоятельствах могла бы присутствовать дилемма заключенных, часто встречаются в международной дипломатии. Зачастую роль лидера естественным образом достается самым крупным или самым авторитетным игрокам (этот феномен известен как «эксплуатация сильных слабыми»). Например, долгие годы после Второй мировой войны Соединенные Штаты Америки несли на себе непропорционально большую долю расходов в оборонительных союзах, таких как НАТО, а также продвигали идею свободной международной торговли, тогда как партнеры, в частности Япония и Европа, склонялись к более протекционистской политике. Возможно, в подобных ситуациях было бы разумно предположить, что более крупный или авторитетный игрок может взять на себя роль лидера, поскольку его интересы тесно связаны с интересами всей совокупности игроков; если на крупного игрока приходится значительная часть группы, такое переплетение интересов кажется очевидным и от крупного игрока ожидают более кооперативных действий, чем при других обстоятельствах.

 

5. Экспериментальные данные

Многие исследователи проводили эксперименты, участники которых соперничали друг с другом в различных вариантах дилеммы заключенных. Как показывают результаты этих экспериментов, сотрудничество в таких играх возможно и действительно наблюдается, причем даже в повторяющихся играх с известной или конечной продолжительностью. Многие игроки начинают игру с сотрудничества и поддерживают его достаточно долго при условии, что соперник отвечает тем же. Отказ от сотрудничества появляется только в нескольких последних раундах игры. Хотя подобное поведение противоречит логике обратных рассуждений, оно может оказаться выигрышным, если придерживаться его в течение приемлемого срока. Пары участников таких игр получают более высокий выигрыш, чем получили бы рационально мыслящие, расчетливые стратеги посредством отказа от сотрудничества с самого начала игры.

Идея о том, что определенный уровень сотрудничества представляет собой рациональное (то есть равновесное) поведение, имеет теоретическое обоснование. Рассмотрим тот факт, что когда игроков спрашивают, почему они выбрали сотрудничество во время первых раундов игры, они обычно говорят нечто вроде: «Я был готов попробовать и посмотреть, насколько другой игрок благожелателен, а когда это оказывалось действительно так, я продолжал сотрудничать до тех пор, пока не приходило время воспользоваться его доброжелательностью». Безусловно, на самом деле другой игрок мог и не быть так дружественно настроен, но он мог размышлять аналогичным образом. Строгий анализ конечно повторяющейся дилеммы заключенных с подобной разновидностью асимметричной информации показывает, что в этом может заключаться еще одно ее решение. Если существует вероятность того, что участникам игры «дилемма заключенных» свойственна благожелательность, а не эгоизм, даже эгоистичному игроку может быть выгодно имитировать дружелюбие. Это позволит ему какое-то время получать более высокие выигрыши за счет сотрудничества, рассчитывая на то, что к концу последовательности раундов игры он воспользуется преимуществами обмана. Более подробный анализ ситуации, в которой только у одного из игроков есть выбор между дружественным и эгоистичным поведением, содержится в онлайн-приложении к данной главе. Решение соответствующей игры с двумя участниками представлено в оригинальной статье.

Кооперативное поведение в ходе лабораторных экспериментов можно объяснить, и не прибегая к такому типу асимметричности информации. Возможно, игроки не уверены, действительно ли отношения между ними будут разорваны в указанное время. Они могут считать, что их готовность к взаимодействию будет учтена в аналогичных играх против того же или других соперников. Не исключено, что они считают своих соперников наивными и в рамках проверки этой гипотезы готовы понести определенные убытки на протяжении пары раундов игры. В случае успеха этот эксперимент приведет к получению более высоких выигрышей в течение достаточно длительного периода.

В ходе ряда лабораторных экспериментов игроки участвуют в играх, состоящих из нескольких раундов, в каждом из которых выполняется конечное число повторений. Все повторные сеансы одного раунда разыгрываются против одного соперника, а каждый новый раунд — против нового соперника. Таким образом, в каждом раунде у игрока есть возможность наладить сотрудничество с соперником и накопить опыт для разработки стратегии против новых соперников в последующих раундах игры. Подобные ситуации показывают, что сотрудничество в начальных раундах игры длится дольше, чем в заключительных. Этот результат говорит о том, что теоретический вывод о прекращении сотрудничества, построенный на применении анализа методом обратных рассуждений, со временем формируется на основании опыта ведения игры, по мере того как игроки начинают лучше понимать выгоды и издержки своих действий. Еще одно возможное объяснение состоит в том, что игроки просто начинают понимать, что им необходимо первыми отказаться от сотрудничества, поэтому такой момент наступает все раньше по мере увеличения количества сыгранных раундов.

Предположим, вы участвуете в игре, структурированной как дилемма заключенных, и поддерживаете взаимодействие с другим игроком, но приближается известный вам момент его прекращения. Когда вам следует разорвать сотрудничество? Вы не должны делать это слишком рано, когда остается много потенциальных будущих выгод, но и не должны оставлять решение на слишком поздний этап игры, поскольку тогда ваш соперник может вас опередить и поставить перед фактом низкого выигрыша за тот период, когда он сам откажется от сотрудничества. Аналогичные расчеты применимы и в случае, когда вы поддерживаете конечно повторяющееся взаимодействие с неопределенным моментом его прекращения. Ваше решение об отказе от сотрудничества не может быть детерминированным, иначе ваш соперник понял бы это и опередил вас. Если детерминированное решение неосуществимо, то прекращение сотрудничества должно содержать элемент неопределенности (такой как смешанные стратегии) для обоих игроков. Во многих триллерах, сюжет которых основан на шатком сотрудничестве между преступниками или информаторами и полицией, напряженность присутствует именно по причине такой неопределенности.

Примеры прекращения сотрудничества между игроками по мере приближения повторяющейся игры к концу наблюдаются во многих ситуациях как в лабораториях, так и в реальном мире. Велогонки (или состязания в беге) — один из таких примеров. В течение большей части гонки игроки по очереди занимают лидирующую позицию и дают другим спортсменам возможность ехать в зоне пониженного давления. Однако по мере приближения к финишу каждый участник гонок делает стремительный рывок. По этой же причине весной в конце семестра в магазинах университетских городков появляются объявления «чеки не принимаются».

В ходе экспериментов на основе компьютерного моделирования был проанализирован целый диапазон стратегий (от очень простых до очень сложных), используемых игроками друг против друга в дилеммах заключенных с двумя участниками. Самый известный провел Роберт Аксельрод из Мичиганского университета. Он предложил всем желающим написать компьютерные программы, представляющие собой стратегии решения дилеммы заключенных, которая повторяется конечное, но достаточно большое количество раз (а именно 200 раз). Аксельрод получил 14 заявок, после чего организовал групповой турнир, в ходе которого пары программ соревновались друг с другом, в каждом случае выполняя по 200 повторных сеансов игры подряд. Во время турнира подсчитывались очки по всем парам во всех 200 повторных сеансах игры; на основании очков, набранных каждой программой в играх против всех остальных программ, была определена программа, получившая самый высокий результат. Для Аксельрода стало неожиданностью то, что «хорошие» программы показали самые высокие результаты; среди программ, занявших первых восемь мест в рейтинге, не было ни одной, которая бы когда-либо первой отказалась сотрудничать. Победила самая простая стратегия «око за око», представленная канадским специалистом по теории игр Анатолем Рапопортом. Программы, которые стремились к отказу от сотрудничества в любом отдельно взятом сеансе игры, сразу же получали выигрыш, но затем наступал период взаимных отказов и плохих выигрышей. Аксельрод объясняет успех стратегии равноценных ответных действий наличием четырех свойств: прощение, доброжелательность, возмездие и предсказуемость.

По мнению Аксельрода, в повторяющейся дилемме заключенных целесообразно придерживаться четырех простых правил: «Не завидовать. Не отказываться от сотрудничества первым. Отвечать на сотрудничество и отказ от него тем же. Не быть слишком умным». Стратегии «око за око» свойственны все четыре характеристики. В ней нет элемента зависти: ей не свойственно постоянное стремление превзойти конкурента, а все, что ей нужно, — это извлечь выгоду для себя. Кроме того, совершенно очевидно, что стратегия «око за око» следует совету не отказываться от сотрудничества первой и делает это только в ответ на действия соперника, всегда отвечая ему тем же. И наконец, для стратегии «око за око» нехарактерна чрезмерная сложность; она проста и понятна для соперника. На самом деле эта стратегия выиграла турнир не потому, что помогла игрокам получить высокие выигрыши в каждой отдельно взятой игре (состязание не сводилось к принципу «победитель получает все»), а потому, что всегда была близка к этому; она стимулирует сотрудничество и в то же время предотвращает эксплуатацию, тогда как другие стратегии неспособны на это.

После объявления результатов турнира Аксельрод предложил провести второй турнир. Его участникам была предоставлена возможность разработать программы, которые одержат победу над стратегией «око за око». Но в итоге она снова победила! Участвующие в турнире программы не смогли ее превзойти и показывали плохие результаты в противостоянии друг с другом. Аксельрод организовал также турнир иного рода. Вместо группы, в которой каждая программа играла против остальных программ только один раз, он провел игру с участием целой популяции программ, в которой было по несколько копий каждой программы. Программа каждого типа вступала в борьбу с соперником, выбранным из популяции случайным образом. Программы, которые добивались хороших результатов, получали более крупную долю в популяции, а доля программ с плохими результатами в популяции снижалась. Это была игра с элементами эволюции и естественного отбора, которую мы изучим более подробно в . В ее основе лежит простая идея, но ее результаты крайне интересны. Поначалу «плохие» программы добивались более весомых успехов за счет «хороших». Но по мере того как в популяции появлялось все больше «плохих» программ, они все чаще сталкивались друг с другом, поэтому их результативность начинала падать, а численность сокращаться. И вот тут стратегия «око за око» стала добиваться успеха и в итоге одержала победу.

Тем не менее у стратегии равноценных ответных действий есть свои недостатки. И главный — что она не допускает никаких ошибок при своей реализации. Если существует хотя бы малейший риск того, что игрок планировал сотрудничать, но по ошибке совершил действие, ориентированное на отказ от него, это может повлечь за собой целую серию аналогичных ответных действий, тем самым обрекая две программы «око за око» на плохой исход, а чтобы вырваться из этой последовательности, понадобится еще одна ошибка. Когда Аксельрод организовал третий турнир, в котором предусматривалась вероятность таких случайных ошибок, стратегию «око за око» сумели превзойти еще более благожелательные программы, которые допускали отдельные эпизоды отказа от сотрудничества, чтобы определить, ошибка это или системная попытка их эксплуатировать, и принимали ответные меры, только убедившись, что это не ошибка.

Любопытно, что в ходе турнира, организованного по аналогичной схеме в 2004 и 2005 годах в честь двадцатой годовщины турнира Аксельрода, победила новая стратегия. На самом деле это была группа стратегий, умеющих распознавать друг друга во время игры с тем, чтобы одна стратегия становилась сговорчивее под угрозой дальнейших отказов другой от сотрудничества. (Авторы сравнили свой подход с ситуацией, в которой заключенным удается обмениваться друг с другом информацией, перестукиваясь через стены камер.) Такой сговор означал, что некоторые стратегии, поданные победившей командой, показали очень плохие результаты, тогда как другие оказались весьма успешными, что стало подтверждением ценности сотрудничества. Разумеется, в турнире Аксельрода не допускалось участие нескольких программ, поэтому такие группы стратегий не соответствовали его правилам. Но участники недавнего турнира утверждают, что при отсутствии способа исключить координацию представленные ими стратегии могли бы одержать победу и в самом первом турнире.

 

6. Примеры дилеммы заключенных в реальном мире

Игры со структурой дилеммы заключенных присутствуют в неимоверном количестве различных контекстов в реальном мире. Хотя было бы неразумно пытаться вам показать каждый возможный случай возникновения такой дилеммы, все же мы воспользуемся представившимся моментом и детально проанализируем три конкретных примера из разных областей исследований. Один взят из эволюционной биологии, которую мы изучим более подробно в . Второй в качестве решения дилеммы заключенных описывает стратегию «гарантия лучшей цены». А третий касается международной политики в сфере охраны окружающей среды и способности повторяющегося взаимодействия смягчить дилемму заключенных в этой ситуации.

А. Эволюционная биология

В нашем первом примере мы рассмотрим игру под названием «дилемма шалашников». Как правило, самцы-шалашники привлекают самок, сооружая затейливые гнездовья — так называемые шалаши. Известно, что самки весьма разборчивы в выборе шалашей, построенных потенциальными партнерами, поэтому самцы часто отправляются на поиск шалашей соперников, чтобы их разрушить. Однако пока они выполняют эту миссию, их шалаш тоже может пострадать от клюва другого самца. Соперничество между самцами-шалашниками и стоящий перед ними выбор (грабить шалаш соперника или охранять свой) — это игра, имеющая структуру дилеммы заключенных. Орнитологи составили таблицу, в которой показаны выигрыши двух птиц с двумя возможными стратегиями — «грабить» или «охранять». В таблице выигрышей на рис. 10.8 комбинация ОО отображает преимущества стратегии «охранять», когда соперник также охраняет свой шалаш, а комбинация ОГ — выигрыш от охраны шалаша в случае, когда соперник — грабитель. Аналогичным образом комбинация ГГ отображает преимущества стратегии «грабить», когда соперник тоже грабитель, а комбинация ГО — выигрыш от ограбления чужого шалаша, когда соперник охраняет свое гнездо. Многолетние научные наблюдения за спариванием птиц позволили установить, что ГО > ГГ > ОО > ОГ. Другими словами, выигрыши в игре между шалашниками имеют в точности ту же структуру, что и в дилемме заключенных. Доминирующая стратегия птиц — «грабить», но когда ее выбирают обе птицы, это приводит к формированию равновесия, которое хуже для обоих, чем если бы оба применили стратегию «охранять».

Рис. 10.8. Дилемма шалашников

В действительности стратегия, используемая любым шалашником, не результат процесса рационального выбора со стороны птицы. В эволюционных играх предполагается, что стратегии генетически запрограммированы в отдельных организмах, а выигрыши отображают репродуктивный успех разных типов. От того, какие равновесия формируются в подобных играх, зависит тип популяции, который могут наблюдать естествоиспытатели, например, это может быть популяция «грабителей», если доминирующая стратегия — «грабить», как на рис. 10.8. Однако, учитывая существование дилеммы, такой равновесный исход не самый лучший. При поиске решения дилеммы шалашников мы можем прибегнуть к повторяющемуся характеру взаимодействия в этой игре. В случае шалашников повторяющаяся игра против одного и того же или других соперников на протяжении нескольких сезонов спаривания может позволить вам, птице, выбрать гибкую стратегию на основе последнего хода соперника. Для решения подобной дилеммы в эволюционных играх могут использоваться (что часто и происходит) условные стратегии, такие как стратегия равноценных ответных действий. В мы вернемся к анализу эволюционных игр, их структуры и равновесных исходов.

Б. Гарантия лучшей цены

Теперь вернемся к игре в ценообразование и рассмотрим две компании, ведущие ценовую конкуренцию, используя одинаковые стратегии гарантии лучшей цены. Toys «R» Us и Kmart — национальные сети розничных магазинов, которые регулярно рекламируют цены на брендовые игрушки (и другие товары). Кроме того, обе компании официально объявили, что гарантированно компенсируют покупателям разницу между своей и рекламируемой ценой конкретного товара любого конкурента (модель и артикул товара должны быть идентичными), если покупатель предъявит его печатное рекламное объявление.

В этом примере будем исходить из того, что у компаний есть только два возможных варианта цен (низкая или высокая), которые они могут установить на определенную игрушку. К тому же мы используем гипотетические показатели прибыли и еще больше упростим анализ, предположив, что Toys «R» Us и Kmart — единственные конкуренты на рынке игрушек в определенном городе (например, в Биллингсе).

Допустим, базовая структура игры между двумя компаниями проиллюстрирована на рис. 10.9. Если обе компании будут рекламировать низкие цены, они поделят имеющийся потребительский спрос между собой и каждая получит 2500 долларов. Если обе будут рекламировать высокие цены, они поделят рынок с более низким объемом продаж, но их надбавки к цене будут достаточно большими для того, чтобы каждая компания могла заработать 3400 долларов. И наконец, если компании будут рекламировать разные цены, то у компании с высокой ценой вообще не будет покупателей и она ничего не заработает, а компания с низкой ценой получит 5000 долларов.

Рис. 10.9. Установление цен на игрушки в Toys «R» Us и Kmart

Очевидно, что игра, представленная на рис. 10.9, — это дилемма заключенных. Реклама и продажа товаров по низкой цене представляют собой доминирующую стратегию каждой компании, хотя обеим было бы выгоднее рекламировать и продавать игрушки по высокой цене. Но, как уже упоминалось ранее, фактически каждая компания использует третью стратегию — «гарантия лучшей цены», которую они предлагают покупателям. Как ее применение изменит дилемму заключенных, которая в противном случае возникла бы между компаниями?

Проанализируем, какие последствия повлечет за собой возможность выбирать между низкой, высокой и лучшей ценой. Стратегия «лучшая цена» сводится к следующему: компания рекламирует высокую цену, но обещает ее снизить до более низкой, которую предлагает конкурент. В таком случае компании, использующей эту стратегию, выгодно рекламировать высокую цену, если конкурент рекламирует низкую. Это подтверждает структура выигрышей в новой игре, представленной на рис. 10.10. В этой таблице мы видим, что ситуация, в которой одна компания выбирает стратегию «низкая цена», а другая — «высокая цена», эквивалентна выбору низкой цены обеими компаниями. В то же время если одна компания выбирает стратегию «высокая цена», а другая (или обе) — «лучшая цена», это эквивалентно применению обеими стратегии «высокая цена».

Рис. 10.10. Установление цен на игрушки в случае использования стратегии «лучшая цена»

Использование стандартных методов анализа игр с одновременными ходами показывает, что «высокая цена» слабо доминируется стратегией «лучшая цена» для обоих игроков и что после ее исключения стратегия «низкая цена» также становится слабо доминируемой стратегией «лучшая цена». Полученное в итоге равновесие Нэша подразумевает, что обе компании применят стратегию «лучшая цена» и обе заработают по 3400 долларов — уровень прибыли, эквивалентный тому, что компании получили бы при установлении высокой цены в исходной игре. Включение стратегии «лучшая цена» позволило игрокам найти выход из дилеммы заключенных, с которой они столкнулись, располагая только двумя простыми стратегиями — «низкая цена» и «высокая цена».

Как это произошло? Стратегия гарантии лучшей цены выступает в качестве механизма взыскания. Гарантируя такую же низкую цену, как и в Kmart, Toys «R» Us существенно снижает преимущества, которые получит Kmart за счет низкой цены на игрушки, в то время как Toys «R» Us устанавливает высокую цену. Кроме того, обещание предоставить такую же низкую цену, как и в Kmart, наносит вред и самой компании Toys «R» Us, поскольку ей придется смириться с низкой прибылью, полученной в связи со снижением цены. Следовательно, гарантия лучшей цены — это метод наказания обоих игроков в случае, если кто-то из них откажется от сотрудничества. Это в точности та же ситуация, что и в примере с мафией из , за исключением того, что сама схема наказания (а также более высокие цены, которые она поддерживает) используется на рынке практически во всех городах страны.

Реальные эмпирические данные о негативных последствиях такой политики ценообразования, хотя и в ограниченном количестве, существуют, а в ходе некоторых исследований были выявлены факты снижения цен на рынках, использующих эту стратегию. Однако результаты более поздних исследований все же подтверждают наличие сговора при применении компаниями стратегии «гарантия лучшей цены». Это должно насторожить всех покупателей. Даже если магазины, которые гарантируют лучшую цену, придерживаются данной стратегии во имя конкуренции, когда все компании начнут ее использовать, в конечном счете они смогут выиграть от этого больше, чем если бы не применяли эту стратегию вообще, а значит, в проигрыше могут оказаться именно покупатели.

В. Международная политика в сфере охраны окружающей среды: Киотский протокол

Наш последний пример связан с международным соглашением по контролю изменения климата, известным как Киотский протокол. Принятый в 1997 году как дополнительный документ к Рамочной конвенции ООН по вопросам изменения климата в качестве инструмента сокращения выбросов парниковых газов, он вступил в силу в 2005 году, а его первый этап завершился в 2012 году. Изначально договор подписали 170 стран, хотя следует отметить, что США среди них не было. Протокол был продлен едва ли не в последнюю минуту, в середине декабря 2012 года, и теперь действует до 2020 года.

Трудности с обеспечением глобального сокращения выбросов парниковых газов отчасти обусловлены тем, что взаимодействие между странами в этой области носит характер дилеммы заключенных. Любая отдельно взятая страна не заинтересована в сокращении собственных выбросов, зная, что, если сделает это в одиночку, то понесет существенные издержки без ощутимой пользы в плане общего изменения климата. Если другие страны все же сократят свои выбросы, первой стране нельзя будет помешать воспользоваться преимуществами предпринятых ими действий.

Проанализируем проблему сокращения выбросов парниковых газов в виде игры между двумя странами, Мы и Они. По данным британского департамента по вопросам изменения климата, скоординированные действия стран могут повлечь за собой издержки в размере 1 % от ВВП страны, тогда как скоординированное бездействие может обойтись каждой стране в 5–20 % от ВВП, возможно, в среднем по 12 %. Следовательно, издержки одной страны в связи с сокращением выбросов могут достичь максимального значения в случае бездействия (20 %), но если эта страна не станет сокращать выбросы и переложит выполнение этой задачи на другие страны, она не понесет практически никаких издержек. Мы можем представить ситуацию, сложившуюся между странами Мы и Они, в таблице 10.11, где выигрыши отображают изменение ВВП в каждой из стран.

Рис. 10.11. Игра в сокращение выбросов парниковых газов

Игра, представленная на рис. 10.11, действительно представляет собой дилемму заключенных. Доминирующая стратегия каждой страны сводится к отказу от сокращения выбросов. Единственное равновесие Нэша наблюдается в случае, если ни одна страна не сокращает выбросов, но обе испытают на себе негативные последствия изменения климата. Исходя из этого анализа следовало бы ожидать, что в деле сокращения выбросов парниковых газов не будет достигнуто практически никакого прогресса.

Такую интерпретацию проблемы, присущей Киотскому протоколу, поставили под сомнение недавние исследования Майкла Либрайха, который утверждает, что эта игра не сводится к разовому взаимодействию и страны постоянно сотрудничают друг с другом и ведут переговоры о дополнительных поправках к действующему соглашению. По мнению Либрайха, итеративный характер игры позволяет решить ее с помощью условных стратегий и страны должны использовать стратегии, содержащие четыре важных элемента стратегии равноценных ответных действий, о которых говорил Аксельрод (см. ). В частности, странам целесообразно применять стратегии, обладающие следующими свойствами: доброжелательность (присоединение к протоколу и сокращение выбросов парниковых газов); возмездие (применение механизмов наказания по отношению к тем странам, которые не выполняют свою часть договоренностей); прощение (готовность приветствовать новые страны, присоединяющиеся к протоколу); предсказуемость (точное определение действий и ответных действий).

Либрайх оценивает действия нынешних игроков, таких как Евросоюз, Соединенные Штаты и развивающиеся страны (как одна группа), и дает ряд рекомендаций по улучшению ситуации. По его мнению, Евросоюз предпочитает доброжелательную, прощающую и предсказуемую стратегию, но не стратегию возмездия, поэтому другим странам выгодно отказаться от сотрудничества с Евросоюзом. Одним из возможных решений для Евросоюза может стать введение импортных пошлин, связанных с выбросами углекислого газа, или другой стратегии ответных действий во взаимодействии с несговорчивыми торговыми партнерами. Напротив, Соединенные Штаты Америки чаще придерживаются стратегии возмездия и прощения, учитывая их историю такого поведения после окончания холодной войны. Однако США не ведут себя доброжелательно или предсказуемо, во всяком случае на уровне всей страны (отдельные штаты могут придерживаться иной линии поведения), что дает другим странам стимул по возможности предпринимать против США быстрые и болезненные ответные меры. Решение о том, чтобы Соединенные Штаты взяли на себя серьезное обязательство по сокращению выбросов углекислого газа, — широко распространенный вывод во всех политических кругах. Развивающиеся страны Либрайх характеризует как недоброжелательные (они пытаются добиться того, чтобы на них не распространялись нормативы выброса углекислого газа), готовые прибегнуть к возмездию, непредсказуемые и не склонные к прощению. Либрайх утверждает, что таким странам, в частности Китаю, Индии и Бразилии, целесообразно примкнуть к международным инициативам по предотвращению изменения климата, что позволило бы им снизить риск возмездия и повысить шансы на извлечение выгоды из глобального улучшения климата на планете.

Общий вывод состоит в том, что процесс международного сокращения выбросов углекислого газа действительно соответствует профилю дилеммы заключенных. Тем не менее борьбу с выбросами парниковых газов нельзя рассматривать как бесперспективную лишь по той причине, что однократному взаимодействию между странами свойственны некоторые аспекты дилеммы заключенных. Повторяющееся взаимодействие между странами — участницами Киотского протокола делает возможным решение этой игры с помощью условных стратегий с такими свойствами, как доброжелательность, предсказуемость, прощение и возмездие.

 

Резюме

Дилемма заключенных — пожалуй, самая знаменитая стратегическая игра. Хотя у каждого игрока есть доминирующая стратегия («отказаться от сотрудничества»), равновесный исход менее благоприятен для игроков, чем в случае применения каждым из них доминируемой стратегии («сотрудничество»). Повторение игры — самое известное решение этой дилеммы. В конечно повторяющейся игре текущая стоимость будущего сотрудничества в итоге сводится к нулю, а анализ методом обратных рассуждений позволяет найти равновесие, в котором отсутствует кооперативное поведение. В бесконечно повторяющейся игре (или с неопределенным сроком окончания) сотрудничества можно достичь посредством применения подходящей условной стратегии, такой как стратегия равноценных ответных действий («око за око») или стратегия бесповоротного наказания; в любом случае сотрудничество возможно только тогда, когда его текущая стоимость превышает текущую стоимость отказа от него. В более общем плане перспектива того, что «завтра не наступит» (в случае краткосрочных отношений), приводит к уменьшению сотрудничества между игроками.

Дилемму заключенных можно также решить с помощью схем взыскания, которые позволяют изменить выигрыши игроков, отказывающихся от сотрудничества, когда их соперники его поддерживают или когда другие игроки также отказываются сотрудничать. Третий метод решения возникает в случае, когда издержки игрока в связи с отказом от сотрудничества превышают возможный выигрыш от его кооперативного поведения.

Экспериментальные данные свидетельствуют о том, что игроки зачастую сотрудничают дольше, чем предсказывает теория. Такое поведение объясняется неполнотой имеющихся у них знаний или их убеждениями в отношении преимуществ сотрудничества. В ходе экспериментов выяснилось, что стратегия равноценных ответных действий, обладающая такими свойствами, как предсказуемость, доброжелательность, возмездие и прощение, в среднем обеспечивает очень хорошие результаты в повторяющейся дилемме заключенных.

Дилеммы заключенных возникают в различных контекстах. Конкретные примеры из области международной экологической политики, эволюционной биологии и ценообразования показывают, как объяснить и спрогнозировать фактическое поведение посредством применения концепции дилеммы заключенных.

 

Ключевые термины

Бесконечный интервал

Взыскание

Коэффициент дисконтирования

Лидерство

Наказания

Повторяющаяся игра

Приведенная стоимость ( PV )

Сложные проценты

Стратегия бесповоротного наказания

Стратегия равноценных ответных действий

Триггерные стратегии

Условные стратегии

Фактический коэффициент дисконтирования

 

Упражнения с решениями

S1. «Если дилемма заключенных повторяется 100 раз и оба игрока знают, сколько будет повторений, они непременно достигнут кооперативного исхода». Верно ли это? Обоснуйте свой ответ и приведите пример игры, которая его иллюстрирует.

S2. Рассмотрим игру с двумя участниками между Child’s Play и Kid’s Korner — производителями деревянных игровых комплексов для детей. Каждый игрок может установить либо высокую, либо низкую цену на стандартный игровой комплекс с двумя качелями и одной горкой. Если обе компании назначат высокую цену, прибыль каждой составит 64 000 долларов в год. Если одна компания установит низкую цену, а другая высокую, первая получит прибыль 72 000 в год, тогда как вторая — всего 20 000 долларов. Если обе компании назначат низкую цену, каждая получит по 57 000 долларов.

a) Убедитесь, что эта игра имеет структуру дилеммы заключенных, проанализировав выигрыши в случае разных комбинаций стратегий (обе компании выбирают сотрудничество, обе компании отказываются от сотрудничества, одна компания отказывается от сотрудничества и т. д.). Найдите стратегии и выигрыши в случае равновесия Нэша в этой игре с одновременными ходами, если игроки встречаются и принимают решения об установлении цен только один раз.

b) Если две компании решают сыграть в эту игру на протяжении фиксированного периода (скажем, 4 года), какой будет общая прибыль каждой из них к концу игры? (Не применяйте дисконтирование.) Объясните, как вы получили свой ответ.

c) Предположим, две компании постоянно играют в эту повторяющуюся игру. Пусть каждая из них использует стратегию бесповоротного наказания, в соответствии с которой обе назначают высокую цену до тех пор, пока одна не откажется от сотрудничества, и тогда обе компании установят низкую цену на весь оставшийся период. Какова однократная прибыль в результате отказа от сотрудничества в игре против соперника, использующего такую стратегию? Каковы убытки каждой компании за каждый будущий период в случае одного отказа от сотрудничества? Если r = 0, 25 (δ = 0,8), насколько целесообразно им сотрудничать? Определите диапазон значений r (или δ), при которых эта стратегия способна обеспечить сотрудничество между двумя компаниями.

d) Допустим, компании снова и снова год за годом играют в эту игру, не ожидая никаких изменений во взаимодействии друг с другом. Если бы мир перестал существовать через 4 года и ни одна из компаний не знала бы об этом заранее, какой была бы общая прибыль каждой из них (не дисконтированная) к концу игры? Сравните полученный ответ с ответом в пункте b. Объясните, почему они отличаются (если это действительно так) или почему одинаковые (если между ними нет различий).

e) Теперь представим, что две компании знают о наличии 10-процентной вероятности того, что одна из них может обанкротиться на протяжении любого года. Если банкротство действительно произойдет, повторяющаяся игра между компаниями закончится. Изменит ли знание этого факта действия компаний при r = 0, 25? Что если вероятность банкротства повысится до 35 %?

S3. Каждое из двух подразделений компании возглавляет свой менеджер. Вознаграждение менеджеров зависит от количества усилий, которые они вкладывают в повышение производительности. Схема оплаты основана на сравнении результатов работы двух подразделений. Если оба менеджера выбирают высокий уровень усилий, каждый из них зарабатывает 150 000 долларов в год. Если оба предпочитают низкий уровень усилий, каждый получает «всего» 100 000 долларов в год. Однако если один из них выбирает высокий уровень усилий, а другой демонстрирует низкий, тогда первому заплатят 150 000 долларов плюс бонус 50 000 долларов, а второму — только урезанную заработную плату (за более низкую производительность по сравнению с конкурентом) в размере 80 000 долларов. Менеджеры принимают решения об уровне усилий независимо друг от друга, не зная о выборе соперника.

a) Постройте таблицу выигрышей для игры, в которой усилия, вкладываемые менеджерами в свою работу, не влекут за собой никаких издержек. Найдите в этой игре равновесие Нэша и объясните, можно ли ее назвать дилеммой заключенных.

b) Теперь предположим, что высокий уровень усилий требует от менеджеров определенных издержек (например, в связи с подачей дорогостоящего сигнала о качестве работы). В частности, представим, что он сопряжен с издержками в размере 60 000 долларов в год, которые несет менеджер, выбравший этот уровень. Составьте таблицу для новой версии игры и найдите равновесие Нэша. Объясните, будет ли эта игра дилеммой заключенных и чем она отличается от игры в пункте а.

c) Если издержки в связи с выбором высокого уровня усилий составляют 80 000 долларов в год, чем будет отличаться такая игра от игры в пункте b? Каким будет новое равновесие? Объясните, будет ли эта игра дилеммой заключенных и чем она отличается от игр в пунктах а и b.

S4. Вам необходимо решить, стоит ли инвестировать 100 долларов в предприятие друга, где через год эта сумма вырастет до 130 долларов. Вы с другом договорились, что он вернет вам 120 долларов, оставив 10 долларов себе. Но не исключено, что ваш друг может сбежать со всей суммой (130 долларов). Деньги, которые вы не инвестируете в предприятие друга, можно безопасно вложить куда-то еще под действующую ставку процента r и получить 100(1 + r) долларов в следующем году.

a) Постройте дерево игры для такой ситуации и покажите равновесие обратных рассуждений.

Теперь допустим, что игра повторяется бесконечное количество раз. То есть каждый год у вас есть возможность вложить еще 100 долларов в предприятие друга, и вы делите затем полученные 130 долларов по оговоренной выше схеме. Начиная со второго года вам предстоит принимать решение о целесообразности дальнейших инвестиций в предприятие друга, исходя из того, вернул он вам деньги за предыдущий год или нет. Процентная ставка между любыми двумя периодами подряд равна r — столько же, сколько и рыночная процентная ставка, и одинакова для вас и вашего друга.

b) При каких значениях r возможен равновесный исход в повторяющейся игре, в которой на протяжении каждого периода вы вкладываете деньги в предприятие друга и он выплачивает вам деньги в соответствии с договоренностью?

c) Если процентная ставка составляет 10 % в год, существует ли альтернативная договоренность о разделении прибыли, представляющая собой равновесный исход бесконечно повторяющейся игры, в которой в каждом периоде вы инвестируете средства в предприятие друга и он выплачивает вам деньги в соответствии с договоренностью?

S5. Вернитесь к примеру из , в котором заработная плата менеджеров двух подразделений компании зависит от выбора ими высокого или низкого уровня усилий, которые они вкладывают в работу. В сказано, что издержки в связи с выбором высокого уровня усилий составляют 60 000 долларов. Теперь допустим, что оба менеджера многократно ведут игру, представленную в , на протяжении многих лет. Такое повторение делает возможным особый тип сотрудничества, при котором один из менеджеров выбирает высокий уровень усилий, тогда как другой — низкий. При этом оба заключают соглашение о сотрудничестве, в соответствии с которым менеджер, выбирающий высокий уровень усилий, выплачивает второму менеджеру дополнительные суммы с тем, чтобы оба получили одинаковые выигрыши.

a) Какой размер дополнительного платежа гарантирует, что окончательные выигрыши двух менеджеров будут одинаковыми? Сколько каждый менеджер заработает за тот год, в течение которого будет действовать соглашение о сотрудничестве?

b) Сотрудничество в этой повторяющейся игре подразумевает выбор каждым менеджером предписанного уровня усилий и соответствующие дополнительные платежи менеджера с высоким уровнем менеджеру с низким. При каких значениях процентной ставки такое соглашение может поддерживать между ними сотрудничество в повторяющейся игре?

S6. Рассмотрим , с несколько более общими выигрышами (на  k = 1).

Предположим, это повторяющаяся игра, которая проводится каждую субботу вечером. Если k < 1, двум игрокам выгодно постоянно взаимодействовать, выбирая стратегии «свернуть» / «свернуть», тогда как при k > 1 им выгодно сотрудничать в случае, если один их них применит стратегию «свернуть», а другой — «ехать прямо», каждую неделю по очереди выбирая стратегию «ехать прямо». Может ли любой из этих двух типов сотрудничества быть устойчивым?

S7. Вспомните игру из , где Южная Корея и Япония конкурируют на рынке производства танкеров класса VLCC. Как и в пунктах а и b этого упражнения, стоимость строительства судов составляет 30 миллионов долларов в каждой стране, а спрос на танкеры равен P = 180 — Q, где Q = qКорея + qЯпония.

a) Ранее мы нашли равновесие Нэша в этой игре. Теперь найдите исход, основанный на сговоре. Какое общее количество танкеров должны производить обе страны, чтобы максимизировать свою прибыль?

b) Предположим, две страны выпускают одинаковое количество танкеров класса VLCC, а значит, имеют равную долю в прибыли, полученной в случае сговора. Какую прибыль получит каждая страна? Сравните ее с прибылью, которую бы они имели в случае равновесия Нэша.

c) Теперь давайте допустим, что две страны поддерживают повторяющееся взаимодействие. Один раз в год они определяют объем производства, и каждая страна располагает информацией о том, сколько танкеров выпустил конкурент за прошлый год. Обе страны хотят сотрудничать ради получения прибыли, вычисленной в пункте b. На протяжении любого отдельно взятого года каждая из стран может нарушить условия соглашения. Если одна из них сохранит количество выпущенных танкеров на оговоренном уровне, какое количество танкеров лучше всего построить другой стране? Какую прибыль в итоге получат они обе?

d) Составьте матрицу выигрышей этой игры, представив ее в виде дилеммы заключенных.

e) При каких значениях процентной ставки возможно поддержание сговора в случае, если две страны используют стратегию бесповоротного наказания, которая сводится к отказу от сотрудничества навсегда?

 

Упражнения без решений

U1. Два человека, Бейкер и Катлер, играют в игру, в которой выбирают и делят приз. Бейкер решает, каким будет общий размер приза, 10 или 100 долларов. Катлер выбирает, как разделить приз, выбранный Бейкером: либо поровну, либо в неравных частях; тогда он получит 90 процентов, а Бейкер 10. Составьте таблицу выигрышей в этой игре и найдите ее равновесия для каждой из следующих ситуаций.

a) Ходы делаются одновременно.

b) Бейкер ходит первым.

c) Катлер ходит первым.

d) Является ли эта игра дилеммой заключенных? Почему да или почему нет?

U2. Рассмотрим небольшой городок, жители которого очень любят пиццу, но в нем можно разместить только две пиццерии, Deep Dish Донны и Pizza Pies Пирса. Каждый торговец должен выбрать цену на свою пиццу, но для простоты предположим, что доступны только две цены: высокая и низкая. При высокой цене торговцы могут получить прибыль 12 долларов на одну пиццу, при низкой — 10 долларов. У каждой пиццерии есть круг лояльных клиентов, которые покупают 3000 штук пиццы в неделю независимо от назначенной пиццерией цены. Существует также плавающий спрос в размере 4000 пицц в неделю. Но их покупатели чувствительны к ценам и пойдут в заведение с более низкой ценой. Если обе пиццерии установят одинаковую цену, они разделят этот спрос пополам.

a) Составьте таблицу выигрышей для этой игры в ценообразование между пиццериями, воспользовавшись прибылью каждой пиццерии за неделю (в тысячах долларов). Найдите в игре равновесие Нэша и объясните, почему это дилемма заключенных.

b) Теперь предположим, что у Deep Dish Донны гораздо больше лояльных клиентов, которые гарантированно покупают 11 000 (а не 3000) пицц в неделю. Размер прибыли и уровень плавающего спроса остаются теми же. Составьте таблицу выигрышей в новой версии игры и найдите равновесие Нэша.

c) Как наличие более крупной базы лояльных клиентов у Deep Dish «решает» дилемму, возникшую у этих двух пиццерий?

U3. Городской совет состоит из трех членов, которые ежегодно голосуют за повышение собственной заработной платы. Для принятия такого решения требуются два голоса «за». Каждый член совета хотел бы повышения, но при этом ему выгоднее голосовать против, поскольку это бонус в глазах избирателей. Выигрыши каждого члена городского совета таковы:

решение о повышении принято, свой голос «против»: 10;

решение о повышении не принято, свой голос «против»: 5;

решение о повышении принято, свой голос «за»: 4;

решение о повышении не принято, свой голос «за»: 0.

Все три члена городского совета голосуют одновременно. Составьте трехмерную таблицу выигрышей и покажите, что в случае равновесия Нэша решение о повышении заработной платы не может быть единогласным. Проанализируйте, как повторяющееся взаимодействие между членами совета может обеспечивать им ежегодное повышение заработной платы, если 1) каждый член совета занимает эту должность на протяжении трех лет; 2) каждый год в рамках ротации один из них должен быть переизбран; 3) у горожан короткая память, поэтому они помнят результаты голосования о повышении заработной платы членов городского совета только за прошлый, но не за предыдущие годы.

U4. Рассмотрим игру, которую проводит нейтральный судья, разработанную Джеймсом Андреони и Хэлом Вэрианом из Мичиганского университета. В ней участвуют два игрока — Строка и Столбец. Судья дает каждому из них две карточки: 2 и 7 Строке и 4 и 8 Столбцу. Эта информация доступна всем участникам игры. Затем игрокам, играющим одновременно и независимо друг от друга, предлагают отдать судье карточку либо с большим, либо с меньшим числом. Судья раздает выигрыши в долларах (взятых из общего фонда, а не из кармана игроков), размер которых зависит от того, какие карточки он собирает. Если Строка выберет карточку с меньшим числом 2, ее выигрыш составит 2 доллара; если Строка отдаст карточку с большим числом 7, тогда Столбец получит 7 долларов. Если Столбец отдаст карточку с меньшим числом 4, то он получает 4 доллара; если Столбец выберет карточку с большим числом 8, то Строка получит 8 долларов. Выигрыши от других вариантов сочетаний карточек показаны в таблице выигрышей.

a) Покажите, что полная таблица выигрышей в этой игре выглядит следующим образом.

b) Найдите равновесие Нэша в этой игре. Определите, будет ли она дилеммой заключенных.

Теперь предположим, что игра состоит из следующих этапов. Судья раздает карточки, как и раньше, и информация о них известна всем. На этапе 1 каждый игрок из собственного кармана может выделить определенную сумму, которая будет храниться у судьи на счете условного депонирования; сумма может быть нулевой, но не отрицательной. Когда оба игрока сделают выбор на этапе 1, эта информация обнародуется. Далее на этапе 2 оба игрока снова выбирают карточки одновременно и независимо друг от друга. Судья раздает выигрыши из общего фонда, как и в случае одноэтапной игры. Кроме того, он распоряжается средствами, находящимися на счете условного депонирования, следующим образом. Если Столбец выберет карточку с большим числом, судья отдаст ему сумму, которую дала на хранение Строка; если Столбец выберет карточку с меньшим значением, выделенная Строкой сумма вернется к ней. Сумма, которую внес на счет условного депонирования Столбец, распределяется по аналогичному принципу, в зависимости от того, какую карточку выберет Строка. Эти правила известны всем участникам игры.

c) Найдите равновесие обратных рассуждений (совершенное равновесие подыгры) в этой двухэтапной игре. Решает ли оно дилемму заключенных? Какова роль счета условного депонирования?

U5. Компании Glassworks и Clearsmooth конкурируют на местном рынке ремонта ветровых стекол. Размер рынка (общий объем прибыли этих компаний) составляет 10 миллионов долларов в год. Каждая компания решает, размещать ли ей рекламу на местном телевидении. Если компания решит размещать рекламу в том или ином году, это обойдется ей в 3 миллиона долларов. Если одна компания разместит рекламу, а другая нет, то первая захватит весь рынок. Если рекламу разместят обе компании, они поделят рынок поровну. Если обе решат не размещать рекламу, они также поделят рынок поровну.

a) Допустим, обе компании знают, что будут конкурировать всего один год. Составьте матрицу выигрышей в этой игре. Найдите стратегии, образующие равновесие Нэша.

b) Предположим, компании играют в эту игру пять лет подряд и знают, что к концу пятилетнего периода обе планируют выйти из бизнеса. Найдите совершенное равновесие подыгры в этой игре из пяти периодов. Обоснуйте свой ответ.

c) В чем состояла бы стратегия «око за око» в игре, описанной в пункте b?

d) Представим, что компании будут играть в эту игру неопределенное время и что их будущая прибыль дисконтируется по ставке 20 % в год. Можете ли вы найти совершенное равновесие подыгры, обеспечивающее более высокие годовые выигрыши, чем равновесие, найденное в пункте b? Если да, объясните, какие стратегии в него входят. Если нет, обоснуйте свой вывод.

U6. Вернитесь к пиццериям Deep Dish Донны и Pizza Pies Пирса, о которых шла речь в упражнении U2. Предположим, они не ограничены выбором из двух возможных цен и могут выбрать конкретное значение цены, обеспечивающей максимальную прибыль. Допустим также, что приготовление одной пиццы обходится в 3 доллара (в каждой пиццерии), а опыт или результаты изучения рынка показали наличие такой зависимости между объемом продаж (Q) и ценой (P):

Q Пирс  = 12 — P Пирс  + 0,5 P Донна .

Тогда прибыль каждой компании за неделю (Y, в тысячах долларов) составит:

Y Пирс  = ( P Пирс  — 3) Q Пирс  = ( P Пирс  — 3)(12 — P Пирс  + 0,5 P Донна ),

Y Донна  = ( P Донна  — 3) Q Донна  = ( P Донна  — 3)(12 — P Донна  + 0,5 P Пирс ).

a) С помощью этих функций прибыли определите правило наилучших ответов каждой компании, как показано в , и используйте эти правила для поиска равновесия Нэша в данной игре. Какие цены выберут компании в случае равновесия? Какую прибыль получит каждая компания за неделю?

b) Если компании поддерживают сотрудничество и выбирают общую наилучшую цену P, то прибыль каждой компании составит:

Y Донна  =  Y Пирс  = ( P — 3)(12 — P  + 0,5 P ) = ( P — 3)(12 — 0,5 P ).

Какую цену выберут компании, чтобы максимизировать общую прибыль?

c) Представим, что две пиццерии поддерживают повторяющееся взаимодействие, пытаясь сохранить рассчитанные в пункте b общие цены, максимизирующие прибыль. Они печатают новое меню каждый месяц, тем самым связывая себя обязательствами на весь этот период. На протяжении любого месяца одна из компаний может отказаться от этих обязательств. Если одна пиццерия сохранит цену на согласованном уровне, при какой цене другой выгоднее отказаться от дальнейшего сотрудничества? Какую прибыль получат обе пиццерии в итоге? При каких значениях процентной ставки сговор между ними будет устойчивым благодаря стратегии бесповоротного наказания?

U7. Давайте расширим анализ, представленный в , допустив возможность отказа от сотрудничества в триополии, построенной на сговоре. В мы нашли основанный на равновесии Нэша исход игры в случае триополии на рынке производства танкеров класса VLCC, в состав которой входят Корея, Япония и Китай.

a) Теперь найдите исход этой игры, основанный на сговоре. То есть определите, какое количество танкеров VLCC должны выпускать три страны, чтобы обеспечить максимальную общую прибыль.

b) Предположим, в случае построенного на сговоре исхода игры, найденного в пункте а, эти три страны производят равное количество танкеров VLCC, а значит, каждая из них получает равную долю в общей прибыли. Какой будет прибыль каждой страны? Сравните ее с объемом прибыли, которую получит каждая страна в случае равновесия Нэша.

c) Теперь представим, что эти страны поддерживают повторяющееся взаимодействие. Один раз в год они определяют объем производства, причем каждая страна знает, сколько танкеров выпустили конкуренты в предыдущем году. Эти страны хотят сотрудничать, чтобы получать основанные на сговоре уровни прибыли, рассчитанные в пункте b. На протяжении любого года одна из стран может нарушить соглашение. Если две другие страны, как предполагается, должны обеспечить свою долю предусмотренного сговором результата, вычисленного в пунктах а и b, то какое количество танкеров лучше всего построить стране, отказавшейся от дальнейшего сотрудничества? Какую прибыль она в итоге получит, если выпустит оптимальное количество танкеров, тогда как две другие страны произведут столько, сколько было оговорено?

d) Безусловно, через год после отказа одной из стран от дальнейшего сотрудничества оба ее конкурента также его прекратят. Все три страны вернутся к исходу, основанному на равновесии Нэша (навсегда, в случае применения стратегии бесповоротного наказания). Какой выигрыш получит страна, переставшая сотрудничать с конкурентами, за один год отказа от основанного на сговоре исхода? Какие убытки понесет за каждый последующий год страна, отказавшаяся от сотрудничества, в связи с получением прибыли согласно равновесию Нэша, вместо прибыли, предусмотренной сговором?

e) При каких значениях процентной ставки сговор между тремя странами будет устойчивым благодаря стратегии бесповоротного наказания? Они выше или ниже значений, найденных в случае дуополии в ? Почему?

 

Приложение. Бесконечные суммы

Для вычисления приведенной стоимости необходимо определить текущую стоимость суммы денег, которая будет получена в будущем. Как мы видели в , приведенная стоимость суммы денег (скажем, суммы x), которая будет получена через n месяцев начиная с текущего момента, рассчитывается по формуле x / 1 + r)n , где r — соответствующая месячная норма прибыли. Однако суммарную приведенную стоимость суммы денег, которая будет получена в следующем месяце и в каждом последующем месяце в обозримом будущем, определить труднее. В этом случае платежи делаются на протяжении неопределенного периода, а значит, не существует заданного предела суммы значений приведенной стоимости, которую необходимо определить. Для того чтобы вычислить текущую стоимость такого потока платежей, нужно знать математические правила суммирования бесконечных рядов.

Рассмотрим игрока, который в текущем месяце получит прибыль 36 долларов за счет отказа от сотрудничества, а затем ежемесячно будет терять по 36 долларов в связи с дальнейшим выбором этой стратегии, за что соперник будет его наказывать (применяя стратегию равноценных ответных действий). За первый из будущих месяцев (первый месяц, на протяжении которого игрок понесет убытки и за который необходимо дисконтировать значения стоимости) приведенная стоимость убытка игрока составит 36/(1 + r); за второй будущий месяц — 36/(1 + r)2; за третий месяц — 36/(1 + r)3. Иными словами, за каждый из n будущих месяцев, на протяжении которых игрок будет нести убытки в связи с отказом от сотрудничества, его убыток составит 36/(1 + r)n .

Общую приведенную стоимость всех будущих убытков этого игрока можно записать в виде суммы с бесконечным количеством членов ряда

Эту же сумму можно записать с помощью специального обозначения со знаком суммы

Это выражение эквивалентно предыдущему и читается так: «Сумма от n равно 1 до n равно бесконечности дробей с 36 в числителе и (1 + r) в n-й степени в знаменателе». Поскольку 36 — это общий множитель (он присутствует во всех членах суммы), его можно вынести за знак суммы. Поэтому текущую стоимость можно записать так:

Теперь, чтобы вычислить фактическую приведенную стоимость, нам необходимо найти значение суммы, которая содержится в этом выражении для приведенной стоимости. Для этого упростим запись, подставив коэффициент дисконтирования δ вместо 1/(1 + r). Тогда сумма, оценка которой нас интересует, равна

Здесь важно отметить, что 1/(1 + r) < 1, поскольку значение r строго положительное.

Взглянув на последнюю сумму, специалист по бесконечным суммам сказал бы, что она сходится к конечной величине δ/(1 + δ). Такая сходимость обеспечивается за счет того, что все большие степени числа, меньшего 1 (в данном случае δ), становятся все меньше и меньше, приближаясь к нулю по мере стремления n к бесконечности. При этом последние члены выражения, описывающего приведенную стоимость, уменьшаются до тех пор, пока не станут настолько маленькими, что весь ряд приблизится к определенному значению суммы, но сугубо формально никогда его не достигнет. Для того чтобы сделать вывод о том, что сходящееся значение суммы составляет δ/(1 + δ), понадобятся более сложные математические выкладки. Тем не менее достаточно просто доказать, что это правильный ответ.

Чтобы доказать истинность нашего утверждения, мы используем один простой прием. Возьмем сумму первых m членов ряда и обозначим ее как S m . Таким образом получим

Теперь умножим эту сумму на (1 — δ), чтобы получить следующее выражение: (1 — δ)S m  = δ + δ2 + δ3 + … + δm  — 1 + δm  — δ2 — δ3 — δ4 — … — δm  — δm  + 1 = δ — δm  + 1 .

Разделив обе стороны на (1 — δ), имеем

И наконец, возьмем предел этой суммы в случае приближения m к бесконечности, чтобы определить значение исходной бесконечной суммы. По мере стремления m к бесконечности значение δm +1 приближается к нулю, поскольку очень большие и увеличивающиеся степени числа, меньшего 1, становятся все меньше, но остаются неотрицательными. Таким образом, когда m стремится к бесконечности, правая сторона представленного выше уравнения приближается к δ / (1 — δ), а значит, это и есть предел S m , когда m стремится к бесконечности. Что и требовалось доказать.

Для того чтобы использовать полученный ответ для вычисления значений текущей стоимости в играх с дилеммой заключенных, необходимо восстановить значение r. Поскольку δ = 1/(1 + r), из этого следует, что

В таком случае текущая стоимость бесконечного потока убытков в размере 36 долларов, понесенных в каждом месяце, начиная со следующего, составляет

Это и есть значение, использованное нами для определения того, стоит ли игроку навсегда отказываться от сотрудничества, в . Обратите внимание, что введение вероятности продолжения p ≤ 1 в вычисление дисконтированных значений ничего не меняет в примененной здесь процедуре суммирования. В представленных выше вычислениях мы вполне могли бы подставить R вместо r, а pδ вместо коэффициента дисконтирования δ.

Не забывайте, что вам нужно искать приведенную стоимость только тех убытков (или прибылей), которые будут понесены (или получены) в будущем. Приведенная стоимость 36 долларов, потерянных сегодня, составляет просто 36 долларов. Следовательно, если бы вам потребовалось вычислить приведенную стоимость последовательности убытков по 36 долларов каждый, начиная с текущего дня, вы взяли бы 36 долларов, потерянных сегодня, и прибавили бы к ним приведенную стоимость последовательности убытков, понесенных в будущем. Мы только что вычислили, что она равна 36/r. Стало быть, приведенная стоимость последовательности убытков в размере 36 долларов, в том числе 36 долларов, потерянных сегодня, составила бы 36 + 36/r, или 36[(r + 1)/r], что эквивалентно 36/(1 — δ). Аналогично, если бы вам понадобилось проанализировать последовательность значений прибыли игрока в случае применения определенной условной стратегии в дилемме заключенных, вам не нужно было бы дисконтировать объем прибыли, полученной за самый первый период; достаточно было бы дисконтировать только те показатели прибыли, которые представляют собой деньги, полученные в будущие периоды.

 

Глава 11. Коллективные игры

 

* * *

В играх и стратегических ситуациях, рассмотренных в предыдущих главах, как правило, участвовало всего два или три игрока, поддерживающих взаимодействие. Такие игры распространены в нашей академической, деловой, политической и личной жизни, а значит, их очень важно осмыслить и проанализировать. Тем не менее немало случаев социального, экономического и политического взаимодействия представляют собой стратегические ситуации с одновременным участием множества игроков. Стратегии построения карьеры, инвестиционные планы, маршруты передвижения на работу и обратно в часы пик и даже обучение — все это сопряжено с преимуществами и издержками, зависящими от действий многих людей. Если вы были в одной из этих ситуаций, то, скорее всего, ловили себя на мысли, что что-то здесь не так: например, слишком много студентов, инвесторов и пассажиров толпились именно там, куда нужно было и вам. Или наоборот: желающих поучаствовать в каком-либо благотворительном проекте оказывалось слишком мало, хотя вы и прилагали максимум усилий, чтобы их привлечь. Иными словами, игры со многими участниками, которые ведутся в обществе, часто приводят к результату, не удовлетворяющему большинство, а то и всех его членов. В данной главе мы рассмотрим такие игры с точки зрения уже разработанной нами теории. Это поможет вам понять, что именно в подобных играх идет не так и как с этим бороться.

В самом общем виде игры с участием множества игроков касаются проблем коллективного действия. Лучший способ достижения целей общества в целом или отдельного коллектива — выполнение их членами определенного действия или действий, хотя эти действия не всегда отвечают интересам отдельных людей. Иными словами, наиболее благоприятный для общества исход не обеспечивается автоматически в виде равновесия Нэша. Поэтому мы должны определить, как игра может быть изменена, чтобы она приводила к оптимальному исходу или как минимум улучшала неудовлетворительный исход в случае равновесия Нэша. Но для этого сперва следует понять природу таких игр. Их три типа, и вы с ними уже знакомы: дилемма заключенных, игра в труса и игра в доверие. Несмотря на то что в этой главе основное внимание уделяется играм с одновременным участием множества игроков, мы начнем с уже хорошо знакомых вам игр между двумя участниками.

 

1. Коллективные игры с двумя участниками

Представьте, что вы фермер и для вас и соседнего фермера несомненную пользу принесет строительство системы орошения и противопаводковой защиты. Вы можете объединить усилия по реализации этого проекта с соседом или сделать все самостоятельно. Однако после завершения строительства другой фермер автоматически извлечет из него выгоду. Другими словами, каждый из вас заинтересован переложить всю работу на другого. В этом и состоит суть вашего стратегического взаимодействия и проблема коллективного действия.

В мы уже встречались с подобной игрой, когда каждая из трех соседок принимала решение об инвестициях в уличный сад, которым бы наслаждались все трое. Эта игра стала дилеммой заключенных, и все три ее участницы попытались уклониться от решения вносить вклад; в данной главе анализируется более общий диапазон возможных вариантов структуры выигрышей. Кроме того, в игре «уличный сад» мы оценивали ее исходы по шкале от 1 до 6; в процессе описания общих игр мы рассмотрим и более общие формы преимуществ и издержек в случае каждого игрока.

Наш ирригационный проект имеет две важные характеристики. Во-первых, его преимущества относятся к категории неисключаемых благ: человеку, который не внес вклад в его реализацию, нельзя помешать извлекать из него выгоду. Во-вторых, к категории неконкурентных благ: использование этих преимуществ одним человеком не мешает другому тоже ими пользоваться. Экономисты называют эти проекты чистым общественным благом; в качестве примера такого блага часто приводится национальная система обороны. Напротив, чистое частное благо — полностью исключаемое и конкурентное: тот, кто не платит за него, не может воспользоваться его преимуществами, а если такое благо получает один человек, больше к нему никто не имеет доступа. Буханка хлеба — хороший пример чистого частного блага. Большинство благ попадают в двумерный диапазон различных степеней исключаемости и конкурентности. Мы не будем углубляться в эту классификацию, но упомянули о ней, чтобы помочь вам соотнести наше обсуждение с тем, что вы можете встретить в других курсах и книгах.

А. Коллективное действие в контексте дилеммы заключенных

Издержки и преимущества, связанные со строительством оросительной системы, так же как издержки и преимущества всех коллективных действий, зависят от того, кто принимает участие в проекте. В свою очередь, относительный объем затрат и выгод определяет структуру игры, которая при этом ведется. Предположим, каждый из вас в одиночку мог бы завершить проект за 7 недель, тогда как при объединении усилий это потребовало бы от каждого всего по 4 недели. Кроме того, качество проекта с участием двух человек выше; от его реализации в одиночку фермер получает выгоду, эквивалентную 6 неделям работы, тогда как совместная реализация обеспечивает каждому выгоду, эквивалентную 8 неделям работы.

В более общем плане мы можем выразить преимущества и издержки в виде функций от количества участников игры. Таким образом, ваши издержки в связи с решением строить оросительную систему зависят от того, будете вы это делать в одиночку или с чьей-то помощью. Стало быть, издержки можно записать как C(n), где C зависит от количества игроков n, участвующих в реализации проекта. Тогда C(1) — это ваши расходы в связи со строительством оросительной системы только своими силами, C(2) — вместе с соседом. В данном примере C(1) = 7, а C(2) = 4. Аналогичным образом выгода (B) от готовой оросительной системы может зависеть от числа участников (n) ее строительства. В нашем примере B(1) = 6, а B(2) = 8. Обратите внимание, что, учитывая характер проекта, обеспечивающего создание социального блага, преимущества каждого фермера одинаковы, независимо от степени участия в его реализации.

В данной игре каждый фермер должен решить, участвовать ему в строительстве оросительной системы или нет, то есть попытаться уклониться. (Предполагается, что работу необходимо выполнить в сжатые сроки, и вы могли бы сделать вид, что вас в последнюю минуту отвлекли какие-то важные семейные дела; так же может поступить и ваш сосед.) На рис. 11.1 представлена таблица выигрышей в этой игре, исчисляемых в неделях работы. Значения выигрышей определены на основании разности между издержками и преимуществами, связанными с каждым действием. Таким образом, выигрыш при выборе стратегии «строить» составит B(n) — C(n) при n = 1, если вы реализуете проект в одиночку, и n = 2, если ваш сосед также выберет «строить». Выигрыш от применения стратегии «не строить» равен просто B(1), если ваш сосед сыграет «строить», поскольку в случае отказа от участия в проекте вы не несете никаких издержек.

Рис. 11.1. Коллективное действие в контексте дилеммы заключенных: версия I

Учитывая структуру выигрышей, представленную на рис. 11.1, ваш наилучший ответ в случае, если сосед откажется участвовать в проекте, — также отказаться: ваш выигрыш от реализации проекта в одиночку (6) меньше понесенных вами издержек (7), то есть ваш чистый выигрыш составит −1, тогда как отказ от участия в проекте обеспечит выигрыш 0. Аналогичным образом, если ваш сосед решит участвовать в проекте, вы сможете извлечь для себя выгоду (6) из его работы без всяких затрат со своей стороны; для вас это лучше, чем работать самому, чтобы получить более крупное преимущество от проекта с участием двух человек (8), но при этом понести издержки в связи с выполнением работы (4), что обеспечивает чистый выигрыш 4. Общее свойство этой игры состоит в том, что для вас лучше не участвовать в строительстве оросительной системы, что бы ни сделал ваш сосед; та же логика справедлива и в его случае. (В данном примере каждый фермер выступает в качестве безбилетника — человека, который перекладывает всю работу на соседа, а затем все равно пожинает ее плоды.) Таким образом, «не строить» — доминирующая стратегия каждого игрока. Однако совместная работа над проектом принесла бы обоим фермерам больше пользы (выигрыш 4), чем в случае отказа от его реализации (выигрыш 0). Следовательно, это игра категории «дилемма заключенных».

В ней мы видим одну из основных проблем, возникающих в играх с коллективным действием. Выбор, оптимальный для каждого игрока в отдельности (в данном случае — не принимать участия в строительстве независимо от решения соседа), может не быть оптимальным с точки зрения всей группы, даже если эта группа состоит из двух фермеров. Социальный оптимум в игре с коллективным действием достигается, если общая сумма выигрышей ее участников максимизируется. В данной дилемме заключенных социальный оптимум сводится к исходу «строить» / «строить». Однако поведение игроков в соответствии с равновесием Нэша не всегда обеспечивает социально оптимальный исход. Именно поэтому изучение игр с коллективным действием сфокусировано на методах улучшения наблюдаемого (как правило, соответствующего равновесию Нэша) поведения в целях обеспечения наиболее благоприятных для всего общества исходов. Как мы увидим, противоречие между такими исходами, как равновесие Нэша и социальный оптимум, присутствует во всех версиях игр с коллективным действием.

Теперь давайте проанализируем, как будет выглядеть эта игра, если слегка изменить показатели. Предположим, что выгоды от проекта с участием двух человек ненамного превышают выгоды от проекта с участием одного человека: 6,3 недели работы для каждого фермера. При этом каждый получит 6,3–4 = 2,3, если оба решат строить. Полученные в итоге выигрыши представлены в таблице на рис. 11.2. Эта игра по-прежнему остается дилеммой заключенных и приводит к равновесному исходу «не строить» / «не строить». Тем не менее, если оба фермера решают строить, их общий выигрыш составит всего 4,6. Социальный оптимум наблюдается в случае, когда один из них принимает участие в строительстве, а другой нет, что обеспечивает обоим выигрыш 6 + (–1) = 5. Есть два возможных способа получить такой исход, но тогда достижение социального оптимума поднимает новую проблему: кто должен реализовывать проект и получить выигрыш −1, если другой может выступить в роли «безбилетника» и иметь выигрыш 6?

Рис. 11.2. Коллективное действие в контексте дилеммы заключенных: версия II

Б. Коллективное действие в игре в труса

Еще одно изменение показателей исходной дилеммы заключенных (см. ) меняет сам характер игры. Допустим, издержки в связи с выполнением работы сократятся до уровня, при котором вам лучше самому построить систему орошения, если этого не сделает сосед. В частности, предположим, что реализация проекта одним человеком требует 4 недели работы, а значит, C(1) = 4, а двумя людьми — по 3 недели на каждого, то есть C(2) = 3 (для каждого участника проекта); преимущества те же, что и раньше. На рис. 11.3 представлена матрица выигрышей с учетом этих изменений. Теперь ваш наилучший ответ сводится к уклонению от выполнения работы, если ваш сосед работает, и работе, если сосед уклоняется от нее. По своей структуре эта игра напоминает игру в труса, где уклонение от работы равносильно стратегии «ехать прямо» (жесткая, или некооперативная, стратегия), а выполнение — стратегии «свернуть» (примирительная, или кооперативная, стратегия).

Рис. 11.3. Коллективное действие в контексте игры в труса: версия I

Если данная игра приведет к формированию одного из равновесий в чистых стратегиях, сумма выигрышей двух игроков составит 8, что меньше общего исхода, который они могли бы получить, если бы оба занялись строительством. Иными словами, ни одно из равновесий Нэша не обеспечивает всей группе такой выигрыш, как скоординированный исход, подразумевающий применение обоими фермерами стратегии «строить». Социальный оптимум дает общий выигрыш 10. Если исход этой игры в труса представляет собой равновесие в смешанных стратегиях, то два фермера окажутся в еще худшем положении, чем в случае любого из равновесий в чистых стратегиях: их общий выигрыш будет меньше 8 (а если точнее, 4).

Игра в труса, основанная на коллективном действии, может иметь еще одну структуру, если внести дополнительные изменения в выигрыши от реализации проекта. Как и в случае со второй версией дилеммы заключенных, допустим, что проект с участием двух человек ненамного лучше проекта с участием одного человека. Тогда каждый фермер получит от проекта с двумя участниками выгоду B(2), составляющую всего 6,3, а проект с участием одного человека по-прежнему обеспечит каждому из них выгоду B(1) = 6. Мы предлагаем вам применить полученные навыки и самостоятельно составить таблицы выигрышей в этой игре. Вы увидите, что это по-прежнему игра в труса (назовем ее игрой в труса II) и в ней, как и в предыдущей версии, есть два равновесия Нэша в чистых стратегиях, в каждом из которых только один фермер выбирает стратегию «строить», но сумма выигрышей в случае, если оба фермера выбирают «строить», равна всего 6,6, тогда как сумма выигрышей при выборе стратегии «строить» только одним фермером равна 8. Социальный оптимум сводится к тому, что реализовывать проект должен только один фермер. При этом каждый фермер предпочитает равновесие, при котором строит не он. Это может привести к новой динамической игре, в которой каждый фермер ждет, чтобы оросительную систему построил сосед. Или же исходная игра может обусловить равновесие в смешанных стратегиях с его низкими ожидаемыми выигрышами.

В. Коллективное действие в контексте игры в доверие

И наконец, давайте внесем несколько иные изменения в исходную дилемму заключенных, оставив преимущества от реализации проекта с участием двух человек на прежнем уровне и сократив выгоду от проекта с участием одного человека до B(1) = 3. Такое изменение настолько снижает ваши выгоды как «безбилетника», что если теперь ваш сосед выберет стратегию «строить», то ваш наилучший ответ — тоже «строить». На рис. 11.4 представлена таблица выигрышей в этой версии игры. Это игра в доверие с двумя равновесиями в чистых стратегиях: одно — когда вы совместно реализуете проект, а другое — когда оба этого не делаете.

Рис. 11.4. Коллективное действие в контексте игры в доверие

Как и во второй версии игры в труса (II), оптимальный для всей группы исход представляет собой одно из двух равновесий Нэша. Но есть одно отличие. В версии игры в труса II игроки отдают предпочтение разным равновесиям, любое из которых обеспечивает социальный оптимум. В игре в доверие оба игрока предпочитают одно и то же равновесие, и это единственный исход, оптимальный для всей группы. Поэтому достичь социального оптимума в игре в доверие легче, чем в игре в труса.

Г. Коллективное бездействие

Структура выигрышей многих коллективных игр несколько отличается от выигрышей, представленных в примере с ирригационным проектом. Наши фермеры оказываются в ситуации, в которой социальный оптимум подразумевает, что по крайней мере один из них (если не оба) должен участвовать в проекте. Следовательно, в этой игре присутствует коллективное действие. Другие игры со многими участниками правильнее было бы назвать играми с коллективным бездействием. В таких играх общество в целом предпочитает, чтобы некоторые или все его члены не участвовали в игре, или не действовали. В качестве примеров подобного взаимодействия можно назвать выбор маршрутов передвижения в часы пик, выбор инвестиционных планов или районов рыбного промысла.

Общая характеристика всех этих игр состоит в том, что их участники должны решить, пользоваться ли им тем или иным общим ресурсом, будь то автомагистраль, высокодоходный инвестиционный фонд или водоем с большим количеством рыбы. Такие коллективные игры с «бездействием» больше известны как игры с распределением общих ресурсов: суммарный выигрыш всех участников достигает максимума, когда они воздерживаются от чрезмерного использования общих ресурсов. Проблема, связанная с неспособностью достичь социального оптимума в таких играх, известна как трагедия общин; термин, придуманный Гарретом Хардином в его статье с аналогичным названием.

Ранее мы исходили из того, что ирригационный проект обеспечивает вам и вашему соседу одинаковые преимущества. Но что если усилиями обоих фермеров построена система, расходующая так много воды, что им теперь нечем поить скот? Тогда выигрыш каждого из них может быть отрицательным и более низким, если оба выберут стратегию «строить», чем в случае стратегии «не строить». Это был бы еще один вариант дилеммы заключенных, о которой шла речь в и в которой социально оптимальный исход подразумевает, что ни один фермер не строит оросительную систему, хотя каждый по-прежнему в этом заинтересован. Или, предположим, деятельность одного фермера наносит ущерб другому, как это бы произошло, если бы единственным способом спасти одну ферму от затопления стал бы отвод воды на другую. При этом выигрыши обоих фермеров могли бы быть отрицательными, если бы сосед выбрал стратегию «строить». В такой ситуации могла бы возникнуть еще одна версия игры в труса, в которой каждый хочет строить оросительную систему, если другой к этому не стремится, тогда как для обоих было бы лучше, если бы проектом никто не занимался.

Проблемы, рассмотренные в этих примерах коллективного действия и коллективного бездействия, вам уже знакомы. Различные альтернативные способы их решения также соответствуют общим принципам, о которых шла речь в предыдущих главах. Но прежде чем анализировать решения, давайте посмотрим, как эти проблемы проявляются в более реалистичной среде, когда в таких играх одновременно взаимодействуют несколько игроков.

 

2. Проблемы коллективного действия в больших группах

В данном разделе мы расширим наш пример с ирригационным проектом на ситуацию, в которой каждый член группы из N фермеров должен решить, принимать ли в нем участие. Здесь нам пригодятся обозначения, введенные выше: C(n) — издержки, которые несет каждый фермер, когда n фермеров из общего количества N решают строить оросительную систему; B(n) — выгода каждого фермера независимо от его участия в проекте. При этом каждый участник проекта получает выигрыш P(n) = B(n) — C(n), а каждый уклоняющийся или предпочитающий не участвовать — выигрыш S(n) = B(n).

Предположим, вы озадачились вопросом, присоединяться к строительству оросительной системы или нет. Ваше решение будет зависеть от действий остальных (N — 1) фермеров, входящих в состав группы. В общем случае вам предстоит решить, когда из остальных (N — 1) фермеров n принимают участие в проекте, а (N — 1 — n) уклоняются от него. Если вы тоже намерены уклониться, количество участников проекта по-прежнему будет равно n, а значит, вы получите выигрыш S(n). Если предпочтете участвовать, количество участников составит n + 1 и вы получите выигрыш P(n + 1). Следовательно, ваш окончательный выбор зависит от сравнения этих двух выигрышей: вы будете строить, если P(n + 1) > S(n), и откажетесь, если P(n + 1) < S(n). Это сравнение применимо ко всем версиям коллективной игры, проанализированным в ; различия в поведении игроков в разных версиях возникают из-за изменений значений P(n + 1) и S(n) в связи с изменением структуры выигрышей.

Мы можем соотнести примеры игр с двумя участниками из с этой обобщенной схемой. Если в игре только два игрока, то P(2) — это выигрыш одного фермера от реализации проекта, когда другой тоже в нем участвует, а S(1) — выигрыш фермера, уклоняющегося от участия, если другой фермер строит оросительную систему, и т. д. Таким образом, мы можем обобщить таблицы выигрышей на рис. 11.1–11.4, представив их в алгебраической форме. Общая структура выигрышей показана на рис. 11.5.

Рис. 11.5. Общая форма игры с коллективным действием с двумя участниками

Игра, отображенная на рис. 11.5, — это дилемма заключенных, если одновременно выполняются следующие неравенства:

P (2) <  S (1), P (1) <  S (0), P (2) >  S (0).

Согласно первому неравенству, наилучший ответ на стратегию «строить» — «не строить», согласно второму — наилучший ответ на стратегию «не строить» также «не строить», а третьему — что для обоих игроков комбинация стратегий «строить»/«строить» предпочтительнее комбинации «не строить» / «не строить». Это дилемма типа I, если 2P(2) > P(1) + S(1), а значит, общий выигрыш больше, когда оба фермера решают строить, чем когда строительством занимается только один. Вы можете составить аналогичные неравенства, описывающие выигрыши, которые обеспечивают другие типы игр, представленные в .

Теперь вернемся к версии игры с участием n игроков. Воспользовавшись функциями выигрышей в случае двух действий, P(n + 1) и S(n), мы можем построить графики, которые помогут нам определить, с каким типом игры мы имеем дело, а также найти в ней равновесие Нэша, которое затем сможем сравнить с социально оптимальным исходом игры.

А. Дилемма заключенных со многими участниками

Рассмотрим конкретную версию игры со строительством оросительной системы, в которой 100 фермеров из одной деревни решают, какое действие предпринять. Допустим, реализация ирригационного проекта позволит повысить продуктивность земельных угодий каждого фермера пропорционально масштабу проекта; в частности, предположим, что выгода каждого фермера при участии n человек в строительстве составляет P(n) = 2n. Представим также, что, если вы не участвуете в проекте, у вас все равно есть возможность воспользоваться его преимуществами, а сэкономленное время потратить на что-то другое, чтобы заработать еще 4, то есть S(n) = 2n + 4. Не забывайте, что ваше решение об участии в проекте зависит от относительной величины P(n + 1) = 2(n + 1) и S(n) = 2n + 4. Два отдельных графика этих функций для каждого отдельного фермера показаны на рис. 11.6, где значения n от 0 до (N — 1) отображены на горизонтальной оси, а на вертикальной — выгода фермера. Если в данный момент в проекте участвует не так много фермеров (а значит, большинство из них уклонились), ваш выбор будет зависеть от относительного положения P(n + 1) и S(n) с правой стороны графика.

Рис. 11.6. График выигрышей в дилемме заключенных со многими участниками

Поскольку на самом деле n принимает только целые значения, технически каждая из функций P(n + 1) и S(n) состоит из дискретного множества точек, а не из непрерывного множества, как подразумевают сглаженные линии на рисунке. Но при большом значении N эти дискретные точки находятся достаточно близко друг от друга, поэтому мы можем их соединить и представить каждую функцию выигрыша в виде непрерывной линии. Кроме того, мы также используем в этом разделе линейные функции P(n + 1) и S(n), для того чтобы сформулировать основные идеи, а более сложные возможности обсудим чуть позже.

Напомним, что вы определяете свой выбор с учетом количества текущих участников проекта n и выигрышей, связанных с каждым действием при таком значении n. На проиллюстрирован случай, когда линия S(n) находится полностью над линией P(n + 1). Следовательно, каким бы ни было число других участников (то есть каким бы большим ни было значение n), если вы откажетесь от проекта, ваш выигрыш будет выше, чем в случае согласия. Стало быть, отказ от участия в проекте — ваша доминирующая стратегия. У всех игроков одинаковые выигрыши, а значит, отказ от участия в проекте — доминирующая стратегия каждого игрока. Таким образом, равновесие Нэша в этой игре подразумевает, что все игроки станут уклоняться и оросительная система так и не будет построена.

Обратите внимание, что обе линии поднимаются по мере увеличения n. Какое бы действие вы ни выбрали, вам выгодно, чтобы в проекте участвовало больше фермеров. Левая точка пересечения линии S(n) с вертикальной осью находится ниже правой точки пересечения линии P(n + 1), то есть S(0) = 4 < P(N) = 102. Это говорит о том, что, если все фермеры (в том числе и вы) откажутся от строительства, выигрыш каждого из них (в том числе ваш) будет меньше, чем в случае согласия. Все фермеры добились бы более весомых результатов, чем при равновесии Нэша, если бы можно было обеспечить исход, при котором каждый из них участвует в проекте. Это и делает игру дилеммой заключенных.

Чем равновесие Нэша, найденное с помощью графика на , отличается от социального оптимума в этой игре? Для того чтобы ответить на данный вопрос, понадобится способ описать общий социальный выигрыш при каждом значении n; мы сделаем это с помощью функций выигрышей P(n) и S(n), чтобы построить третью функцию T(n), отображающую общий выигрыш для общества от проекта с n участниками как функцию n. Он состоит из значения P(n) для каждого из n участников проекта и значения S(n) для каждого из (N — n) тех, кто отказался от участия:

T ( n ) = nP ( n ) + ( N — n ) S ( n ).

Социальный оптимум наблюдается в случае, когда соотношение между участниками проекта и отказавшимися от него максимизирует общий выигрыш T(n), или при таком количестве участников проекта (то есть при таком значении n), которое максимизирует T(n). Для того чтобы лучше понять, каким может быть этот показатель, удобнее записать T(n) иначе, преобразовав представленное выше выражение в такое равенство:

T ( n ) = NS ( n ) — n [ S ( n ) — P ( n )].

Этот вариант функции общего социального выигрыша показывает, что мы можем его вычислить, если дадим каждому из N человек выигрыш уклонившегося от строительства, а затем отнимем дополнительную выгоду [S(n) — P(n)] отказавшихся у каждого из n участников проекта.

В играх с коллективным действием, в отличие от игр с распределением общих ресурсов, мы обычно ожидаем, что значение S(n) будет расти по мере увеличения n. Следовательно, значение первого члена выражения, NS(n), также возрастает при увеличении n. Если второй член выражения не увеличивается слишком быстро при увеличении n (как было бы, если бы дополнительная выгода [S(n) — P(n)] человека, отказавшегося от участия в проекте, представляла собой небольшую и постоянную величину), то эффект первого члена доминирует в определении значения T(n).

Именно это происходит с функцией общего социального выигрыша в нашем примере с сотней фермеров. Здесь T(n) = nP(n) + (N — n)S(n) преобразуется в T(n) = n(2n) + (100 — n)(2n + 4) = 2n2 + 200n — 2n2 + 400 — 4n = 400 + 196n. В данном случае T(n) постепенно увеличивается вместе с n и достигает максимального значения при n = N, когда никто не уклоняется от участия в проекте.

Версия игры с большой группой участников позволяет сделать тот же вывод, что и раньше. Группа фермеров в целом выиграла бы, если бы все фермеры строили оросительную систему, то есть если n = N. Но структура выигрышей такова, что у каждого фермера есть стимул уклониться от этого. Равновесие Нэша в игре (при n = 0) не будет социально оптимальным. Поиск способов достижения социального оптимума — один из важнейших вопросов в области изучения коллективного действия; мы вернемся к нему ниже в данной главе.

В других ситуациях функция T(n) может иметь максимум при другом значении n, а не только при n = N. Иными словами, совокупный выигрыш общества можно максимизировать, допустив определенное уклонение от участия в проекте. Даже в случае дилеммы заключенных необязательно должно быть так, что функция общего выигрыша достигает максимума при максимальном значении n. Если разрыв между S(n) и P(n) растет достаточно быстро при увеличении значения n, то отрицательный эффект второго члена выражения для T(n) перевешивает положительный эффект первого члена выражения по мере приближения n к N; в таком случае лучше всего позволить людям уклониться — другими словами, социально оптимальное значение n может быть меньше N. Этот результат идентичен полученному в ходе анализа второй версии дилеммы заключенных в .

Такой исход мы наблюдали бы в нашей деревне, если бы значение S(n) составляло 4n + 4, а не 2n + 4. Тогда T(n) = –2n2 + 396n + 400, что больше не является линейной функцией n. На самом деле графический калькулятор или простейшие расчеты позволяют определить, что в данном случае T(n) принимает максимальное значение при n = 99, а не n = 100, как ранее. Изменение структуры выигрышей создало в них неравенство (уклонившиеся от участия в проекте находятся в более выгодном положении, чем его участники), что добавляет еще одну трудность к попыткам общества решить эту дилемму. К примеру, как деревне выбрать одного фермера на роль уклониста?

Б. Игра в труса со многими участниками

Теперь рассмотрим ряд других конфигураций выигрышей. Например, когда P(n) = 4n + 36, а значит, P(n + 1) = 4n + 40 и S(n) = 5n, две линии выигрышей пересекутся. Этот случай показан на рис. 11.7. Здесь при малых значениях n P(n + 1) > S(n), то есть если некоторые фермеры участвуют в проекте, вам также лучше участвовать. При больших значениях n P(n + 1) < S(n), то есть если многие фермеры участвуют в проекте, вам лучше этого не делать. Обратите внимание, что эти утверждения эквивалентны идее игры в труса из двух человек, согласно которой «вы уклоняетесь, если ваш сосед работает, и работаете, если сосед уклоняется». Этот случай действительно представляет собой игру в труса. В более общем плане игра в труса происходит, когда у вас есть выбор из двух действий и вы предпочитаете делать то, что большинство других игроков предпочитают не делать.

Рис. 11.7. График выигрышей в игре в труса со многими участниками

Кроме того, рис. 11.7 поможет нам определить положение равновесия Нэша в этой версии игры. Поскольку вам выгодно участвовать в проекте при малых значениях n и отказаться при больших значениях n, то равновесие должно быть при каком-то промежуточном значении n. Вам безразлично, какой именно из двух вариантов выбрать, только при значении n, при котором две линии пересекаются. Точка пересечения соответствует равновесному значению n. На нашем графике P(n + 1) = S(n), когда 4n + 40 = 5n, или когда n = 40; это и есть соответствующее равновесию Нэша количество фермеров, которые будут строить оросительную систему.

Если две линии пересекаются в точке, соответствующей целому значению n, это и будет количество участников проекта согласно равновесию Нэша. Если это не так, то, строго говоря, в игре нет равновесия Нэша. Но на практике, если текущее значение n в данной комбинации — целое число, расположенное сразу же слева от точки пересечения (которая может не быть целым числом), то еще один фермер захочет присоединиться к проекту, а если текущее значение n — целое число, расположенное справа от точки пересечения, то один фермер захочет уклониться от него. Следовательно, количество участников будет находиться в непосредственной близости от точки пересечения, и мы можем с полным основанием утверждать, что она и будет равновесием в приближенном смысле.

Структура выигрышей на показывает, что обе линии имеют положительный наклон, хотя это и необязательно. Можно предположить, что выгода каждого человека уменьшается, когда в проекте участвует больше людей, поэтому линии могут иметь отрицательный наклон. Игре в труса с коллективным действием присуща одна важная особенность: когда всего несколько человек выполняют одно действие, любому другому человеку также лучше его выполнять; когда одно действие выполняет много людей, то другому человеку лучше делать что-то иное.

В чем состоит социально оптимальный исход в игре в труса с коллективным действием? Если выигрыш каждого участника проекта P(n) возрастает по мере увеличения числа участников, а выигрыш каждого уклониста S(n) не сильно превышает P(n) каждого участника, то общий социальный выигрыш достигнет максимума, если все участвуют в проекте. Это и есть исход игры в нашем примере, где T(n) = 536n — n2; общий социальный выигрыш увеличивается по n до значения N (в данном случае 100), а значит, n = N — это и есть социальный оптимум.

Однако в более общем плане некоторые варианты игры в труса приведут к социальным оптимумам, в которых лучше допустить определенное уклонение от участия в проекте. Если бы в группе было 300, а не 100 фермеров, мы получили бы именно такой исход. Социально оптимальное количество участников проекта, вычисленных с помощью графического калькулятора или простейших расчетов, составило бы 268. В этом и заключается разница между версиями I и II игры в труса в примере, о котором шла речь в . В качестве упражнения вы можете попытаться найти структуру выигрышей, которая приведет к такому исходу в деревне с сотней фермеров. В аналогичных более общих вариантах игры в труса оптимальное количество участников может быть даже меньше, чем в случае равновесия Нэша. В мы более подробно проанализируем вопрос о социальном оптимуме во всех этих версиях игры.

В. Игра в доверие со многими участниками

И наконец, рассмотрим третий возможный тип игр с коллективным действием, а именно игру в доверие. На рис. 11.8 представлены графики выигрышей для такой игры, где мы исходим из предположения, что фермеры получают P(n + 1) = 4n + 4 и S(n) = 2n + 100. Здесь S(n) > P(n + 1) при малых значениях n, поэтому, если оросительную систему строят не так уж много фермеров, вам также нужно уклониться от участия в проекте. Но P(n + 1) > S(n) при больших значениях n; тогда, если многие фермеры участвуют в строительстве, вам тоже лучше к ним присоединиться. Иными словами, в отличие от игры в труса, игра в доверие — это игра с коллективным действием, в которой вам необходимо сделать тот же выбор, что и другие ее участники.

Рис. 11.8. График выигрышей в игре в доверие со многими участниками

За исключением обозначений, график на рис. 11.8 практически идентичен графику на . Однако положение точки, соответствующей равновесию Нэша, в значительной мере зависит от того, как именно обозначены две линии на графике. На рис. 11.8 показано, что при любом начальном значении n, расположенном слева от пересечения, каждый фермер захочет отказаться от участия в проекте и равновесие Нэша будет достигнуто при n = 0, когда все фермеры уклоняются. Однако справа от точки пересечения складывается прямо противоположная картина. Из этой части графика видно, что каждый фермер пожелает участвовать в строительстве, поэтому в игре сформируется еще одно равновесие Нэша при n = N.

Технически в этой игре существует еще и третье равновесие Нэша, если значение n в точке пересечения целое число, как в нашем примере. Тогда мы можем определить, что P(n + 1) = 4n + 4 = 2n + 100 = S(n) при n = 48. Следовательно, если бы n было в точности равно 48, мы увидели бы исход, при котором одни фермеры решили бы реализовывать проект, а другие нет. Эта ситуация могла бы стать равновесием только при таком значении n, но даже тогда она была бы крайне нестабильной. Если бы всего один фермер случайно присоединился не к той группе, его выбор изменил бы стимулы всех остальных фермеров, что привело бы всю игру к одному из равновесий в конечных точках графика. Это и есть два устойчивых равновесия Нэша в данной игре.

Социальный оптимум в этой игре достаточно легко обнаружить на графике на . Поскольку обе линии на нем восходящие (то есть для каждого члена группы лучше, если в проекте примет участие больше людей), очевидно, что равновесие, которое находится у правого края графика, более благоприятно для всей группы. В нашем примере это подтверждается тем, что значение T(n) = 2n2 + 100n + 10 000 возрастает по n при всех положительных значениях n; следовательно, социально оптимальное значение n — это максимальное значение, или n = N. Стало быть, в игре в доверие социально оптимальный исход — это одно из устойчивых равновесий Нэша. В связи с этим получить его может быть даже легче, чем в ряде других случаев. Однако независимо от того, отображает ли он равновесие Нэша в исходной игре, остается актуальным вопрос, как все это осуществить на практике.

До сих пор в наших примерах фигурировали относительно небольшие группы людей, от 2 до 100 человек. Но когда общая численность группы N достаточно большая, один человек оказывает совсем незначительное влияние на ситуацию, поэтому значение P(n + 1) почти равно значению P(n). Таким образом, условие, при котором любой человек предпочтет уклониться от участия в проекте, выглядит так: P(n) < S(n). Выразив это неравенство в выгодах и издержках в связи с общим проектом из нашего примера (а именно P(n) = B(n) — C(n) и S(n) = B(n)), мы увидим, что значение P(n) (в отличие от P(n + 1) в наших предыдущих расчетах) всегда меньше S(n); отдельные люди постоянно будут стремиться к уклонению от участия в проекте, когда значение N очень большое. Поэтому проблемы коллективной реализации общественных проектов в крупной группе почти всегда проявляются в виде дилеммы заключенных. Однако, как мы уже заметили, такой результат не обязательно будет достигаться в небольших группах. То же касается и больших групп в других контекстах, таких как пробки на дорогах, которые мы обсудим немного ниже в данной главе.

В общем мы должны предусмотреть возможность более широкой интерпретации выигрышей P(n) и S(n), чем в представленном выше конкретном примере, учитывающем преимущества и издержки в связи с проектом. Скажем, мы не можем предположить, что функции выигрышей всегда будут линейными. Дело в том, что в самом общем случае P(n) и S(n) могут быть любыми функциями n, графики которых могут неоднократно пересекаться. При этом может присутствовать множество равновесий, хотя каждое из них может представлять один из описанных выше типов. Кроме того, некоторые игры будут отнесены к категории игр с распределением общих ресурсов, поэтому в случае полностью обобщенных игр мы будем говорить о двух действиях, обозначенных символами P и S, которые не обязательно будут означать «участие в проекте» и «отказ от участия в проекте», но это позволит нам использовать для обозначения выигрышей те же символы. Таким образом, когда n игроков совершают действие P, P(n) — это выигрыш каждого игрока, выполняющего действие P, а S(n) — выигрыш каждого игрока, выполняющего действие S.

 

3. Внешние эффекты, или экстерналии

До сих пор мы видели, что коллективные игры проходят в контексте дилеммы заключенных, игры в труса или игры в доверие. Мы также видели, что равновесия Нэша в этих играх редко обеспечивают социально оптимальный уровень участия (или его ограничения). И даже когда социальный оптимум и равновесие Нэша совпадают, это, как правило, лишь одно из возможных равновесий, которые могут присутствовать в игре. Теперь мы глубже проанализируем различия между индивидуальными (или личными) и групповыми (или социальными) стимулами в таких играх. Кроме того, подробнее опишем воздействие решений каждого человека на других людей и группу в целом. Этот анализ совершенно четко объясняет наличие таких различий между стимулами, то, как они проявляются и что можно предпринять для достижения более благоприятных в социальном отношении исходов игры, чем в случае равновесия Нэша.

А. Поездки на работу и обратно и сопутствующие эффекты

Сначала давайте представим себе большую группу из 8000 жителей пригорода, которые ежедневно ездят в город на работу и обратно. Будучи одним из ее членов, вы можете выбрать для поездки либо скоростную магистраль (действие P), либо сеть местных дорог (действие S). Поездка по местным дорогам неизменно занимает 45 минут, сколько бы автомобилей по ним ни перемещалось. На поездку по скоростной автомагистрали уходит всего 15 минут при условии отсутствия заторов. Однако каждый водитель, выбирающий скоростную магистраль, увеличивает время в пути любого другого водителя, который поедет по этому маршруту, на 0,005 минуты (около одной четверти секунды).

Выигрыши в игре исчисляются в минутах сэкономленного времени — например, на сколько минут время поездки туда и обратно меньше одного часа. Следовательно, выигрыш водителей, обозначаемый как S(n), выбравших маршрут по местным дорогам, — постоянная величина: 60–45 = 15, независимо от значения n. Однако выигрыш водителей — P(n), — выбравших скоростную автомагистраль, зависит от значения n; в частности, P(n) = 60–15 = 45 при n = 0, но значение P(n) падает на 5 / 1000 (или 1 / 200) в случае каждого, кто выбирает автомагистраль для поездки на работу и обратно. С учетом этого, P(n) = 45 — 0,005n. Графики двух функций выигрышей представлены на рис. 11.9.

Рис. 11.9. Игра в выбор маршрута для поездки на работу и обратно

Предположим, сначала на автомагистрали находится 4000 автомобилей, то есть n = 4000. При таком количестве машин на дороге каждому водителю требуется 15 + 4000 × 0,005 = 15 + 20 = 35 минут, чтобы добраться на работу; при этом каждый из них получает выигрыш P(n) = 25 [60–35, то есть P(4000)]. Как показано на рис. 11.9, этот выигрыш лучше, чем тот, который получат водители, выбравшие местные дороги. В итоге вы, будучи одним из них, можете принять решение переключиться с поездки по местным дорогам на поездку по скоростной автомагистрали. Выбор нового маршрута увеличит значение n на 1, что скажется на выигрышах остальных участников движения. Теперь количество водителей, выбравших автомагистраль, составляет 4001 (в том числе и вы), а время поездки каждого равно 35 + 5 / 200, или 35,005 минуты. При этом каждый водитель получит выигрыш P(n + 1) = P(4001) = 24,995, по-прежнему превышающий выигрыш от поездки по местным дорогам. Следовательно, у вас есть личный стимул изменить маршрут, поскольку P(n + 1) > S(n) (24,995 > 15).

Выбор другого маршрута приносит вам личную выгоду (которую получаете только вы), эквивалентную разности между вашими выигрышами до и после такого перехода; она составляет P(n + 1) — S(n) = 9,995 минуты. Поскольку вы — один человек, а значит, малая часть группы, полученная вами выгода в виде увеличения выигрыша в сравнении с общим выигрышем всей группы весьма небольшая, или маржинальная. В связи с этим мы называем ее маржинальной личной выгодой.

Однако теперь из-за вашего решения изменить маршрут каждому из 4000 других водителей, выбравших автомагистраль, придется тратить на поездку на 0,005 минуты больше. Это означает, что выигрыш каждого из них меняется на P(4001) — P(4000) = –0,005. Водители, выбравшие местные дороги, также столкнутся с изменением выигрышей в размере S(4001) — S(4000), но в нашем примере это равно нулю. Суммарное воздействие вашего решения на всех остальных водителей составляет 4000 × (–0,005) = –20. Ваше действие, то есть переход с местных дорог на скоростную автомагистраль, повлияло на выигрыши других игроков. Всякий раз, когда действие одного человека оказывает подобное влияние на других людей, наблюдается сопутствующий эффект, или внешний эффект, или экстерналия. Следует отметить, что, поскольку вы представляете собой не более чем малую часть всей группы, ваше воздействие на ее членов следует называть маржинальным сопутствующим эффектом.

Совокупность таких факторов, как маржинальная личная выгода и маржинальный сопутствующий эффект, и есть полное воздействие вашего решения перейти на другой маршрут на группу людей, совершающих поездки на работу и обратно, или общее предельное изменение выигрыша группы или общества в целом. Мы называем данный показатель маржинальной социальной выгодой, связанной с выбором вами другого маршрута. В действительности эта «выгода» может быть положительной или отрицательной, поэтому само слово «выгода» в данном контексте не означает, что все случаи перехода на другой маршрут пойдут на пользу всей группе. В нашем примере общая предельная социальная выгода составляет 9,995 — 20 = –10,005 минуты. Следовательно, общий социальный эффект вашего перехода на другой маршрут носит негативный характер: в целом социальный выигрыш уменьшается более чем на 10 минут.

Б. Сопутствующие эффекты: общий случай

Мы можем описать эффекты, наблюдаемые в примере с поездками на работу и обратно, в еще более обобщенном виде с помощью функции социального выигрыша T(n), где n — количество людей, выбравших P, а значит, N — n — это число людей, выбравших S. Предположим, что сначала n людей выбрали P, а также что один человек переключается с S на P. Тогда количество людей, выбравших P, увеличивается на величину от 1 до (n + 1), а количество людей, выбравших S, уменьшается на величину от 1 до (N — n — 1). Таким образом, общий социальный выигрыш составляет

T ( n  + 1) = ( n  + 1) P ( n  + 1) + [ N — ( n  + 1)] S ( n  + 1).

Увеличение общего социального выигрыша равно разности между T(n + 1) и T(n). После приведения и перестановки членов получим следующее уравнение:

T ( n  + 1) — T ( n ) = ( n  + 1) P ( n  + 1) + [ N — ( n  + 1)] S ( n  + 1) — nP ( n ) — ( N — n ) S ( n ) =

[ P ( n  + 1) — S ( n )] + n [ P ( n  + 1) — P ( n )] + [ N — ( n  + 1)][ S ( n  + 1) — S ( n )]. (11.1)

Уравнение (11.1) математически описывает различные эффекты перехода одного человека с S на P, которые мы наблюдали в примере с поездками на работу и обратно. Это уравнение показывает, как предельная социальная выгода делится на предельные изменения выигрышей подгрупп общей совокупности.

Первый из трех членов уравнения () (а именно [P(n + 1) — S (n)]) — это маржинальная личная выгода, полученная человеком, переключающимся на другое действие. Как мы видели выше, именно этот член уравнения определяет выбор человека, причем все отдельные варианты такого выбора образуют равновесие Нэша.

Второй и третий члены уравнения () — количественная оценка сопутствующих эффектов, связанных с влиянием перехода одного человека на всех остальных участников группы. У каждого из n человек, выбравших P, выигрыш меняется на величину [P(n + 1) — P(n)], если еще один человек переключается на P; этот сопутствующий эффект можно наблюдать во второй группе членов уравнения (). После перехода одного человека на другое действие остается еще N — (n + 1), или N — n — 1, других участников группы, которые по-прежнему выбирают S, причем каждый из них видит, что его выигрыш меняется на [S(n + 1) — S(n)]; этот сопутствующий эффект отображен в третьей группе членов уравнения. Безусловно, выбор одним водителем другого маршрута оказывает совсем незначительное влияние на время пребывания остальных участников движения в пути, однако когда их на дороге очень много (то есть при большом значении N), совокупный сопутствующий эффект может быть достаточно большим.

Таким образом, мы можем записать уравнение () при переходе одного человека с S на P или с P на S как:

Маржинальная социальная выгода = маржинальная личная выгода + маржинальный сопутствующий эффект.

В примере, в котором один человек переходит с S на P, мы имеем:

Маржинальная социальная выгода = T ( n  + 1) — T ( n ),

Маржинальная личная выгода = P ( n  + 1) — S ( n ),

Маржинальный сопутствующий эффект = n [ P ( n  + 1) — P ( n )] + [ N — ( n  + 1)] × [ S ( n  + 1) — S ( n )].

Применение дифференциального исчисления к формулам общего случая. Прежде чем более подробно рассматривать некоторые ситуации с наличием сопутствующего эффекта, чтобы понять, что можно сделать для обеспечения социально оптимальных исходов, мы сформулируем общие концепции этого анализа на языке дифференциального исчисления. Если вы не знаете этого языка, можете опустить оставшуюся часть данного раздела, не рискуя нарушить целостность изложенного здесь материала. Если же знаете, альтернативная формулировка покажется вам проще и понятнее, чем представленные выше алгебраические преобразования.

Если общее количество N членов группы очень большое (например, исчисляется в сотнях или тысячах), то одного человека можно воспринимать как совсем небольшую, или бесконечно малую, часть целого. Это позволяет рассматривать n как непрерывную переменную. Если T(n) — общий социальный выигрыш, мы вычислим эффект от изменения n, проанализировав увеличение бесконечно малой предельной величины dn вместо увеличения на целую единицу с n до (n + 1). В первом приближении изменение выигрыша составляет T´(n)dn, где T´(n) — производная от T(n) по n. Воспользовавшись выражением для общего социального выигрыша

T ( n ) = nP ( n ) + ( N — n ) S ( n )

и продифференцировав это выражение, получим

T ´( n ) = P ( n ) + nP ´( n ) — S ´( n ) + ( N — n ) S ´( n ) = [ P ( n ) — S ( n )] + nP ( n ) + ( N — n ) S ´( n ). (11.2)

Это эквивалент уравнения (), выраженный в терминах дифференциального исчисления. T´(n) — это маржинальная социальная выгода. Маржинальная личная выгода равна P(n) — S(n), что представляет собой изменение выигрыша человека от перехода с S на P. В уравнении () оно было представлено как P(n + 1) — S(n), теперь же мы имеем P(n) — S(n). Это объясняется тем, что прибавление бесконечно малой величины dn к группе из n человек, выбравших P, не приводит к существенному изменению выигрыша ни одного из них. Тем не менее общее изменение их выигрыша, равное nP´(n), представляет достаточно большую величину и учитывается в вычислении сопутствующего эффекта — это второй член в уравнении (), — так же как и изменение выигрыша (N — n) человек, выбравших S, то есть (N — n)S´(n), третий член уравнения (). Два последних члена уравнения представляют собой предельный сопутствующий эффект.

В примере с поездками на работу и обратно у нас были такие значения: P(n) = 45 — 0,005n и S(n) = 15. Далее с помощью вычислений мы пришли к выводу, что предельная личная выгода каждого водителя, выбирающего автомагистраль, когда n водителей уже движутся по ней, составляет P(n) — S(n) = 30 — 0,005n. Поскольку P´(n) = –0,005, а S´(n) = 0, сопутствующий эффект составляет n × (–0,005) + (N — n) × 0 = –0,005n, что равно −20 при n = 4000. Ответ такой же, как и раньше, но дифференциальное исчисление упрощает процесс его получения и помогает найти оптимум непосредственно.

В. Еще раз о поездках на работу и обратно: отрицательные экстерналии

Отрицательная экстерналия наблюдается в случае, когда действие одного человека снижает выигрыши других членов группы, что перекладывает на них часть дополнительных затрат. Мы наблюдали это в примере с поездками на работу и обратно, где предельный сопутствующий эффект от перехода одного человека на автомагистраль был отрицательным, поскольку увеличивал время поездки других участников движения на 20 минут. Однако человек, меняющий маршрут поездки на работу, не учитывает сопутствующий эффект (экстерналию); его мотивируют только собственные выигрыши. (Не забывайте, что чувство вины, которое он может испытывать в связи с причинением вреда окружающим, уже должно быть отображено в его выигрышах.) Такой человек изменит свое действие с S на P, если это позволит ему получить положительную маржинальную личную выгоду. Тогда это изменение поставит его в более выгодное положение.

Однако общество в целом бы выиграло, если бы решения человека, регулярно совершающего поездки из пригорода на работу и обратно, зависели от маржинальной социальной выгоды. В нашем примере она имеет отрицательное значение –10,005, тогда как маржинальная личная выгода — положительное 9,995, поэтому отдельный водитель переходит с местных дорог на автомагистраль, даже если для общества было бы лучше, чтобы он этого не делал. В общем, в ситуациях с отрицательными экстерналиями маржинальная социальная выгода меньше маржинальной личной выгоды, что объясняется существованием отрицательного сопутствующего эффекта. Люди принимают решения на основании расчетов издержек и преимуществ, что неправильно с точки зрения общества. В итоге отдельные люди выбирают действия с отрицательным сопутствующим эффектом чаще, чем того хотело бы общество.

Уравнение () можно использовать для определения точных условий, при которых переход приносит выгоду одному человеку, в отличие от всей группы. Вспомните, что если n человек уже пользуются скоростной автомагистралью, а один водитель планирует перейти на нее с местных дорог, он получит от этого выгоду, если P(n + 1) > S(n), тогда как социальный выигрыш увеличивается при условии, что T(n + 1) — T(n) > 0. Личный выигрыш имеет положительное значение, если

45 — ( n  + 1) × 0,005 > 15,

44,995 — 0,005 n  > 15,

n  < 200 (44,995 — 15) = 5999.

При этом социальная выгода имеет положительное значение при выполнении следующего условия:

45 — ( n  + 1) × 0,005 — 15 — 0,005 n  > 0

29,995 — 0,01 n  > 0,

n  < 2999,5.

Таким образом, при наличии свободы выбора люди, которые регулярно ездят из пригорода на работу и обратно, выберут маршрут, пролегающий по скоростной автомагистрали, пока их число не достигнет 6000, но при этом любое количество, превышающее 3000, сокращает общий социальный выигрыш. Для всей совокупности водителей было бы лучше, если бы их количество не превышало 3000.

Этот результат представлен в виде графика на рис. 11.10; он дублирует , но с добавлением линий маржинальной личной и социальной выгоды. Две линии, соответствующие функциям P(n + 1) и S(n), пересекаются в точке n = 5999, иными словами, в точке, соответствующей такому значению n, при котором P(n + 1) = S(n), то есть при котором маржинальная личная выгода равна нулю. В любой точке слева от этого значения n каждый отдельно взятый водитель, пользующийся местными дорогами, может подсчитать, что он получит положительную выгоду от перехода на автомагистраль. По мере совершения водителями такого перехода количество автомобилей на автомагистрали увеличивается — значение n повышается, так же как и в примере, о котором шла речь в . Напротив, справа от точки пересечения (то есть при n > 5999) S(n) > P(n + 1), а значит, каждый из (n + 1) водителей, пользующихся автомагистралью, получит выгоду от перехода на местные дороги. И по мере того как некоторые водители действительно начнут это делать, количество автомобилей на автомагистрали будет сокращаться, а значение n падать. Слева от точки пересечения этот процесс сходится к n = 5999, а справа — к 6000.

Рис. 11.10. Равновесие и оптимум в игре в выбор маршрута для поездки на работу и обратно

При использовании подхода, основанного на дифференциальном исчислении, мы бы рассматривали 1 как малое приращение n и построили бы график P(n) вместо P(n + 1). Тогда точкой пересечения было бы значение n = 6000, а не 5999. Очевидно, что на практике это фактически не играет роли. То есть мы можем назвать n = 6000 равновесием Нэша в игре с изменением маршрута в случае, когда выбор обусловлен сугубо личными соображениями. При наличии свободы выбора из 8000 человек, которые регулярно ездят из пригорода на работу и обратно, 6000 выберут скоростную автомагистраль и только 2000 будут ездить по местным дорогам.

Однако мы также можем представить исход этой игры с точки зрения всех жителей пригородной зоны. В целом они выигрывают от увеличения количества водителей n, пользующихся автомагистралью, если T(n + 1) — T(n) > 0, и проигрывают от увеличения n, если T(n + 1) — T(n) < 0. Для того чтобы разобраться, как это отобразить на графике, сформулируем идею несколько иначе. В частности, перепишем уравнение (), разбив его на два фрагмента, один из которых зависит только от P, а другой — только от S:

T ( n  + 1) — T ( n ) = ( n  + 1) P ( n  + 1) + [ N — ( n  + 1)] S ( n  + 1) — nP ( n ) — [ N — n ] S ( n ) =  S ( n ){P( n  + 1) + n [ P ( n  + 1) — P ( n )]} — { S ( n ) + [ N — ( n  + 1)][ S ( n  + 1) — S ( n )]}.

Выражение в первой группе скобок — это воздействие на выигрыши членов группы, выбравших P; в него входит P(n + 1) человек, перешедших на другой маршрут, а также сопутствующий эффект n[P(n + 1) — P(n)], отражающий влияние на всех остальных n человек, выбравших P. Мы называем это маржинальным социальным выигрышем подгруппы, выбравшей P, в случае если ее численность увеличивается с n до n + 1, или сокращенно MP(n + 1). Аналогично, выражение во второй группе скобок — маржинальный социальный выигрыш подгруппы, выбравшей S, или сокращенно MS(n). В итоге все выражение для T(n + 1) — T(n) говорит о том, что общий социальный выигрыш увеличивается, когда один человек переходит с S на P (или уменьшается, когда один человек переключается с P на S), если MP(n + 1) > MS(n), и уменьшается, когда один человек переходит с S на P (или увеличивается, когда один человек переключается с P на S), если MP(n + 1) < MS(n).

Воспользовавшись выражениями для P(n + 1) и S(n) в примере с поездками на работу и обратно, получим

MP ( n  + 1) = 45 — ( n  + 1) × 0,005 + n  × (–0,005) = 44,995 — 0,01 n.

При этом MS(n) = 15 для всех значений n. На представлены также графики функций MP(n + 1) и MS(n). Обратите внимание, что MS(n) везде совпадает с S(n), поскольку на местных дорогах не бывает заторов. Однако линия MP(n + 1) находится под линией P(n + 1). Из-за отрицательного сопутствующего эффекта социальная выгода от перехода одного человека на автомагистраль меньше его личной выгоды.

Графики MP(n + 1) и MS(n) пересекаются в точке n = 2999, или приблизительно 3000. Слева от точки пересечения MP(n + 1) > MS(n), то есть группа в целом выиграет от перехода еще одного человека на автомагистраль. Справа от точки пересечения все наоборот, то есть группа выиграет от перехода одного человека с автомагистрали на местные дороги. Таким образом, социально оптимальное распределение водителей — 3000 на автомагистрали и 3000 на местных дорогах.

При использовании подхода, основанного на дифференциальном исчислении, общий выигрыш водителей, передвигающихся по автомагистрали, можно было бы записать так: nP(n) = n(45 — 0,005n) = 45n — 0,005n 2 . Тогда MP(n + 1) — производная этого выражения по n, а именно 45 — 0,005 × 2n = 45 — 0,01n. Оставшая часть анализа выполняется так же, как описано выше.

Как обеспечить оптимальное распределение водителей с точки зрения общества в целом? В разных культурах и политических группах используются различные системы, каждая со своими преимуществами и недостатками. Общество может просто запретить 3000 водителям доступ на скоростную автомагистраль. Но по каким критериям их отбирать? Можно применить принцип живой очереди, но тогда водители будут пытаться обогнать друг друга, чтобы добраться до автомагистрали первыми, и потеряют кучу времени. Бюрократическое общество могло бы установить критерии, основанные на выполненных чиновниками сложных расчетах потребностей и заслуг, и тогда каждый водитель стал бы предпринимать затратные действия, чтобы удовлетворять этим критериям. Политизированное общество может отдать предпочтение важным «независимым избирателям», или организованным группам активистов, или лицам, делающим пожертвования. В коррумпированном обществе привилегии могли бы получить те, кто дает взятки чиновникам или политикам. Более эгалитарное общество может разыгрывать права на поездку по автомагистрали в лотерею или распределять их по ротационному принципу, каждый месяц меняя тех, кому они принадлежат. В качестве примера такого распределения можно привести схему, согласно которой вы получаете право ездить по автомагистрали только в определенные дни, в зависимости от последней цифры на номерном знаке вашего автомобиля. Однако такая схема не столь демократична, как может показаться поначалу, поскольку богатые люди могут купить два автомобиля и выбирать номерные знаки так, чтобы это позволяло им пользоваться автомагистралью ежедневно.

Многие экономисты предпочитают более открытую систему тарифов на проезд по автомагистрали. Предположим, каждый передвигающийся по ней водитель должен заплатить пошлину t, исчисляемую в единицах времени. В таком случае личная выгода от использования автомагистрали составляет P(n) — t, а число n в равновесии Нэша определяется выражением P(n) — t = S(n). (Здесь мы игнорируем малую разность между P(n) и P(n + 1), что допустимо при очень больших значениях N.) Мы знаем, что социально оптимальное значение n равно 3000. Воспользовавшись выражениями P(n) = 45 — 0,005n и S(n) = 15 и подставив 3000 вместо n, находим, что P(n) — t = S(n), то есть водителям безразлично, по какому маршруту ехать, автомагистралью или местными дорогами, если 45–15 — t = 15 или t = 15. Если стоимость времени при минимальной оплате труда составляет около 5 долларов в час, 15 минут обойдутся в 1,25 доллара. Это и есть пошлина, или плата за проезд, введение которой позволит удерживать количество водителей, пользующихся автомагистралью, на социально оптимальном уровне.

Обратите внимание, что, когда 3000 водителей пользуются автомагистралью, добавление одного участника движения увеличивает время пребывания каждого водителя в пути на 0,005 минуты, то есть в сумме на 15 минут. Это и есть та пошлина, которую должен заплатить каждый водитель. Другими словами, он должен оплатить стоимость отрицательного сопутствующего воздействия, оказываемого им на остальных членов группы. Это наглядно демонстрирует каждому водителю дополнительные издержки, которые влекут за собой его действия, что, в свою очередь, побуждает его выбрать социально оптимальное действие. Экономисты в таком случае говорят, что отдельный человек вынужден перенять экстерналию. Тот факт, что люди, действия которых причиняют вред другим людям, должны его оплачивать, повышает привлекательность данного подхода. Однако средства, вырученные от взимания пошлины, не передаются непосредственно на возмещение ущерба другим людям. Если бы это было так, то каждый пользователь автомагистрали рассчитывал бы получить за счет других именно ту сумму, которую он платит сам, и вся система потеряла бы смысл. Вместо этого деньги, вырученные от пошлины, уходят в казну государства, где их могут потратить (или не потратить) на благо общества.

Экономисты, предпочитающие полагаться на рынки, утверждают, что если бы автомагистраль находилась в частной собственности, ее владелец был бы заинтересован взимать такую плату за проезд, которая бы сократила количество пользователей автомагистрали до социально оптимального уровня. Владелец автомагистрали знает, что, если он взимает пошлину t с каждого водителя, их количество будет определяться по формуле P(n) — t = S(n). Его доход составит tn = n[P(n) — S(n)], и он будет действовать так, чтобы максимизировать его. В нашем примере доход равен n[45 — 0,005n — 15] = n[30 — 0,005n] = 30n — 0,005n2. Очевидно, что доход достигает максимума при n = 3000. Однако в этом случае прибыль уйдет в карман владельца автомагистрали, а большинство людей считают это неприемлемым.

Г. Положительные сопутствующие эффекты

Многие вопросы, касающиеся положительных сопутствующих эффектов, или положительных экстерналий, можно рассматривать как зеркальное отображение вопросов, связанных с отрицательными сопутствующими эффектами. Личная выгода человека от выполнения действий, обусловливающих положительный сопутствующий эффект, меньше маржинальной выгоды общества от этих действий. Следовательно, в случае равновесия Нэша такие действия будут применяться не очень активно и общество не получит от них адекватной выгоды. Более благоприятного результата можно достичь путем повышения заинтересованности людей; социальный оптимум можно обеспечить, предоставляя тем, чьи действия создают положительные сопутствующие эффекты, вознаграждение, эквивалентное выгоде от сопутствующего эффекта.

На самом деле различие между положительным и отрицательным сопутствующим эффектом — в какой-то мере вопрос семантики. Будет ли эффект положительным или отрицательным, зависит от того, какое выбранное действие вы обозначите символом P, а какое — S. Предположим, что в примере с регулярными поездками на работу и обратно мы обозначили местные дороги как P, а автомагистраль как S. Тогда переход одного человека с S на P сократит время в пути остальных людей, выбравших S, а значит, это действие создаст для них положительный сопутствующий эффект. Можно рассмотреть еще один пример — вакцинацию против некоторых инфекционных болезней. Каждый человек, сделавший прививку, снижает как собственный риск подхватить болезнь (маржинальная личная выгода), так и риск окружающих заразиться ею от него (сопутствующий эффект). Если отсутствие прививки обозначить как действие S, то вакцинация создает положительный сопутствующий эффект, если — как действие P, то отказ от вакцинации создает отрицательный сопутствующий эффект. Это имеет свои последствия для разработки политики приведения действий отдельных людей в соответствие с социальным оптимумом. Общество может либо вознаграждать тех, кто проходит вакцинацию, либо налагать взыскание на тех, кто отказывается от нее.

Однако действиям, создающим положительный сопутствующий эффект, может быть присуще одно важное новое свойство, отличающее их от действий с отрицательным сопутствующим эффектом, а именно положительная обратная связь. Предположим, сопутствующий эффект от выбора вами действия P связан с увеличением выигрыша тех, кто также выбрал P. В таком случае ваш выбор повышает привлекательность этого действия (P) и может склонить других тоже его совершить, положив начало процессу, который завершится всеобщим выполнением этого действия. Напротив, если действие P выбирают очень немногие люди, то оно может быть настолько непривлекательным, что они и сами откажутся от него, что приведет к всеобщему выбору действия S. Другими словами, положительная обратная связь может привести к формированию множества равновесий Нэша; ниже мы проиллюстрируем эту ситуацию на примере из реальной жизни.

При покупке компьютера вам необходимо решить, на базе какой операционной системы — Windows или Linux (семейство Unix) — он должен работать, чтобы это было выгоднее для вас. Чем активнее растет количество пользователей Unix, тем целесообразнее покупать такой компьютер: в системе будет меньше ошибок, поскольку пользователи их обнаружат и устранят, к тому же будет доступно больше приложений, а также увеличится число специалистов, которые смогут вам помочь при возникновении проблем. Точно так же привлекательность компьютера на Windows будет повышаться по мере увеличения количества пользователей этой ОС. Кроме того, многие компьютерные фанаты убеждены, что операционная система Unix вне всякой конкуренции. Придерживаясь нейтральной позиции по этому вопросу, мы покажем, что произошло бы, если бы это было действительно так. Приведет ли индивидуальный выбор к получению наиболее благоприятного для всего общества результата?

Для отображения выигрышей от двух стратегий, Windows и Unix, отдельного покупателя мы используем такой же график, как на и . Как показано на рис. 11.11, выигрыши от стратегии Unix повышаются по мере увеличения количества ее пользователей, а выигрыши от стратегии Windows повышаются, когда число пользователей Unix падает (соответственно, растет количество пользователей Windows). Как уже было сказано, этот график построен с учетом того, что выигрыш пользователей Unix, когда все остальные члены общей совокупности также предпочитают Unix (в точке U), выше выигрыша пользователей Windows, когда все остальные члены общей совокупности также выбирают Windows (в точке W).

Рис. 11.11. Выигрыши в игре с выбором операционной системы

Если в текущей совокупности только небольшая доля пользователей Unix, то ситуация отображается на графике слева от точки пересечения линий выигрышей точкой I; при этом каждый отдельный пользователь считает более целесообразным выбрать Windows. Когда в общей совокупности доля пользователей Unix больше, это смещает всю совокупность направо от I и каждому пользователю лучше выбрать Unix. Таким образом, смешанная совокупность пользователей Unix и Windows может выступать в качестве равновесия только тогда, когда в текущей совокупности имеется ровно I пользователей Unix: лишь при этом условии ни у одного члена совокупности нет стимула перейти на другую платформу. Но даже эта ситуация неустойчива. Предположим, всего один человек случайно примет другое решение. Если он перейдет на Windows, его выбор сместит всю совокупность налево от точки I и тогда у других членов совокупности также появится стимул перейти на Windows. Если он перейдет на Unix, точка совокупности сместится направо от I, что стимулирует еще большее количество пользователей выбрать Unix. В конечном счете совокупный эффект этих переходов подтолкнет общую совокупность к исходу «все пользователи Unix» или «все пользователи Windows»; это и есть два устойчивых равновесия в данной игре.

Но какое из них будет достигнуто? Ответ зависит от того, где начинается игра. Если вы взглянете на конфигурацию современных пользователей компьютеров, то увидите среди них подавляющее большинство сторонников Windows. В связи с этим создается впечатление, что, поскольку пользователей Unix мало (или много пользователей Windows), мир движется к равновесию «все пользователи Windows». Школы, компании и частные пользователи оказались замкнутыми на этом равновесии вследствие исторической случайности. Если Unix действительно обеспечивает обществу дополнительные преимущества в случае ее повсеместного использования, тогда равновесие «все пользователи Unix» должно быть предпочтительнее по сравнению с равновесием «все пользователи Windows», к которому мы приближаемся. К сожалению, хотя общество в целом от такого изменения только бы выиграло, ни у одного пользователя компьютера нет личной заинтересованности менять сложившуюся ситуацию. Изменить ее в пользу Unix может только скоординированное действие. Прежде чем все посчитают целесообразным выбрать Unix, должна сформироваться критическая масса ее отдельных пользователей, превышающая имеющуюся в точке I на .

Существует много примеров подобного рода условностей, соблюдаемых различными группами людей. Наиболее известны случаи, в отношении которых по прошествии времени заговорили как об ошибочном выборе. Сторонники этой точки зрения заявляют, что паровые двигатели можно было бы сделать гораздо эффективнее, чем двигатели внутреннего сгорания, и уж конечно, они были бы более экологически чистыми. Приверженцы клавиатуры с раскладкой Дворака уверены, что она была бы лучше раскладки QWERTY, если бы применялась повсюду. Многие инженеры сходятся во мнении, что у Betamax было преимущество перед VHS на рынке видеомагнитофонов. В таких случаях пристрастие публики или талант рекламистов помогают определить окончательное равновесие и могут привести к «плохому» или «неправильному» исходу с точки зрения общества. В других ситуациях подобных трудностей нет. Например, мало кто стал бы бороться за изменение цвета огней светофора.

Идеи положительной обратной связи и замыкания нашли важное практическое применение в макроэкономике. Рентабельность производства возрастает по мере повышения уровня спроса в экономке, что происходит при увеличении национального дохода. А национальный доход, в свою очередь, увеличивается в связи с ростом выпуска продукции и, как следствие, рабочих мест. Такая положительная обратная связь позволяет сформировать множество равновесий, среди которых равновесие, включающее высокий объем производства и высокий национальный доход, гораздо лучше для общества, но отдельные решения могут замкнуть экономику на равновесии с низким объемом производства и низким национальным доходом. Более благоприятное равновесие можно сделать фокальной точкой, публично об этом заявив («Единственное, чего мы должны бояться, — это самого страха»). Кроме того, правительство могло бы также повысить спрос в экономике до уровня, необходимого для ее перевода в более выигрышное равновесие. Иными словами, с точки зрения теории игр вероятность безработицы из-за дефицита совокупного спроса (о чем в терминах спроса и предложения на языке экономической теории говорит Джон Кейнс в опубликованной в 1936 году книге под названием Employment, Interest, and Money) можно считать следствием неспособности решить проблему коллективного действия.

 

4. Краткая история идей

А. Классика

Проблема коллективного действия заботила социальных философов и экономистов с давних времен. Британский философ XVII столетия Томас Гоббс утверждал, что общество разрушится в «войне всех против всех», если не будет под властью монарха-диктатора, или Левиафана (название книги Гоббса). Сто лет спустя французский философ Жан-Жак Руссо описал проблему дилеммы заключенных в трактате «Рассуждение о начале и основании неравенства между людьми». Охота на оленя требует сотрудничества всей группы охотников с тем, чтобы они могли окружить и убить животное, но любой отдельно взятый охотник, увидевший зайца, может посчитать это более приемлемым вариантом для себя, покинуть круг и погнаться за зайцем. Руссо полагал, что такие проблемы — продукт цивилизации и что в своем естественном состоянии люди ведут гармоничную жизнь как «благородные дикари». Примерно в то же время два шотландца сформулировали ряд кардинальных решений подобных проблем. Давид Юм в своем труде «Трактат о человеческой природе» утверждал, что ожидание ответной услуги в будущем обеспечивает взаимодействие между людьми. Адам Смит в работе «Исследование о природе и причинах богатства народов» сформулировал важное видение экономики, согласно которому производство товаров и услуг сугубо в целях получения личной прибыли может привести к наилучшему исходу для общества в целом.

Столь оптимистическая интерпретация настолько укрепила свои позиции (особенно среди экономистов и даже некоторых политологов), что автоматически предполагалось следующее: если тот или иной результат приносит выгоду всей группе, действия ее членов обязательно приведут к его получению. Это убеждение было подвергнуто резкой критике в середине 1960-х годов, после выхода книги Манкура Олсона «Логика коллективного действия». Олсон отметил, что наилучший коллективный результат не будет достигнут, если каждый отдельно взятый человек не будет лично в этом заинтересован, то есть если не сформируется равновесие Нэша. Однако Олсон не конкретизировал игру с коллективным действием. Хотя у нее много общего с дилеммой заключенных, Олсон настаивал, что это не всегда так, и мы с вами уже убедились, что данная проблема может принимать форму игры в труса или игры в доверие.

Примерно в то же время внимание ученых привлек еще один важный класс проблем коллективного действия, а именно проблемы исчерпания общих ресурсов. Если доступ к таким ресурсам, как рыбные запасы или пастбища, открыт для всех, каждый человек будет эксплуатировать их по максимуму, поскольку любое самоограничение с его стороны просто приведет к тому, что это будет делать кто-то другой. Как уже упоминалось выше, Гаррет Хардин написал по этой теме знаменитую статью под названием «Трагедия общин». Проблемы совместно используемых ресурсов отличаются от игры со строительством оросительной системы, в которой у каждого фермера есть сильный личный стимул бесплатно воспользоваться результатами труда других людей. Что касается общих ресурсов, то здесь каждый человек лично заинтересован извлечь из них максимальную выгоду, заставив остальных оплачивать социальные издержки в связи с их истощением.

Б. Современные подходы и решения

До недавнего времени многие социологи и большинство специалистов по естественным наукам придерживались точки зрения Гоббса на проблему общих ресурсов, заявляя, что ее способно решить только правительство, которое заставит всех поддерживать взаимодействие. Другие, особенно экономисты, сохранили оптимизм Смита. Они утверждали, что передача ресурса в частную собственность, при которой выгода от него будет выражена в виде прибыли владельца, побудит его ограничить использование ресурса, обеспечив тем самым социальный оптимум. Владелец поймет, что в будущем ценность ресурса (например, рыбы или травы) повысится в связи с его уменьшением, а значит, он сможет получить больше прибыли, сохранив часть ресурса.

В настоящее время специалисты из самых разных областей осознали, что проблемы коллективного действия принимают всевозможные формы и что не существует универсального способа справиться с ними. Кроме того, они пришли к выводу, что группы или общества не остаются беспомощными перед лицом таких проблем, а изобретают разные варианты их решения. Большая часть работ по этой теме основана на анализе повторяющихся дилемм заключенных и других подобных игр с точки зрения теории игр.

Решения проблем коллективного действия всех типов должны побуждать отдельных членов группы действовать сообща или таким образом, чтобы это приносило ей максимальную пользу, даже если не отвечает интересам человека. Например, обмен подарками и навыки обнаружения обмана настолько типичны для всех обществ и всех времен, что есть все основания утверждать, что это может происходить на инстинктивном уровне. Однако человеческое общество в значительной мере полагается на специальные социальные и культурные традиции, нормы и санкции в целях стимулирования кооперативного поведения отдельных членов общества. Эти методы представляют собой осознанные, продуманные попытки разработать игру для решения проблемы коллективного действия. Мы подходим к вопросу поиска методов решения с учетом такого фактора, как тип игры.

Решить проблему коллективного действия легче всего, если она принимает форму игры в доверие. Тогда каждый человек лично заинтересован в совершении наилучшего в социальном плане действия, если рассчитывает на то, что все остальные поступят так же. Другими словами, социально оптимальный исход — это равновесие Нэша. Единственная проблема, что в той же игре существуют и другие равновесия Нэша, менее выигрышные в социальном плане. В таком случае все, что необходимо для достижения наилучшего равновесия Нэша, а значит, и социального оптимума, — сделать такой исход фокальной точкой, то есть обеспечить на нем сходимость ожиданий игроков. Такая сходимость может проистекать из социальной традиции, или соглашения, а именно линии поведения, которая принимается автоматически, поскольку каждый человек заинтересован ее придерживаться, если предполагается, что остальные тоже должны это делать. Например, если фермеры, пастухи, ткачи и другие производители в том или ином регионе хотят собираться и торговать своей продукцией, все, что им нужно, — это уверенность в том, что у них будет с кем торговать. Тогда традиция еженедельно проводить ярмарку в деревне X в день Y делает присутствие в этом месте в это время оптимальным для всех.

Но остается одна сложность. Для того чтобы желаемый результат стал фокальной точкой, каждый человек должен быть уверен в том, что остальные понимают это, что, в свою очередь, требует, чтобы они были уверены в том, что все остальные понимают это… Иными словами, фокальная точка должна быть общим знанием. Как правило, для этого необходимо заранее предпринять определенное социальное действие. Скажем, это может быть публикация в одном из средств массовой информации с широким кругом читателей или обсуждение с сидящими по кругу людьми, чтобы каждый мог убедиться, что остальные внимательно слушают.

Представленный в анализ позволяет предположить, что отдельные выигрыши во многих случаях имеют конфигурацию, при которой проблемы коллективного действия, особенно в крупных группах, принимают форму дилеммы заключенных. Неудивительно, что методы решения таких проблем удостоились самого пристального внимания.

Самый простой метод — изменить предпочтения игроков так, чтобы игра перестала быть дилеммой заключенных. Если отдельные люди получают удовольствие от сотрудничества или испытывают чувство вины или стыда, когда обманывают, они будут сотрудничать, чтобы максимизировать свои выигрыши. Если дополнительный выигрыш от сотрудничества зависит от определенных условий (человеку нравится взаимодействовать с другими или он испытывает чувство вины или стыда, прибегая к обману, если и только если другие сотрудничают), то игра может превратиться в игру в доверие. В одном из ее равновесий каждый игрок идет на сотрудничество, потому что большинство тоже делают это, а в другом никто не взаимодействует, поскольку никто этого не делает. В таком случае проблема коллективного действия упрощается и сводится к тому, чтобы сделать более благоприятное равновесие фокальной точкой. Если дополнительный выигрыш от сотрудничества не зависит ни от каких условий (человеку нравится взаимодействовать с другими или он испытывает чувство вины или стыда, прибегая к обману, независимо от того, что делают другие), тогда в этой игре может быть единственное равновесие, при котором все игроки поддерживают сотрудничество друг с другом. Во многих ситуациях даже необязательно, чтобы такой дополнительный выигрыш получали все без исключения. Если его получает довольно приличная часть общей совокупности игроков, этого может быть достаточно для достижения требуемого результата.

Некоторые из таких просоциальных предпочтений бывают врожденными, заложенными в человека в ходе биологической эволюции. Однако чаще они становятся продуктом социального или культурного развития. В большинстве обществ предпринимаются намеренные усилия, чтобы развить у детей просоциальное мышление в процессе социализации в семьях и школах. Усиление таких предпочтений наблюдается в ходе экспериментов с ультимативными и диктаторскими играми, о которых шла речь в . Когда подобные эксперименты проводятся с детьми разного возраста, самые маленькие дети ведут себя эгоистично. Однако к восьми годам у них развивается достаточно сильное чувство равенства. После этого у детей формируются истинные просоциальные предпочтения (хотя время от времени они демонстрируют эгоистичное поведение) и наконец чувство справедливости, свойственное взрослому человеку. Таким образом, на протяжении длительного процесса обучения и накопления опыта общепринятые нормы постепенно внедряются в предпочтения людей.

Тем не менее у разных людей может быть разная степень принятия просоциальных предпочтений, и этого может оказаться недостаточно для решения проблем коллективного действия. Многие люди имеют весьма широкое представление о том, что такое социально кооперативное действие в большинстве ситуаций, однако отдельные люди подвержены соблазну пойти на обман. Следовательно, для обеспечения кооперативных действий необходима система внешних санкций или мер наказания. Мы называем правила поведения, которые находят широкое понимание, но не выполняются автоматически, принудительными нормами.

В мы подробно описали несколько методов достижения кооперативного исхода в играх категории «дилемма заключенных», в том числе повторение, взыскание (или вознаграждение) и лидерство. Тогда нас главным образом интересовали примеры дилеммы заключенных с двумя участниками. Эти методы (с некоторыми коррективами) применимы и для принудительного выполнения норм в случае проблем коллективного действия в больших группах.

Как мы подчеркивали в , повторение — самый важный из методов, поэтому мы уделим ему повышенное внимание. Повторение позволяет достичь кооперативного исхода в качестве равновесия действий отдельных игроков в повторяющейся дилемме заключенных посредством создания перспективы того, что обман приведет к прекращению сотрудничества. В более общем плане все, что необходимо для поддержания сотрудничества, — это осознание каждым игроком того, что его личные выигрыши от обмана преходящи и что их место быстро займет более низкий выигрыш по сравнению с тем, что игрок мог бы получить в случае кооперативного поведения. Для того чтобы игроки понимали, что обман им невыгоден в долгосрочной перспективе, он должен быть быстро обнаружен, а последующее наказание (уменьшение будущих выигрышей) — эффективно, неминуемо и болезненно.

В этом отношении у группы есть одно важное преимущество перед парой отдельных людей. У двух человек может и не быть повода часто общаться, но каждый из них, по всей вероятности, будет постоянно взаимодействовать с кем-то из группы. Следовательно, искушение игрока Б обмануть игрока А может подавить страх того, что другие игроки, например В, Г и т. д., с которыми он встретится в будущем, накажут его за это. Экстремальную ситуацию, в которой двустороннее взаимодействие не повторяется, а наказание должна осуществить от чьего-то имени третья сторона, можно описать словами Йоги Берра: «Всегда ходите на похороны других, иначе они не придут на ваши».

Однако у группы, когда речь заходит о поддержании хорошего поведения в ходе повторяющегося взаимодействия, есть ряд недостатков по сравнению с прямым двусторонним контактом. Требуемая скорость и безошибочность обнаружения обмана и наказания мошенников снижается по мере увеличения численности группы. В небольших деревенских общинах можно наблюдать массу примеров успешного сотрудничества, которое было бы немыслимым в большом городе или в штате.

Для начала поговорим о выявлении обмана, что всегда непросто. В большинстве реальных ситуаций выигрыши зависят не только от действий игроков, но и от тех или иных случайных флуктуаций. Даже в игре с двумя участниками один игрок, получив низкий выигрыш, не может быть уверен, что другой его обманул: это могло быть следствием какого-либо случайного события. По мере увеличения количества игроков возникает дополнительный вопрос: если кто-то и обманул, то кто именно? Наказывать кого-то без веских оснований и уверенности в том, что этот человек действительно виновен, не только аморально, но и контрпродуктивно. Мотивация к сотрудничеству ослабевает, если даже кооперативные действия могут по ошибке повлечь за собой наказание.

Кроме того, в играх с большим количеством участников, даже если обман обнаружен и известно, кто на него пошел, об этом необходимо быстро и точно сообщить другим игрокам. Для этого группа должна быть достаточно маленькой либо иметь эффективную сеть коммуникации или распространения слухов. К тому же у игроков не должно быть причин выдвигать против кого-то ложные обвинения.

И наконец, даже после выявления обмана и информирования об этом всех членов группы необходимо как-то наказать обманщика (принудительное выполнение социальной нормы). Зачастую третьей стороне приходится нести определенные личные издержки в связи с осуществлением наказания. Например, если игроку В поручено наказать игрока Б, обманувшего игрока А, то игроку В, возможно, придется пожертвовать прибыльной сделкой, которую он планировал заключить с игроком Б. В таком случае применение наказания само по себе становится игрой с коллективным действием и наличием искушения «уклониться» от исполнения наказания. Общество могло бы организовать второй круг наказаний за уклонение, но это, в свою очередь, обусловит еще одну проблему коллективного действия! Тем не менее создается впечатление, что у людей сформировался инстинкт, благодаря которому они получают личное удовлетворение от наказания обманщиков, даже если сами не являются их жертвами. Интересно, что принцип «даже несмотря на высокие личные издержки, необходимо ввести санкции по отношению к нарушителям принудительных социальных норм», по всей вероятности, сам стал общепринятой нормой.

Действие норм усиливается, когда подавляющее большинство членов общества их придерживается, и теряет силу, если они часто нарушаются. До появления государства всеобщего благосостояния, когда люди, столкнувшись со сложными экономическими временами, вынуждены были полагаться исключительно на помощь семьи, друзей и ближайших членов малой социальной группы, трудовая этика представляла собой норму, сдерживающую соблазн ослабить собственные усилия и незаслуженно пользоваться поддержкой окружающих. Но как только государство взяло на себя обязательства по обеспечению поддержки и выплаты пособий по безработице, то есть когда предоставление социальной помощи стало обязательным, эта норма трудовой этики утратила силу. После резкого повышения уровня безработицы в Европе в конце 1980-х — начале 1990-х годов значительная доля населения воспользовалась официальной системой социальной поддержки, после чего эта норма ослабла еще больше.

В разных обществах и культурных группах могут сформироваться разные соглашения и нормы, направленные на достижение одной и той же цели. На бытовом уровне в каждой культуре есть свой набор хороших манер, таких как приветствие незнакомых людей, выражение благодарности за угощение и т. д. При встрече представителей разных культур между ними могут возникнуть недоразумения. Не менее важно, что в каждой компании или офисе придерживаются своих подходов. Хотя различия между традициями и нормами едва уловимы, многие слияния потерпели неудачу именно из-за конфликта корпоративных культур.

Далее рассмотрим коллективные игры в виде игры в труса. Здесь характер способа решения проблемы коллективного действия зависит от того, будет ли получен максимальный социальный выигрыш, если каждый член группы примет участие в совершении соответствующего действия (в эта игра обозначена как версия I игры в труса) или если кто-то сотрудничает, а кому-то можно отказаться от него (версия II игры в труса). В первой версии игры в труса, в которой каждый игрок заинтересован уклониться от выполнения действия, проблема очень напоминает проблему поддержания сотрудничества в дилемме заключенных, поэтому все приведенные выше комментарии в ее отношении применимы и к этой игре. Вторая версия игры в труса отличается: в чем-то она легче, а в чем-то сложнее. После распределения ролей между участниками и уклонистами ни у кого нет личного стимула сменить стратегию: если другому водителю поручена роль «ехать прямо», то вам лучше свернуть, и наоборот. Следовательно, если в силу традиции необходимо достичь равновесия, его можно обеспечить без дальнейшего социального вмешательства, например, в виде санкций. Но при таком равновесии игроки, уклоняющиеся от совершения действия, получают более высокие выигрыши, чем выполняющие его. Подобное неравенство способно создать проблемы в данной игре: серьезные конфликты и противоречия могут поставить под угрозу саму структуру общества. Часто такая проблема решается посредством повторения. Роли тех, кто участвует в совершении действия, и тех, кто уклоняется от них, можно поочередно менять, чтобы уравновесить выигрыши в долгосрочной перспективе.

Иногда проблема дифференцированных выигрышей во второй версии дилеммы заключенных или игры в труса «решается» не путем восстановления равенства, а посредством притеснения или принуждения, когда доминируемая подгруппа общества вынуждена принять более низкий выигрыш, тогда как доминирующая подгруппа получает более высокий выигрыш. На протяжении всей истории человечества во многих обществах работу по разделке туш животных в принудительном порядке поручали определенным подгруппам или кастам. Наглядный пример этой практики — дискриминация расовых и этнических меньшинств или женщин. Как только устанавливается такая система, ни один член притесняемой группы не может ничего сделать, чтобы повлиять на ситуацию. Угнетенные должны объединить усилия и действовать как единая группа, чтобы изменить всю систему, что само по себе представляет еще одну проблему коллективного действия.

И наконец, рассмотрим роль лидерства в решении проблем коллективного действия. В мы отмечали, что, если в игре участвуют игроки разного масштаба, дилемма заключенных может исчезнуть сама по себе, поскольку более крупный игрок может быть заинтересован в продолжении сотрудничества и по этой причине примет обман более мелкого игрока. Здесь же мы отдаем должное другому типу величия — величию сердца. Хотя у людей в большинстве групп разные предпочтения, во многих группах есть один или несколько человек, получающих истинное удовлетворение от личного вклада в благополучие всей группы. Если таких людей достаточно для выполнения текущей задачи, то проблема коллективного действия исчезает. Большинство школ, церквей, местных больниц и других важных для общества учреждений полагаются на работу волонтеров. Это решение, как и многие другие, более эффективно в небольших группах, где результаты действий их членов непосредственно видны их благодетелям, которые заинтересованы в умножении добрых дел.

В. Практическое применение

В книге «Управляя общим» Элинор Остром приводит ряд примеров решения проблем общих ресурсов на местном уровне. Большинство из них предполагают использование особенностей конкретной ситуации для создания системы обнаружения проблем и наказания виновных. Например, между членами одной рыбацкой общины на побережье Турции применяется такой метод, как ротация участков для вылова рыбы. Человек, получивший разрешение ловить рыбу на определенном участке, сразу же заметит и сообщит о нарушителе, который попытается рыбачить на том же участке. Многие другие пользователи ресурсов, находящихся в общей собственности, в том числе общинных пастбищ в средневековой Англии, на самом деле ограничивали к ним доступ и боролись с их чрезмерной эксплуатацией, предоставляя сложные, негласные, но вполне понятные права отдельным людям. В каком-то смысле такое решение позволяет обойти проблему общих ресурсов, разделив ресурс на несколько более мелких единиц, находящихся в частной собственности.

Самая поразительная особенность примеров Остром — их огромное разнообразие. Одни дилеммы заключенных, касающиеся использования общих ресурсов, которые изучала Остром, были решены посредством частной инициативы группы людей, вовлеченных в соответствующую дилемму; другие — путем внешнего вмешательства со стороны общественности или правительства. Иногда дилемма не решалась вообще и группа оставалась в ловушке исхода, при котором все ее члены предпочитали уклониться от решения проблемы. Тем не менее, несмотря на кажущееся разнообразие, Остром выделяет ряд общих характеристик, облегчающих проблему решения дилемм заключенных в контексте коллективного действия: 1) обязательно наличие поддающейся идентификации и стабильной группы потенциальных участников; 2) преимущества сотрудничества должны быть достаточно заманчивыми, чтобы это могло покрыть все затраты на мониторинг и принудительное соблюдение правил сотрудничества; 3) важно, чтобы члены группы могли взаимодействовать друг с другом. Последнее условие обеспечивает достижение нескольких целей. Во-первых, такая коммуникация помогает установить четкие нормы: все знают, какого поведения от них ожидают, какой обман недопустим и какие санкции будут применены по отношению к обманщикам. Кроме того, наличие коммуникации позволяет информировать об эффективности обнаружения механизма обмана, что способствует росту доверия между членами группы и устранению любых подозрений любого участника, если он считает, что придерживается установленных правил, тогда как другие их безнаказанно нарушают. И последнее: коммуникация между членами группы позволяет им отслеживать эффективность действующих договоренностей и по мере необходимости улучшать их. Все эти требования поразительно напоминают выводы, сделанные нами в на основании теоретического анализа дилеммы заключенных и информации о турнирах Аксельрода.

Изучение Остром жизни рыбацкой деревни также помогло понять, что можно предпринять, если коллективный оптимум требует, чтобы разные люди выполняли разные действия, с учетом того, что при этом одни будут получать более высокий выигрыш, чем другие. В случае повторяющегося взаимодействия можно организовать ротацию более выгодной позиции среди участников, тем самым гарантируя определенное чувство равенства в долгосрочной перспективе.

По мнению Остром, внешняя сторона, обеспечивающая выполнение установленных правил, не в состоянии достаточно четко и оперативно выявить обман и применить наказание. Поэтому типичная точка зрения, согласно которой для решения проблем коллективного действия необходима централизованная или государственная политика, часто оказывается ошибочной. Еще один пример — сельские общины, или «коммуны», в России конца XIX столетия. Этим коммунам удалось решить многие проблемы коллективного действия в сфере ирригации, севооборота, управления использованием лесов и пастбищ, а также строительства и ремонта дорог и мостов. «Деревня… не была раем в плане общинной гармонии. …Просто коллективная деятельность во многих случаях отвечала личным интересам отдельных крестьян». Реформаторы царского правительства начала XX века, так же как и советские революционеры 1920-х годов, потерпели неудачу не только потому, что старая система настолько овладела умами крестьян, что они сопротивлялись всему новому, но еще и потому, что реформаторы не смогли понять роль некоторых широко распространенных практик в решении проблем коллективного действия, а потому и не сумели заменить их равноценными альтернативами.

Различия между маленькими и большими группами хорошо проиллюстрировал Авнер Грейф, сравнивший две группы торговцев в странах средиземноморского бассейна в средневековые времена. Магрибские торговцы представляли собой группу еврейских купцов, которые полагались на большую семью и прочные социальные связи. Если один член группы обманывал другого, жертва обмана сообщала об этом остальным, рассылая письма. При наличии веских доказательств вины больше ни один член группы не вел дел с обманщиком. Система была прекрасно налажена и хорошо работала в случае мелкой торговли. Но когда торговля распространилась по всем странам Средиземноморья, система коллективного контроля помешала дальнейшему развитию магрибской торговли: группа не смогла найти достаточно близких или надежных доверенных лиц, чтобы использовать в этих странах новые торговые возможности.

Напротив, генуэзские торговцы создали более официальную правовую систему. Любой контракт необходимо было регистрировать в центральных органах власти в Генуе. Тот, кто становился жертвой обмана или нарушения контракта, должен был направить жалобу в органы власти, которые проводили расследование и взимали с обманщиков надлежащие штрафы. Эту систему, при всех ее проблемах с обнаружением обмана, можно было без труда модифицировать в случае расширения торговли. По мере роста экономики и мировой торговли мы наблюдаем аналогичный переход от сплоченных групп к более отстраненным торговым отношениям и от обеспечения выполнения правил на основании повторяющегося взаимодействия к применению официального законодательства.

Идея о том, что небольшие группы более эффективно решают проблемы коллективного действия, стала основной темой книги Манкура Олсона The Logic of Collective Action («Логика коллективного действия») и позволила сделать одно важное наблюдение в политологии. В демократическом обществе все избиратели имеют равные политические права, поэтому предпочтения большинства должны доминировать. Однако известно немало случаев, когда этого не происходит. Как правило, та или иная политика имеет положительные последствия для одних групп и отрицательные для других. Для того чтобы добиться принятия предпочтительной для себя политики, группа должна предпринять определенные политические действия, такие как лоббирование, распространение информации, пожертвования на ведение избирательной кампании и т. д. Но для этого группа должна решить проблему коллективного действия, поскольку каждый ее член может попытаться уклониться и извлечь для себя выгоду из действий других членов группы. Если небольшие группы лучше справляются с этой проблемой, то политический курс, проистекающий из политического процесса, будет отображать их предпочтения, даже несмотря на то что другие группы, которым не удалось создать организованную структуру, более многочисленны и терпят убытки, размер которых превышает прибыль успешных групп.

Наиболее яркий пример политических мер, отображающих предпочтения организованной группы, связан с торговой политикой. Действующие в стране ограничения на импорт помогают отечественным производителям, чьи товары конкурируют с импортными, но ущемляют интересы потребителей обеих категорий товаров, поскольку цены на них выше, чем были бы в случае отсутствия ограничений на импорт. Отечественных производителей немного, а потребители — почти все население, и, как правило, общая сумма их убытков гораздо больше общего объема прибыли производителей. Политические соображения, основанные на численности электората, и экономические соображения, такие как прибыли и убытки, позволяют рассчитывать на победу потребителей на этой политической арене или хотя бы на какую-то поддержку идеи о том, что ограничения на импорт следует отменить, однако этого не происходит. Более мелкие и сплоченные ассоциации производителей могут лучше организовать выполнение политического действия, чем многочисленные, но разрозненные потребители.

Более 70 лет назад американский политолог Элмер Шаттшнайдер впервые представил подробное документальное подтверждение и анализ влияния политического давления на торговую политику. Он признал тот факт, что «способность группы к самоорганизации существенно сказывается на ее деятельности», но не разработал системную теорию того, что именно определяет такую способность. Анализ Олсона и других исследователей улучшил наше понимание этого вопроса, однако триумф политического давления над экономикой продолжается в торговой политике до сих пор. Например, в конце 1980-х годов политика США в области производства сахара обошлась каждому из 240 миллионов жителей страны в 11,5 доллара в год, что в общей сложности составило 2,75 миллиарда долларов; при этом доход около 10 000 фермеров, выращивающих сахарную свеклу, увеличился на 500 000 долларов в расчете на одного фермера, или в целом на 1 миллиард долларов. Чистый убыток американской экономики составил 1,75 миллиарда долларов. Каждый неорганизованный потребитель продолжает молча нести свою небольшую долю издержек; многие даже не осознают, что платят за свое пристрастие к сладкому на 11,5 доллара в год больше.

Если наш обзор теории и практики решения проблем коллективного действия кажется вам слишком разноплановым и не содержащим четкого краткого описания сути происходящего, то это потому, что сами проблемы столь же разнообразны и решение каждой из них зависит от ее специфики. Единственный общий вывод, который мы можем сделать, касается понимания того, насколько важно предоставить право самим участникам коллективного действия найти решение, воспользовавшись локальным знанием ситуации, возможностью мониторинга действий других членов общества, направленных на сотрудничество или уклонение от него, а также шансом применить санкции к уклоняющимся посредством различных вариантов непрерывного взаимодействия в рамках данной социальной группы.

В заключение хотелось бы высказать одно предостережение. Возможно, после обсуждения проблем коллективного действия у вас появится ощущение, что личная свобода неизменно приводит к пагубным результатам, которые можно и нужно исправлять с учетом социальных норм и санкций. Но не стоит забывать, что, кроме проблем коллективного действия, общество сталкивается и с другими проблемами, причем некоторые из них лучше решать посредством личной инициативы, а не совместных усилий. Общество может быть слишком консервативным и автократическим, оказавшись в ловушке своих норм и традиций и подавляя инновации, которые зачастую становятся ключом к экономическому росту. Коллективное действие может стать коллективным бездействием.

 

5. «Помогите!»: игра в труса со смешанными стратегиями

В ходе анализа проблем с коллективным действием в контексте игры в труса мы рассматривали только равновесия в чистых стратегиях. Однако из мы знаем, что в таких играх есть также равновесия в смешанных стратегиях. В задачах с коллективным действием каждый участник думает: «Мне лучше подождать, пока наберется достаточное количество желающих поучаствовать, тогда я мог бы уклониться от этого; хотя, опять же, они тоже могут отказаться, и тогда мне придется вмешаться». Смешанные стратегии прекрасно отображают характер подобных колебаний. Наша последняя история — весьма драматичный, возможно, даже жуткий пример применения такого равновесия в смешанных стратегиях.

В 1964 году в Нью-Йорке (в районе Кью-Гарденс, Квинс) в результате зверского нападения, длившегося более получаса, была убита женщина по имени Китти Дженовезе. Все это время она кричала, но, несмотря на то что многие слышали ее крики, а три человека даже были свидетелями происходящего, никто не поспешил ей на помощь и даже не вызвал полицию.

История произвела сенсацию, и сразу же нашлось несколько теорий, объясняющих случившееся. Пресса и большая часть общественности увидели в этом случае подтверждение их убежденности в том, что ньюйоркцы (или жители мегаполисов, или американцы, или люди вообще) совершенно безразличны к судьбе ближнего.

Тем не менее даже небольшой самоанализ или наблюдение убедят вас в том, что люди заботятся о благополучии других, даже незнакомых, людей. Социологи предложили иное объяснение произошедшего под названием плюралистическое неведение. В его основе лежит следующая идея: никто не может быть уверен в том, что именно происходит, действительно ли нужна помощь и в каком объеме. Люди смотрят друг на друга в поисках подсказок или советов по таким вопросам и в этом свете пытаются интерпретировать поведение окружающих. Если они видят, что никто ничего не предпринимает, они делают вывод, что помощь, скорее всего, не нужна, и по этой причине тоже самоустраняются. Это объяснение обладает определенной интуитивной привлекательностью, но неубедительно в случае Китти Дженовезе. Можно с высокой степенью уверенности предположить, что кричащей женщине нужна помощь. Что думали при этом очевидцы? Что в их мрачном районе снимают кино? Если да, то где прожекторы, камеры, режиссер и прочие члены съемочной группы?

Более подходящее объяснение сводилось бы к тому, что, хотя каждый очевидец пережил настоящий шок от увиденного и получил бы истинное личное удовольствие, если бы Китти удалось спасти, он должен привести это в соответствие с издержками участия в происходящем. Ведь придется назвать свое имя, позвонив в полицию, затем выступить в суде в качестве свидетеля и т. д. Таким образом, мы видим, что каждый человек может решить, что ему лучше подождать, пока в полицию позвонит кто-то другой, в надежде на то, что сам он получит преимущество «безбилетника» в виде удовлетворенности в связи с успешным спасением жертвы.

У социальных психологов несколько иная версия идеи «безбилетника», которую они обозначают термином диффузия ответственности. Согласно ей все люди, вовлеченные в сложившуюся ситуацию, понимают, что помощь необходима, но поскольку не поддерживают прямых контактов друг с другом, не могут договориться о том, кто именно ее окажет. Каждый человек может считать, что ответственность за оказание помощи лежит на ком-то другом. Чем больше группа, тем выше вероятность того, что каждый человек понадеется, что поможет кто-то другой и это позволит ему оградить себя от возможных проблем и издержек в будущем.

Социальные психологи провели ряд экспериментов для проверки этой гипотезы. Они разыгрывали ситуации, в которых кому-то требовалась помощь разных типов, в разных местах, в присутствии разных групп людей. Среди прочего авторы экспериментов обнаружили, что чем больше толпа, тем меньше вероятность получить помощь.

Концепция диффузии ответственности объясняет этот вывод, но не до конца. Согласно ей, чем больше толпа, тем меньше вероятность того, что один человек поможет. Хотя из большого количества людей нужен всего один человек, который начал бы действовать, вызвал полицию и тем самым оказал помощь. Но чтобы снизилась вероятность того, что хотя бы один человек поможет, нужно, чтобы вероятность того, что любой человек поможет, снижалась достаточно быстро, чтобы компенсировать общее количество потенциальных помощников. Для того чтобы выяснить, действительно ли это так, понадобится анализ на основании теории игр, который мы проведем ниже.

Мы рассмотрим только один аспект диффузии ответственности, когда не происходит осознанная координация действий, и оставим в стороне остальные сложности в связи с информацией и выводом. Таким образом, мы будем исходить из следующего предположения: все считают, что помощь необходима и это стоит понесенных издержек.

Допустим, группа насчитывает N человек. Действие приносит каждому из них выгоду B. Для его совершения нужен всего один человек; большее количество будет избыточным. Любой, кто предпримет необходимое действие, понесет при этом издержки C. Мы исходим из того, что B > C, то есть любому члену группы стоит потратить какие-то усилия на совершение действия, даже если больше никто этого не сделает. Таким образом, необходимость выполнить действие абсолютно обоснованна.

Проблема в том, что любой, кто предпримет действие, получит выигрыш B, но понесет издержки C (то есть чистый выигрыш составит B — C), тогда как он получил бы более высокий выигрыш B, если бы это действие совершил кто-то другой. Следовательно, у каждого члена группы есть соблазн переложить задачу на кого-то другого, а самому воспользоваться преимуществами достигнутого в итоге результата. Каким будет равновесие или исход игры, если так рассуждают все N членов группы?

Если N = 1, то это не столько игра, сколько проблема принятия решения одним человеком. Он получит выигрыш B — C > 0, если выполнит необходимое действие, и выигрыш 0, если не сделает этого. Поэтому он решает помочь.

Если N > 1, мы имеем игру в стратегическое взаимодействие с несколькими равновесиями. Давайте начнем с исключения некоторых возможностей. При N > 1 не может быть равновесия Нэша в чистых стратегиях, при котором все члены группы совершают необходимое действие, поскольку тогда любому из них было бы выгоднее стать «безбилетником». Точно так же не может быть равновесия Нэша в чистых стратегиях, когда никто не совершает необходимого действия, так как при условии, что никто ничего не станет делать (вспомните, что, согласно предположению Нэша, каждый игрок воспринимает стратегии других игроков как факт), ни одному человеку нет смысла действовать.

Тем не менее равновесия Нэша, в которых действие предпримет в точности один человек, все же существуют; на самом деле есть ровно N таких равновесий, по одному на каждого члена группы. Однако, когда каждый человек принимает решение в индивидуальном порядке, отдельно от остальных, нет никакого способа договориться о том, кто именно совершит необходимое действие. Даже если бы члены группы предприняли попытку такой координации, они могли бы при обсуждении, кто несет ответственность за совершение действия, не прийти к единому мнению, во всяком случае пока еще остается время для оказания помощи. Следовательно, интерес представляет только анализ симметричных равновесий, в которых у всех членов группы одинаковые стратегии.

Мы уже видели, что не может быть равновесия, при котором все N членов группы придерживались бы одной и той же чистой стратегии. Значит, мы должны выяснить, возможно ли равновесие, при котором все они придерживались бы одной и той же смешанной стратегии. На самом деле смешанные стратегии весьма привлекательны в данном контексте. Члены группы изолированы друг от друга, и каждый пытается угадать, что будут делать другие. Каждый размышляет так: «Может, мне следует позвонить в полицию… но вдруг это сделает кто-то другой… а если никто этого не сделает?» Каждый член группы в какой-то момент прерывает эту цепочку рассуждений и делает последнее, о чем подумал, но у нас нет способа определить, что именно это будет. В смешанной стратегии также присутствует этот принцип цепочки догадок, которая прерывается в произвольный момент времени.

Итак, допустим, что P — это вероятность того, что любой из членов группы не станет предпринимать необходимое действие. Если один человек готов смешать стратегии, ему должно быть безразлично, какую именно из двух чистых стратегий выбрать — действовать или нет. Совершение действия гарантированно обеспечит ему выигрыш (B — C), а отказ — выигрыш 0, если ни один из оставшихся (N — 1) членов группы не станет действовать, и выигрыш B, если хотя бы один человек предпримет необходимое действие. Поскольку вероятность того, что любой из членов группы не станет действовать, равна P, и учитывая, что они принимают решения независимо друг от друга, вероятность того, что никто из оставшихся (N — 1) членов группы не станет действовать, составит PN — 1 , а вероятность того, что хотя бы один человек выполнит необходимое действие, равна (1 — PN — 1 ). Следовательно, ожидаемый выигрыш одного человека в случае, если он не будет действовать, равен

0 × P N — 1  + B (1 — P N — 1 ) = B (1 — P N — 1 ).

И ему безразлично, предпримет он необходимое действие или нет, при таком условии:

Обратите внимание, как условие безразличия одного отдельно взятого игрока определяет вероятность, с которой другие игроки будут смешивать свои стратегии.

Получив вероятность равновесной комбинации стратегий, мы теперь можем проанализировать, как она меняется по мере изменения численности группы N. Помните, что C/B < 1. По мере увеличения N от 2 до бесконечности степень 1/(N — 1) снижается от 1 до 0. В таком случае C/B, взятое в этой степени (то есть P), увеличивается от C/B до 1. Вспоминаем, что P — это вероятность того, что ни один член группы не совершит необходимого действия. Следовательно, вероятность, что кто-нибудь из членов группы предпримет необходимое действие (а именно 1 — P), снижается от 1 — C/B = (B — C)/B до 0.

Иными словами, чем больше людей, тем ниже вероятность, что кто-нибудь из них предпримет необходимое действие. На интуитивном уровне это правильно и вполне соответствует концепции диффузии ответственности. Однако это не позволяет нам сделать вывод, что в более многочисленной группе вероятность оказания помощи меньше. Как было сказано выше, помощь требует действий только одного человека. Поскольку увеличивается количество людей, каждый из которых предпримет необходимое действие с убывающей вероятностью, мы не можем прийти к однозначному выводу, что вероятность того, что хотя бы один человек будет действовать, уменьшится. Для того чтобы понять, так ли это, понадобятся дополнительные вычисления.

Учитывая, что N членов группы в случайном порядке, независимо друг от друга, выбирают стратегии в равновесии Нэша, вероятность Q того, что ни один из них не окажет помощи, составляет

Когда N увеличивается от 2 до бесконечности, N/(N — 1) уменьшается от 2 до 1, а значит, Q увеличивается от (C/B)2 до C/B. Соответственно, вероятность того, что как минимум один человек поможет (то есть 1 — Q), уменьшится от 1 — (C/B)2 до 1 — C/B.

Итак, наши точные расчеты подтверждают гипотезу: чем больше группа, тем меньше вероятность предоставления помощи. Однако вероятность не снижается до нуля даже в очень больших группах, а вместо этого выходит на один уровень, принимая определенное положительное значение, а именно (B — C)/B, зависящее от преимуществ и издержек данного действия для каждого члена группы.

Мы видим, как анализ, основанный на теории игр, подтверждает идеи из области социальной психологии, с которых мы начали. Теория диффузии ответственности позволяет нам пройти часть пути, а именно до вывода о том, что любой человек с меньшей вероятностью совершает необходимое действие, становясь частью более крупной группы. Однако требуемый вывод о том, что более крупные группы с меньшей вероятностью оказывают помощь, нуждается в более точном вычислении вероятности на основании анализа смешивания стратегий каждым отдельно взятым членом группы и полученного в итоге интерактивного равновесия в данной игре.

А теперь хотим спросить: неужели смерть Китти Дженовезе была напрасной? Неужто теории плюралистического неведения и диффузии ответственности, а также игры «безбилетников» по-прежнему проявляются в снижении вероятности действия отдельного человека в постоянно растущих больших городах? Возможно, и нет. Джон Тирни из New York Times публично восхвалял достоинства «городских героев», которые воспитывают в людях цивилизованность посредством немедленного наказания тех, кто демонстрирует неприемлемое поведение — разбрасывает мусор, шумит и вообще относится к категории отбросов общества, заслуживающих порицания. Такие «городские герои», по сути, блюстители выполнения норм сотрудничества в обществе. Анализируя действия известных «героев», Тирни напоминает всем нам: «Необходимо мобилизовать новых героев! В это самое мгновение люди зря тратят время на чтение, тогда как на улицах попираются нормы. …Вы живете не одни в этом мире! Вы обеспечили выполнение нормы сегодня?» Другими словами, нам необходимы социальные нормы, а также избранные люди, которые сделали норму соблюдения норм смыслом своей жизни.

 

Резюме

Как правило, в играх со многими участниками присутствуют проблемы коллективного действия. Общую структуру коллективных игр можно представить в виде дилеммы заключенных, игры в труса или игры в доверие. Самая большая трудность, связанная с такими играми в любой форме, состоит в том, что равновесие Нэша, проистекающее из рационального выбора отдельных игроков, может не быть социально оптимальным исходом, который максимизирует сумму выигрышей всех игроков.

Когда в играх с коллективным действием действие одного игрока оказывает влияние на выигрыши всех остальных игроков, проявляются внешние эффекты, или экстерналии. Они могут быть положительными или отрицательными и способны привести к продиктованным личными интересами исходам, которые не будут социально оптимальными. Когда действия создают отрицательные сопутствующие эффекты, с точки зрения общества в целом они чересчур активно применяются; когда действия обусловливают положительные сопутствующие эффекты, они недостаточно активны. При наличии положительных сопутствующих эффектов существует такая дополнительная возможность, как положительная обратная связь; при этом в игре может быть несколько равновесий Нэша.

Проблемы коллективного действия волновали ученых из разных областей науки на протяжении многих столетий. В некоторых ранних трудах говорилось об отсутствии в этой ситуации какой-либо перспективы, тогда как другие предлагали кардинальные решения. Авторы последних работ на эту тему признают, что проблемы коллективного действия возникают в самых разных сферах и их универсального решения не существует. Исследования, проведенные в области социологии, показывают, что социальная традиция, или соглашение, может привести к кооперативному поведению. Другие варианты решений связаны с формированием норм приемлемого поведения. Некоторые из этих норм привносятся в виде выигрышей отдельного человека, другие необходимо обеспечивать в принудительном порядке посредством введения санкций в ответ на некооперативное поведение. Авторы большинства работ по этой теме сходятся во мнении, что небольшие группы более эффективно решают проблемы коллективного действия, чем большие.

В играх, проходящих в крупных группах, имеет место диффузия ответственности, которая может обусловить поведение, когда отдельно взятый человек ждет, чтобы другие выполнили необходимое действие, а он взял на себя роль «безбилетника», то есть извлек выгоду из этого действия. Когда кому-то требуется помощь, вероятность ее предоставления снижается по мере увеличения размера группы людей, которые могут ее оказать.

 

Ключевые термины

Безбилетник

Внешний эффект

Диффузия ответственности

Замыкание

Маржинальная личная выгода

Маржинальная социальная выгода

Маржинальный сопутствующий эффект

Неисключаемые блага

Неконкурентные блага

Норма

Плюралистическое неведение

Положительная обратная связь

Принуждение

Притеснение

Проблема коллективных действий

Санкция

Соглашение

Сопутствующий эффект

Социальный оптимум

Традиция

Чистое общественное благо

Экстерналия

 

Упражнения с решениями

S1. Предположим, 400 человек выбирают между действиями X и Y. Относительные выигрыши от этих двух действий зависят от того, сколько из 400 человек выберет действие X и сколько — действие Y. Эти выигрыши отображены на представленном ниже графике, но вертикальная ось не обозначена, а значит, вам неизвестно, что именно показывают эти линии — выигрыши или издержки, связанные с этими двумя действиями.

a) Вам сообщают, что исход, при котором 200 человек выберут действие X, — это неустойчивое равновесие. Если 100 человек уже выбрали действие X, то увеличится или уменьшится со временем количество людей, выбирающих действие X? Почему?

b) Для того чтобы график соответствовал поведению, описанному вами в пункте a, должны ли представленные на нем линии быть обозначены как издержки или выгоды от действий X и Y? Обоснуйте свой ответ.

S2. Группа состоит из 100 членов, каждый из которых выбирает, участвовать ли ему в общем проекте. Если n человек решат участвовать, то каждый получит выгоду p(n) = n, а каждый из (100 — n) уклонившихся получит выгоду s(n) = 4 + 3n.

a) Это пример дилеммы заключенных, игры в труса или игры в доверие?

b) Составьте формулу для определения общей выгоды группы.

c) Покажите в графическом либо в математическом виде, что группа получит максимальную общую выгоду при n = 74.

d) Какие трудности возникнут при попытке привлечь к реализации проекта ровно 74 члена группы и позволить остальным 26 членам группы отказаться от него?

e) Как группа может попытаться преодолеть эти трудности?

S3. Рассмотрим небольшой географический регион с общей численностью населения 1 миллион человек. Каждый человек может выбрать, в каком из двух городов жить, Альфавилле или Бетавилле. Какое-то время преимущества проживания в том или ином городе для каждого человека возрастают по мере роста размера города (в крупных городах более развитая инфраструктура и т. д.), но после какого-то момента начинают уменьшаться (в связи с дорожными заторами и т. п.). Если x — доля людей, которые живут в том же городе, что и вы, ваш выигрыш определяется следующими условиями:

x, если 0 ≤ x ≤  0,4,

0,6–0,5 x, если 0,4 <  x ≤  1.

a) Постройте такой же график, как на , показывающий преимущества проживания в двух городах, когда доля жителей одного города по сравнению с другим непрерывно меняется от 0 до 1.

b) Равновесие достигается, либо когда оба города населены и их обитатели получают равные выигрыши, либо когда один город (например, Бетавилль) полностью обезлюдел, а жители другого (Альфавилля) получают более высокий выигрыш, чем первый человек, решивший поселиться в Бетавилле. С помощью построенного графика найдите все равновесия Нэша.

c) Теперь рассмотрите динамику процесса адаптации к изменившимся условиям, когда люди постепенно переезжают в город, жители которого уже получают более высокий выигрыш, чем обитатели другого города. Какие из равновесий, найденных в пункте b, сохранят свою устойчивость при такой динамике? Какие окажутся неустойчивыми?

S4. Допустим, в городе с населением 100 человек строится парк развлечений. Для покрытия затрат на строительство необходимы добровольные пожертвования. Каждого жителя просят внести 100 долларов. Чем больше людей внесут свой вклад в строительство парка, тем крупнее он будет и тем больше польза для каждого горожанина. При этом невозможно не допустить в парк тех жителей города, которые не внесли вклад в его создание: они получат свою долю выгоды в любом случае. Предположим, что, когда из всех жителей города n внесут вклад (n может быть любым целым числом от 0 до 100), выгода каждого жителя в денежных единицах составит n 2 долларов.

a) Допустим, сначала никто не вносит вклад. Будучи мэром города, вы хотели бы, чтобы все горожане сделали пожертвование, и можете уговорить некоторых из них. Какое минимальное количество жителей города вам нужно убедить, чтобы остальные добровольно присоединились к проекту?

b) Найдите равновесия Нэша в игре, в которой каждый житель города решает, вносить ли ему вклад в создание парка.

S5. Используйте идею кейнсианской безработицы, описанную в , в игре с соответствующими характеристиками и покажите множество равновесий в игре на графике. Отобразите уровень производства (национальный продукт) на вертикальной оси как функцию уровня спроса (национального дохода) на горизонтальной оси. Равновесие достигается, когда национальный продукт равен национальному доходу, то есть когда функция этих двух показателей пересекает линию под углом 45 градусов. При каких формах этой функции возможно множество равновесий? Почему вероятно существование таких форм в реальности? Предположим, доход увеличивается, когда текущий объем производства превышает текущий доход, и снижается, когда текущий объем производства меньше текущего дохода. Какие равновесия устойчивы и какие неустойчивы при таком динамическом процессе?

S6. Составьте краткое описание стратегической игры со многими участниками, свидетелем или участником которой вы были и в которой выигрыши отдельных игроков зависели от количества других игроков и их действий. Попытайтесь проиллюстрировать ее с помощью графика, если это возможно. Опишите исход реальной игры в свете того, что многие подобные игры приводят к неэффективным исходам. Вы видите признаки такого исхода в вашей игре?

 

Упражнения без решений

U1. На представлены выигрыши в обобщенной коллективной игре с двумя участниками. Там были показаны различные неравенства по алгебраическим выигрышам (p(1) и т. д.), которые делают игру дилеммой заключенных. Вам предстоит найти аналогичные неравенства, соответствующие другим типам игр.

a) При каком условии (условиях) в отношении выигрышей эта игра с двумя участниками представляет собой игру в труса? Какое дополнительное условие (условия) делает эту игру версией I игры в труса (которая показана на )?

b) При каком условии (условиях) в отношении выигрышей эта игра с двумя участниками представляет собой игру в доверие?

U2. Группе из 30 студентов задали домашнее задание, состоящее из пяти вопросов. Первые четыре вопроса — обычные задачи, решение которых в сумме дает 90 баллов. А пятый вопрос — игра на взаимодействие всей группы. В задании сказано: «Вы можете выбрать, отвечать на этот вопрос или нет. Если решите отвечать, просто напишите: “Это мой ответ на вопрос 5”. Если решите не отвечать на вопрос 5, ваша оценка за выполнение домашнего задания будет зависеть от количества баллов, набранных за первые четыре задачи. Если решите ответить на вопрос 5, ваша оценка будет определяться так: если на вопрос 5 ответит меньше половины студентов группы, вы получите 10 баллов и они будут добавлены к баллам за четыре предыдущие задачи, после чего вы получите общую оценку за выполнение домашнего задания. Если на вопрос 5 ответит половина или больше студентов группы, вы получите 10 баллов и они будут вычтены из вашей оценки за предыдущих четыре вопроса».

a) Постройте график, отображающий выигрыши от двух возможных стратегий — «ответить на вопрос 5» и «не отвечать на вопрос 5», в зависимости от количества студентов, отвечающих на этот вопрос. Найдите равновесие Нэша в этой игре.

b) Какого результата игры вы бы ожидали, если бы она действительно проводилась в вашей группе в колледже? Почему? Проанализируйте два случая: 1) студенты делают выбор в индивидуальном порядке, не общаясь друг с другом; 2) студенты делают выбор в индивидуальном порядке, но могут заранее обсудить его на форуме на сайте группы.

U3. Существует два маршрута передвижения из пункта А в пункт Б. Один — скоростная автомагистраль, а другой — местные дороги. Выигрыш от использования автомагистрали представляет собой постоянную величину, равную 1,8, независимо от количества водителей, которые по ней ездят. Местные дороги перегружены, когда ими пользуется слишком много людей, но если по ним передвигается недостаточное количество машин, некоторые водители рискуют стать жертвами преступлений. Предположим, что когда x водителей выбирают местные дороги, выигрыш каждого из них от поездки по такому маршруту определяется по формуле 1 + 9x — 10x 2 .

a) Постройте график, отображающий преимущества двух маршрутов передвижения как функцию x, рассматривая x в качестве непрерывной переменной, значения которой могут меняться от 0 до 1.

b) На основании графика, полученного в пункте а, определите все возможные равновесные схемы движения транспорта. Какие из этих равновесий устойчивы? Какие неустойчивы? Почему?

c) Какое значение x обеспечивает максимальный выигрыш всей совокупности игроков?

U4. Предположим, группа студентов численностью 100 человек сравнивает две карьеры — юриста и инженера. Инженер получает чистую заработную плату 100 000 долларов в год независимо от того, сколько студентов выберут эту профессию. Юристы обеспечивают работу друг другу, поэтому по мере увеличения их количества растет и уровень их дохода — до определенного момента. В конечном счете конкуренция между юристами приводит к снижению дохода каждого из них. В частности, если есть N юристов, каждый из них получит 100N — N 2 долларов в год. Годовой объем затрат на ведение юридической практики (офисное помещение, секретарь, помощники юриста, доступ к справочным онлайн-службам и т. д.) составляет 800 000 долларов. Следовательно, при общем количестве N юристов каждый юрист получит чистыми 100N — N 2  —  800 тысяч долларов в год.

a) Постройте график, на котором чистый доход каждого юриста отображен на вертикальной оси, а количество юристов — на горизонтальной. (Нанесите несколько точек, например для 0, 10, 20, …, 90, 100 юристов. Проведите через эти точки линию или используйте компьютерную программу для построения графиков.)

b) Каковы возможные равновесные исходы этой игры в случае, когда игроки делают выбор без координации действий?

c) Допустим, вся группа решает, сколько студентов должны стать юристами с целью обеспечить максимальный общий чистый доход всей группы. Каким будет количество юристов? (Если у вас есть необходимые навыки, воспользуйтесь дифференциальным исчислением, рассматривая N как непрерывную переменную. Если таких навыков нет, примените графические методы или электронную таблицу.)

U5. Группа из 12 стран рассматривает возможность создания валютного союза. Они по-разному оценивают плюсы и минусы такого шага, но каждая страна выиграет от присоединения к союзу и проиграет, отказавшись от него, если большинство стран вступят в союз. Страны упорядочены по степени их желания присоединиться: страна 1 стремится вступить в союз больше всех, а страна 12 — меньше всех. В распоряжении каждой страны два действия — «вступить в валютный союз» и «не вступать в валютный союз». Пусть B(i, n) = 2,2 + n — i — выигрыш страны с порядковым номером i, когда она выбирает стратегию «вступить в валютный союз» и другие n также выбрали эту стратегию. Пусть S(i, n) = i — n — это выигрыш страны с порядковым номером i, когда она предпочитает стратегию «не вступать в валютный союз», а другие n — стратегию «вступить в валютный союз».

a) Покажите, что для страны 1 «вступить в валютный союз» — доминирующая стратегия.

b) Исключив стратегию «не вступать в валютный союз» из стратегий страны 1, покажите, что «вступить в валютный союз» — доминирующая стратегия для страны 2.

c) Продолжив процесс, покажите, что все страны предпочтут стратегию «вступить в валютный союз».

d) Сравните выигрыши в случае такого исхода с выигрышами, которые получат страны при использовании стратегии «не вступать в валютный союз». Сколько стран оказались в худшем положении в результате создания валютного союза?

 

Глава 12. Эволюционные игры

 

* * *

До сих пор мы изучали игры со множеством разных свойств — с одновременными и последовательными ходами; с нулевой и ненулевой суммой; стратегические ходы, позволяющие манипулировать правилами предстоящей игры; однократные, повторяющиеся и даже коллективные игры, в которые одновременно играет большое количество людей. Во всех этих случаях мы опирались на основополагающие правила традиционной теории игр, а именно — что у каждого игрока есть непротиворечивая система ценностей, что он может просчитать последствия своего стратегического выбора и делает выбор, максимально соответствующий его интересам. В процессе обсуждения, особенно при оценке эмпирических данных, мы признавали возможность того, что система ценностей игроков включает в себя заботу о других. А иногда, как при рассмотрении квантильного равновесия в , допускали, что игроки осознают вероятность ошибок. Но мы исходили из предположения, что каждый игрок делает осознанный и продуманный выбор из имеющихся в его распоряжении стратегий.

Однако появившиеся в последнее время теории ставят это предположение под сомнение. Наиболее обоснованная и убедительная критика исходит от психолога и лауреата Нобелевской премии по экономике 2002 года Даниэля Канемана. По его мнению, у людей есть две различные системы принятия решений. Система 1 — инстинктивная и быстрая, система 2 — расчетливая и медленная. Быстрая инстинктивная система может быть частично заложена в мозг человека в процессе эволюции, но также в значительной степени это результат обширного опыта и практики, что развивает интуицию. Эта система очень важна, поскольку экономит много умственных усилий и времени и часто первой применяется при принятии решения. При наличии достаточного количества времени и внимания ее может дополнить или вытеснить расчетливая и более медленная система. Когда инстинктивная система используется на все случаи жизни, накопленный опыт дополняет результат ее работы и может привести к постепенной модификации инстинкта.

Это подразумевает совершенно иной способ ведения и анализа игр. Игроки вступают в игру с инстинктивной системой 1 и разыгрывают стратегию, которую она им подсказывает, хотя эта стратегия может и не быть (или быть) оптимальной в данной ситуации. Положительный результат подкрепляет инстинкт, тогда как отрицательный способствует его постепенному изменению. Безусловно, результат зависит от того, какие стратегии применяет другой игрок или игроки, что зависит от состояния их инстинктивных систем, а это, в свою очередь, — от их опыта и т. д. Нам необходимо определить, куда ведет такой процесс интерактивной динамики инстинктов. В частности, мы должны выяснить, сходится ли он к выбору фиксированных стратегий, и если да, то как этот выбор согласуется с выбором, который бы предписала медленная система. Биологическая теория эволюции и эволюционной динамики предлагает один подход к этому анализу, его мы и опишем в данной главе.

 

1. Основные концепции

Биологическая теория эволюции основана на трех фундаментальных принципах: гетерогенность (неоднородность), приспособленность и отбор. Исходное положение состоит в том, что поведение животных в значительной мере генетически предопределено: комплекс из одного или более генов (генотип) обусловливает схему поведения (поведенческий фенотип). Естественное разнообразие генофонда обеспечивает гетерогенность фенотипов в популяции. Одни модели поведения в большей степени соответствуют сложившимся условиям, чем другие; успех фенотипа выражается в виде количественного показателя под названием приспособленность. Люди привыкли думать об успехе так, как о нем говорится в распространенной, но вводящей в заблуждение фразе «выживание наиболее приспособленных», тем не менее высший критерий биологической приспособленности — не выживание, а репродуктивный успех. Именно это позволяет животному передавать свои гены следующему поколению и сохранять свой фенотип. Затем более приспособленные фенотипы становятся относительно более многочисленными в следующем поколении, чем менее приспособленные. Именно этот динамический процесс отбора меняет комбинацию генотипов и фенотипов и, возможно, в конечном счете приведет к формированию устойчивого состояния.

Время от времени спонтанно возникают новые генетические мутации. Многие из них создают модели поведения (фенотипы), которые плохо сочетаются с окружающей средой и поэтому вымирают. Однако иногда мутация приводит к образованию нового фенотипа, более приспособленного к окружающей среде. Такой мутантный ген может захватить популяцию, то есть образовать значительную ее долю.

В любой момент времени популяция может содержать некоторые или все биологически возможные фенотипы. Доля более приспособленных фенотипов будет увеличиваться, некоторые неприспособленные могут исчезнуть, а фенотипы, в настоящий момент не входящие в состав данной популяции, могут попытаться ее захватить. Биологи называют конфигурацию популяции и ее текущих фенотипов эволюционно устойчивой, если ни один мутантный фенотип не может успешно ее захватить. Это статический критерий, но чаще применяется более динамический критерий: конфигурация популяции эволюционно устойчива, если она представляет собой единственно возможный результат динамического процесса отбора, начиная с любой произвольной комбинации фенотипов в данной популяции.

Приспособленность фенотипа зависит от взаимодействия отдельного организма с окружающей средой. Например, приспособленность определенной птицы зависит от аэродинамических характеристик ее крыльев, а также от всего комплекса разных генотипов, которые существуют в соответствующей среде: как аэродинамика крыльев птицы соотносится с аэродинамическими свойствами крыльев остальных птиц данного вида. Стало быть, приспособленность определенного животного (с его поведенческими характеристиками, такими как агрессивность и стадность) зависит от того, являются ли другие представители этого вида преимущественно агрессивными или пассивными, живут стаями или поодиночке и т. д. Для наших целей подобное взаимодействие между фенотипами в пределах одного вида — самый интересный аспект всей истории. Иногда представители одного вида взаимодействуют с представителями другого вида; тогда приспособленность определенного типа овец, например, может зависеть от качеств, доминирующих в местной популяции волков. Мы рассмотрим и этот тип взаимодействия, но только после анализа взаимодействия в пределах одного вида.

Все вышесказанное имеет свои параллели в теории игр. Поведение фенотипа можно рассматривать как стратегию животного в его взаимодействии с другими животными, например драться или спасаться бегством. Разница лишь в том, что выбор стратегии осуществляется не в результате целенаправленных расчетов, как в стандартной теории игр, а скорее, это генетически предопределенный вариант фенотипа. Взаимодействие обеспечивает фенотипам выигрыши. В биологии они отображают эволюционную или репродуктивную приспособленность; когда же мы используем эти идеи за пределами биологии, они могут иметь иной смысл, подразумевающий успех в социальных, политических и экономических играх.

Выигрыши или показатели приспособленности можно представить в виде таблицы выигрышей, точно так же, как и в обычной игре. В такой таблице все возможные фенотипы одного животного отображаются в строках матрицы, а другого животного — в столбцах матрицы. Если одновременно взаимодействуют больше животных (в биологии это называется игрой по всему полю), то выигрыши можно представить в виде функций, как в играх с коллективным действием из . В этой главе мы в основном будем рассматривать пары игроков, а случай со многими игроками кратко проанализируем в .

Поскольку популяция представляет собой комбинацию фенотипов, различные пары, выбранные из нее, используют во взаимодействии различные сочетания стратегий. Фактический количественный показатель приспособленности фенотипа — это средний выигрыш, который он получит во всех своих взаимодействиях с другими членами популяции. Животные с более высокой приспособленностью будут иметь более крупный эволюционный успех. Итогом динамики популяции станет ее эволюционно устойчивая конфигурация.

Биологи весьма успешно применили этот подход. Комбинации агрессивного и кооперативного поведения, местоположение гнездовий и многие другие явления, не поддающиеся более традиционному объяснению, можно рассматривать как устойчивые результаты эволюционного процесса отбора более приспособленных стратегий. Интересно, что биологи сформулировали идею эволюционных игр, воспользовавшись уже накопленными знаниями в области теории игр и ее терминами, но при этом изменив предположение об осознанных попытках обеспечить максимальное удовлетворение своих потребностей. Теперь специалисты по теории игр, в свою очередь, используют результаты исследований в области биологических эволюционных игр для обогащения своей области знаний.

Действительно, создается впечатление, что теория эволюционных игр — готовая концептуальная модель для изучения двух систем принятия решений Канемана. В других областях применения этой теории, не имеющих отношения к биологии, идею о том, что животные используют генетически заданные стратегии, можно интерпретировать более широко. Во взаимодействии между людьми стратегия может быть заложена в разуме человека по разным причинам, среди которых не только генетика, но и социализация (по всей вероятности, еще более важный фактор), культурное воспитание, образование или эмпирический опыт, основанный на прошлых событиях. Все это может охватывать инстинктивная, быстрая система 1 Канемана. Популяция может состоять из совокупности разных людей с разным происхождением или опытом, под влиянием которого они придерживаются различных стратегий системы 1. Так, некоторые политики стремятся соблюдать определенные моральные или этические нормы, даже рискуя успехом на выборах, тогда как другие озабочены только своим переизбранием. Точно так же некоторые компании могут гнаться исключительно за прибылью, тогда как другие преследуют социальные или экологические цели. В рассматриваемом контексте мы можем назвать все логически возможные стратегии, которые могут быть внедрены таким способом, фенотипом популяции игроков.

Из популяции с ее гетерогенностью встроенных стратегий случайным образом многократно выбираются пары фенотипов для взаимодействия (ведения игры) с другими представителями того же или иного «вида». В каждом взаимодействии выигрыш каждого игрока зависит от стратегий обоих; эта зависимость регулируется обычными «правилами игры» и отображается в таблице или дереве игры. Приспособленность конкретной стратегии определяется как ее совокупный или средний выигрыш, полученный в паре со всеми стратегиями данной популяции. У одних стратегий более высокий уровень приспособленности, чем у других, и в следующем поколении (то есть в следующем раунде игры) их используют больше игроков, что обеспечит их размножение. Стратегии с более низким уровнем приспособленности выберут меньше игроков, поэтому их число постепенно сойдет на нет и они исчезнут. Время от времени кто-то может экспериментировать или выбрать из множества логически возможных стратегий ту, которая еще не применялась. Эта ситуация соответствует появлению мутанта.

Хотя мы используем биологическую аналогию, причина увеличения количества более приспособленных стратегий и исчезновения менее приспособленных отличается от сугубо генетического механизма биологии: игроки, которые добились успеха в предыдущем раунде, передадут информацию друзьям и коллегам, играющим в следующем раунде, а игроки, плохо сыгравшие в предыдущем раунде, увидят, какие стратегии оказались более эффективными, и попытаются их имитировать. Другими словами, процесс целенаправленных размышлений и пересмотра предыдущих эмпирических правил происходит между раундами. Такие «социальные» и «обучающие» механизмы передачи информации гораздо важнее в большинстве стратегических игр, чем любая биологическая генетика; в действительности именно так подкрепляется ориентация законодателей на переизбрание и заинтересованность компаний в максимизации прибыли. И наконец, осознанное экспериментирование с новыми стратегиями замещает случайную мутацию в биологических играх. Постепенный процесс изменений с учетом исходов, опыта, наблюдений и экспериментов образует динамику расчетливой, медленной системы 2 Канемана.

Существует два типа эволюционно устойчивых конфигураций биологических игр. Во-первых, один фенотип может оказаться более приспособленным, чем другие, и популяция может состоять только из него. Такой эволюционно устойчивый результат обозначается термином мономорфизм, что означает «одна (моно) форма (морф)». В этом случае одна преобладающая стратегия называется эволюционно устойчивой стратегией (evolutionary stable strategy, ESS). Во-вторых, у двух или более фенотипов может быть одинаковый уровень приспособленности (и выше по сравнению с некоторыми другими генотипами, не принимающими участия в игре), поэтому они могут сосуществовать в определенных пропорциях. Тогда говорят, что популяция демонстрирует полиморфизм, то есть «множественность (поли) форм (морф)». Такое состояние будет устойчивым, если ни один новый фенотип или возможный мутант не сумеет достичь более высокого уровня приспособленности против данной популяции, чем уровень приспособленности тех типов, которые уже в ней присутствуют.

Полиморфизм очень близок к такому понятию теории игр, как смешанная стратегия. Однако есть одно важное отличие. Для получения полиморфизма ни одному отдельно взятому игроку не нужно придерживаться смешанной стратегии. Каждый член популяции может использовать чистую стратегию, но популяция в целом демонстрирует смешивание стратегий, поскольку различные игроки придерживаются различных чистых стратегий.

Вся эта структура (популяция, возможная комбинация фенотипов, таблица выигрышей при взаимодействии с другими фенотипами и правило эволюции соотношения фенотипов в популяции в зависимости от уровня их приспособленности) образует эволюционную игру. Эволюционно устойчивую конфигурацию популяции можно назвать равновесием в эволюционной игре.

В данной главе мы проанализируем некоторые из этих идей, как обычно, с помощью ряда иллюстративных примеров и начнем с симметричных игр, в которых два игрока находятся в одинаковых условиях. Скажем, два представителя одного вида соперничают друг с другом за пищу или самок или (в области социологии) два выборных чиновника конкурируют за право и дальше занимать соответствующую должность. В таблице выигрышей такой игры каждый игрок может быть выбран в качестве игрока, которому соответствуют строки, или в качестве игрока, которому соответствуют столбцы, — это не повлияет на исход игры.

 

2. Дилемма заключенных

Предположим, популяция состоит из двух фенотипов. Один включает игроков, которым от рождения свойственно стремление к сотрудничеству: они неизменно работают над достижением исхода, наилучшего для всех. Игроки другого типа не склонны к сотрудничеству и делают все исключительно ради себя. В качестве примера возьмем игру в ценообразование в ресторанах, описанную в и представленную в упрощенной версии в . Здесь мы рассмотрим более простую версию, в которой только два варианта выбора цен: наилучшая цена для обоих ресторанов 26 долларов и цена в случае равновесия Нэша 20 долларов. Ресторатор, настроенный сотрудничать, всегда будет выбирать 26 долларов, тогда как владелец ресторана, предпочитающий отказаться от сотрудничества, — 20 долларов. Выигрыши (прибыль) каждого типа в одной игре этой дискретной дилеммы показаны на рис. 12.1, где воспроизведена таблица с . Мы называем игроков просто Строка и Столбец, поскольку на месте каждого из них может быть любой ресторатор, который входит в состав популяции и которого выбирают случайным образом как конкурента другого случайно выбранного соперника.

Рис. 12.1. Дилемма заключенных в контексте игры в ценообразование (выигрыши исчисляются в сотнях долларов в месяц)

Не забывайте, что в эволюционном сценарии ни у кого нет выбора между сотрудничеством и отказом от него; каждый «рождается» с тем или иным предопределенным качеством. Какое же качество будет более успешным (более приспособленным) в популяции?

Владелец ресторана, который относится к типу не склонных к сотрудничеству игроков, получает выигрыш 288 (28 800 долларов в месяц) в конкурентной борьбе с аналогичным типом и выигрыш 360 (36 000 долларов в месяц) — с типом, готовым сотрудничать. В свою очередь тип, готовый сотрудничать, получает 216 (21 600 долларов в месяц) в соперничестве с типом, не склонным к сотрудничеству, и 324 (32 400 долларов в месяц) — с аналогичным себе типом. Следовательно, тип, не расположенный к сотрудничеству, имеет более высокий ожидаемый выигрыш (а значит, и уровень приспособленности), чем тип, готовый к сотрудничеству, независимо от их соотношения в популяции.

Опишем эту ситуацию более формально. Пусть x — это доля готовых к сотрудничеству типов в популяции. Рассмотрим ее любого отдельно взятого члена, склонного к сотрудничеству. При случайном выборе вероятность того, что он встретит другого такого же представителя популяции (и получит выигрыш 324) равна x, а вероятность того, что он встретит игрока, не расположенного к сотрудничеству (и получит выигрыш 216), составляет (1 — x). Следовательно, среднестатистический ожидаемый выигрыш типа, склонного к сотрудничеству, равен 324x + 216(1 — x). Для противоположного типа вероятность встретить игрока, готового сотрудничать (и получить выигрыш 360), составляет x, а игрока аналогичного себе типа (выигрыш 288) — (1 — x). Таким образом, среднестатистический ожидаемый выигрыш типа, не склонного к сотрудничеству, составляет 360x + 288(1 — x). Очевидно, что при всех значениях x от 0 до 1 выполняется следующее условие:

360 x  + 288(1 — x ) > 324 x  + 216(1 — x ).

Стало быть, тип, не расположенный к сотрудничеству, имеет более высокий ожидаемый выигрыш и более высокий уровень приспособленности, чем тип, идущий на сотрудничество. Это обусловит увеличение доли этих типов (при этом снижается значение x) от поколения к поколению, пока вся популяция не будет состоять исключительно из типов, не склонных к сотрудничеству.

А что если популяция изначально состоит только из таких игроков? Тогда ни один (экспериментальный) мутант, готовый к сотрудничеству, не сможет в ней выжить и размножиться настолько, чтобы эту популяцию захватить. Иными словами, мутанты, расположенные к сотрудничеству, не добьются успеха в захвате популяции игроков, не склонных к нему. Даже при совсем малых значениях x (то есть когда доля игроков, готовых к сотрудничеству, очень мала) расположенные к сотрудничеству игроки остаются менее приспособленными по сравнению с оппонентами и их доля в популяции не увеличится, а будет сведена к нулю и мутантная линия исчезнет.

Наш анализ показывает, что у типа игроков, не расположенных к сотрудничеству, более высокий уровень приспособленности по сравнению с типом игроков, готовых к сотрудничеству, а также что популяция, состоящая только из игроков первого типа, не может быть захвачена мутантами. Таким образом, эволюционно устойчивая конфигурация популяции мономорфна и состоит из одной стратегии, или фенотипа, — «отказ от сотрудничества». В связи с этим мы называем ее эволюционно устойчивой стратегией для популяции, вовлеченной в данную дилемму заключенных. Обратите внимание, что при анализе этой игры с точки зрения рационального поведения «отказ от сотрудничества» — строго доминирующая стратегия. Этот результат носит общий характер: если в игре есть строго доминирующая стратегия, она обязательно будет эволюционно устойчивой.

А. Повторяющаяся дилемма заключенных

В мы говорили о том, что повторение дилеммы заключенных позволяет игрокам, осознанно придерживающимся рационального поведения, сотрудничать ради взаимной выгоды. Давайте посмотрим, есть ли подобная возможность в эволюционной игре. Предположим, каждая выбранная пара игроков разыгрывает дилемму заключенных три раза подряд. Общий выигрыш игрока от такого взаимодействия — это сумма выигрышей, полученных за три раунда.

Каждый отдельный игрок запрограммирован на использование только одной стратегии, но она должна представлять собой исчерпывающий план действий. В игре с тремя ходами стратегия может предусматривать во время второго или третьего раунда выполнение действия, которое зависит от того, что произойдет в первом или втором раунде. Например, «Я буду сотрудничать при любых обстоятельствах» и «Я буду всегда отказываться от сотрудничества при любых обстоятельствах» — это допустимые стратегии. Однако также допустима стратегия «Я начну с сотрудничества и буду продолжать его, если вы сотрудничали во время предыдущего раунда, и откажусь от него во всех последующих раундах, если вы не сотрудничали во время первого». На самом деле эта последняя стратегия — не что иное, как стратегия равноценных ответных действий, или «око за око».

Для простоты анализа в этом разделе мы будем исходить из предположения, что в популяции могут существовать только два типа стратегий: «всегда отказ от сотрудничества» (В) и «око за око» (О). Из популяции случайным образом выбираются пары игроков, после чего каждая пара проводит игру определенное количество раз. Уровень приспособленности каждого игрока представляет собой сумму его выигрышей от всех повторений игры против конкретного соперника. Мы проанализируем, что происходит в случае двух, трех и n таких повторений в каждой паре.

I. Игра с двумя повторениями. На рис. 12.2 представлена таблица выигрышей для игры, в которой встречаются два представителя популяции рестораторов и играют друг против друга в точности два раза. Если оба игрока относятся к типу В, оба откажутся от сотрудничества в обоих случаях, тогда, как показано на , каждый из них получит выигрыш 288 в каждом раунде игры, то есть в сумме 576. Если оба игрока относятся к типу О, отказа не будет и каждый игрок получит в каждом раунде выигрыш 324, в сумме 648. Если один игрок относится к типу В, а другой к типу О, то во время первого раунда игрок типа В откажется сотрудничать, а игрок типа О будет сотрудничать; в итоге у первого выигрыш составит 360, а у второго — 216. Во время второго раунда оба игрока откажутся сотрудничать и получат выигрыш по 288 каждый. Таким образом, общий выигрыш игрока типа В будет 360 + 288 = 648, а игрока О — 216 + 288 = 504.

Рис. 12.2. Исходы дилеммы заключенных с двумя повторениями (в сотнях долларов в месяц)

В дважды повторяющейся дилемме заключенных мы видим, что стратегия В («всегда отказ от сотрудничества») — слабо доминирующая. Очевидно, что, если популяция состоит только из игроков типа В, мутанты О-типа не смогут ее захватить, поэтому В — эволюционно устойчивая стратегия. Но если популяция включает исключительно игроков типа О, мутанты В-типа не могут добиться большего, чем игроки О-типа. Означает ли это, что стратегия О («око за око») должна быть еще одной эволюционно устойчивой стратегией, подобно тому как в случае анализа этой игры с точки зрения рационального поведения игроков был бы сделан вывод о существовании равновесия Нэша? Ответ: нет. Если популяция изначально состоит только из игроков типа О и в игру вступают немногочисленные мутанты типа В, то последние в основном будут встречаться с игроками преобладающего типа О и получат такие же выигрыши, как и выигрыш игрока типа О в паре с другим игроком типа О. Но иногда мутант типа В будет встречаться с другим мутантом типа В и тогда получит более высокий выигрыш, чем получил бы игрок типа О в паре с игроком типа В. Таким образом, у мутантов немного более высокий уровень приспособленности, чем у представителей преобладающего фенотипа, и это преимущество приводит к увеличению (хотя и медленному) их доли в популяции. Следовательно, мутанты типа В все же могут успешно захватить популяцию, состоящую только из игроков типа О, а значит, эту стратегию нельзя назвать эволюционно устойчивой.

Наши рассуждения основаны на двух критериях определения эволюционно устойчивой стратегии. Во-первых, мы анализируем, получает ли мутант более высокий или низкий результат, чем преобладающий фенотип, когда каждый противостоит игроку преобладающего типа. Если этот первичный критерий дает четкий ответ, значит вопрос решен. Но если первичный критерий дает равный счет, мы используем вторичный критерий, позволяющий определить победителя: добивается ли мутант большего или меньшего, чем преобладающий фенотип, когда каждый противостоит мутанту? Равный счет бывает крайне редко, поэтому обычно необходимости применять вторичный критерий нет, но он есть в резерве для таких ситуаций, как отображенная на .

II. Игра с тремя повторениями. Теперь предположим, что каждая подобранная пара игроков из популяции (В, О) играет в эту игру три раза. На рис. 12.3 представлены итоговые показатели приспособленности по всем трем раундам для каждого типа игроков в паре с соперниками каждого типа.

Рис. 12.3. Исходы дилеммы заключенных с тремя повторениями (в сотнях долларов в месяц)

Для того чтобы увидеть, как повышаются показатели приспособленности, рассмотрим пару примеров. Когда встречаются два игрока типа О, оба идут на сотрудничество в первом раунде, а значит, оба его продолжат и во втором, и в третьем раундах. При этом игроки каждый раз получают по 324, что в сумме дает каждому из них выигрыш 972 за три месяца. Когда игрок типа О встречается с игроком типа В, второй получает хороший результат в первом раунде (360 в паре с игроком В и 216 в паре с игроком О), но во втором и третьем раундах игрок типа О также отказывается от сотрудничества и каждый из них получает по 288 в обоих раундах (в сумме выигрыш игрока типа В равен 936, а типа О — 792).

Относительная приспособленность двух типов зависит от состава популяции. Если она почти полностью состоит из игроков типа В, то у типа В более высокий уровень приспособленности, чем у типа О (поскольку при встрече игроков типа В в основном с другими игроками типа В они в большинстве случаев получают выигрыш 864, а игроки типа О — 792). С другой стороны, если в популяции преобладают игроки типа О, у типа О более высокий уровень приспособленности, чем у типа В (так как игроки типа О получают выигрыш 972 при встрече в основном с другими представителями типа О, а выигрыш игроков типа В в такой ситуации составляет 936). Уровень приспособленности каждого типа выше, если он уже преобладает в популяции. Следовательно, тип О не может успешно захватить популяцию, состоящую из игроков типа В, и наоборот. Таким образом, существуют две возможные эволюционно устойчивые конфигурации популяции: в одной эволюционно устойчивая стратегия — стратегия В («всегда отказ от сотрудничества»), а в другой — стратегия О («око за око»).

Теперь рассмотрим эволюционную динамику в случае, когда исходная популяция представляет собой комбинацию двух типов. Как распределится ее состав с течением времени? Допустим, доля x в популяции — это игроки типа О, а остальная часть (1 — x) — игроки типа В. Отдельный игрок типа В, выставленный против различных соперников, выбранных из данной популяции, получает выигрыш 936 в противостоянии с игроком типа О, что происходит в x случаях, и выигрыш 864 в противостоянии с другим игроком типа В, что наблюдается в (1 — x) случаях. Это дает следующий ожидаемый выигрыш каждого игрока типа В:

936 x  + 864(1 — x ) = 864 + 72 x .

Аналогичным образом отдельный игрок типа О получает такой ожидаемый выигрыш:

972 x  + 792(1 — x ) = 792 + 180 x .

Стало быть, уровень приспособленности игрока типа О выше уровня приспособленности игрока типа В, если первый в среднем получает больше, то есть при выполнении следующего условия:

792 + 180 x  > 864 + 72 x ,

108 x  > 72,

x  > 2/3.

Иными словами, если более двух третей (67 %) популяции уже принадлежат к типу О, то у игроков этого типа более высокий уровень приспособленности и их доля будет расти, пока не достигнет 100 %. Если в начале игры в популяции менее 67 % игроков типа О, тогда у игроков типа В более высокий уровень приспособленности и доля игроков типа О будет падать, пока не достигнет 0 %, то есть популяция будет полностью состоять из игроков типа В. Эволюционная динамика смещает популяцию к одному из двух крайних состояний, каждое из которых может быть эволюционно устойчивой стратегией. Эта динамика приводит к тому же выводу, что и статический критерий захвата популяции мутантами. Это общее, хотя и не универсальное свойство эволюционных игр.

Таким образом, мы определили две эволюционно устойчивые конфигурации популяции. В каждой из них популяция состоит из игроков только одного типа (то есть мономорфна). Например, если изначально популяция включает 100 % игроков типа О, то даже после появления небольшого количества мутантов В-типа она по-прежнему будет состоять из более чем 66,66…% игроков типа О. Другими словами, тип О останется более приспособленным, а мутирующая линия типа В исчезнет. Точно так же, если изначально популяция на 100 % состоит из игроков типа В, то небольшое количество мутантов типа О (менее 66,66…%) покинет ее, а значит, уровень приспособленности игроков типа В будет выше и мутирующая линия типа О исчезнет. Как мы уже видели ранее, экспериментирующие мутанты типа N не добьются успеха в популяции типов В и О, в основном состоящей из игроков либо В-, либо О-типа.

Но что если в исходную популяцию входит ровно 66,66…% игроков типа О (и 33,33…% игроков типа В)? Тогда у обоих типов одинаковый уровень приспособленности, и мы могли бы назвать эту ситуацию полиморфизмом. Тем не менее на самом деле такая популяция неподходящий кандидат на эволюционно устойчивую конфигурацию и может поддерживать этот слабо сбалансированный исход только до появления мутанта любого типа. По воле случая такой мутант рано или поздно появится, что сместит расчеты приспособленности в пользу мутантного типа, и данное преимущество будет накапливаться до тех пор, пока не будет достигнута эволюционно устойчивая стратегия со 100 % игроков этого типа. Это просто пример применения вторичного критерия определения эволюционной устойчивости. Мы иногда будем в широком смысле говорить о такой конфигурации как о неустойчивом равновесии, для того чтобы сохранить параллель с обычной теорией игр, в которой мутации не учитываются и слабо сбалансированное равновесие может существовать. Однако в рамках строгой логики биологического процесса это вообще не равновесие.

Наши рассуждения можно представить в виде простого графика, очень напоминающего те, которые мы строили при вычислении соотношений в равновесии в смешанных стратегиях с участием игроков, осознанно придерживающихся рационального поведения. Единственное различие — в эволюционном контексте соотношение стратегий, используемых игроками, не вопрос выбора, сделанного любым отдельно взятым игроком, а свойство всей популяции, как показано на рис. 12.4. На горизонтальной оси отображена доля в популяции x (от 0 до 1) игроков типа О. Уровень приспособленности показан на вертикальной оси. Каждая линия отображает уровень приспособленности одного типа. Линия, соответствующая типу О, начинается ниже (в точке 792 по сравнению с 864 в случае линии типа В) и заканчивается выше (972 против 936). Линии пересекаются при x = 0,66…. Направо от этой точки уровень приспособленности типа О выше, поэтому процент игроков данного типа в популяции с течением времени возрастает, а значение x приближается к 1. Точно так же слева от этой точки уровень приспособленности типа В выше, поэтому процент игроков В-типа в популяции с течением времени увеличивается, а значение x приближается к 0. Такие диаграммы — полезный способ наглядного представления данных, поэтому мы будем их широко использовать.

Рис. 12.4. Графики уровня приспособленности, а также равновесия в дилемме заключенных с тремя повторениями

Б. Многократно повторяющиеся игры

А что если каждая пара игроков разыграет неоговоренное количество раундов? Давайте сосредоточимся на популяции, состоящей только из игроков типа В и О, в которой взаимодействие между случайно отобранными парами происходит n раз (где n > 2). Таблица общих результатов такой игры представлена на рис. 12.5. Два игрока типа В при встрече всегда отказываются от сотрудничества и всякий раз получают выигрыш 288; иными словами, выигрыш каждого игрока составляет 288n в n раундах игры. Два игрока типа О при встрече начинают с сотрудничества, причем никто из них не отказывается от него первым, а значит, они каждый раз получают выигрыш 324, что в сумме равно 324n. Когда игрок типа В встречается с игроком типа О, в первом раунде игры игрок типа О сотрудничает, а игрок типа В отказывается от сотрудничества и в итоге получает выигрыш 360, а игрок типа О — выигрыш 216. Во всех последующих раундах игрок типа О отвечает отказом на предшествующий отказ игрока В; при этом каждый из них получает выигрыш 288 в оставшихся (n — 1) раундах. Таким образом, тип В в сумме имеет 360 + 288(n — 1) = 288n + 72 в n раундах игры против типа О, тогда как тип О — 216 + 288(n — 1) = 288n — 72 в n раундах игры против типа В.

Рис. 12.5. Исходы дилеммы заключенных с n повторениями

Если доля игроков типа О в популяции равна x, то каждый игрок типа В получает в среднем x(288n + 72) + (1 — x)288n, а типа О — x(324n) + (1 — x)(288n — 72). Следовательно, уровень приспособленности типа О выше, если

x (324 n ) + (1 — x )(288 n — 72) >  x (288 n  + 72) + (1 — x ) 288 n , 36 xn  > 72,

Опять же, мы снова получили две мономорфные эволюционно устойчивые стратегии: одна — когда популяция состоит только из игроков типа О (или x = 1 — к этому значению сходится процесс начиная с любого значения x > 2/n), а другая — когда популяция состоит только из игроков типа В (или x = 0 — к этому значению сходится процесс начиная с любого значения x < 2/n). Как показано на , существует только одно неустойчивое полиморфное равновесие в равновесной точке x = 2/n.

Обратите внимание, что доля игроков типа О в равновесной точке зависит от n: она меньше, когда значение n больше. При n = 10 доля игроков типа О составляет 2/10, или 0,2. Так что, если популяция изначально состоит из 20 % игроков типа О, в ситуации, когда каждая пара проводит 10 повторений игры, доля игроков типа О будет расти до тех пор, пока не достигнет 100 %. Вспомним, что, когда пары проводили три раунда игры (n = 3), игрокам типа О понадобилась более крупная исходная доля в размере не менее 67 %, чтобы достичь аналогичного результата, а в случае всего двух повторений доля игроков типа О в популяции должна была составлять 100 %, чтобы они выжили. (Мы видим причину такого исхода в нашем выражении для вычисления критического значения x, которое показывает, что при n = 2 значение x должно превышать 1, прежде чем уровень приспособленности типа О повысится.) Не забывайте также о том, что популяция, состоящая исключительно из игроков типа О, добивается сотрудничества. Таким образом, оно формируется при выполнении более широкого диапазона исходных условий, когда игра повторяется большее число раз. В этом смысле при большем количестве повторений вероятность сотрудничества увеличивается. То есть ценность установления сотрудничества повышается по мере увеличения длительности периода взаимодействия.

В. Сравнение эволюционной модели и модели рационального игрока

И наконец, вернемся к трижды повторяющейся игре, представленной на , и вместо использования эволюционной модели проанализируем ее как игру с участием двух игроков, осознанно придерживающихся рационального поведения. Каковы в ней равновесия Нэша? Есть два равновесия в чистых стратегиях, одно — когда оба игрока выбирают стратегию В, а другое — когда оба игрока выбирают стратегию О. Существует также равновесие в смешанных стратегиях, в котором стратегия О используется в 67 % случаев, а стратегия В — в 33 % случаев. Два первых равновесия и есть те мономорфные эволюционно устойчивые стратегии, которые мы нашли, а третье равновесие — это неустойчивое полиморфное эволюционное равновесие. Другими словами, существует тесная связь между эволюционным подходом к таким играм и подходом, основанным на концепции осознанной рациональности игроков.

Это не совпадение. Эволюционно устойчивая стратегия должна быть равновесием Нэша в игре, которую ведут осознанно рациональные игроки, с такой же структурой выигрышей. Для того чтобы в этом удостовериться, предположим на мгновение обратное. Если применение всеми игроками какой-то стратегии (назовем ее S) не приводит к равновесию Нэша, то другая стратегия (назовем ее R) должна обеспечивать более высокий выигрыш одному игроку в игре против стратегии S. Мутант, использующий стратегию R, достигнет более высокого уровня приспособленности в популяции, выбравшей стратегию S, и ему удастся захватить эту популяцию. Следовательно, стратегия S не может быть эволюционно устойчивой. Это равносильно утверждению, что если стратегия S эволюционно устойчива, то она должна быть равновесием Нэша для всех игроков, ее использующих.

Таким образом, эволюционный подход обеспечивает косвенное обоснование рационального подхода. Даже когда игроки не предпринимают осознанных действий, направленных на максимизацию своего выигрыша, если более эффективные стратегии разыгрываются чаще, а менее эффективные исчезают и в итоге процесс сводится к устойчивой стратегии, то исход должен быть таким же, как и исход в случае рациональной игры.

Хотя эволюционно устойчивая стратегия должна быть равновесием Нэша в соответствующей рациональной игре, обратное неверно. Мы привели два примера, подтверждающих этот вывод. В дважды повторяющейся дилемме заключенных на , основанной на рациональном поведении игроков, стратегия О была бы равновесием Нэша в том слабом смысле, что при выборе ее обоими игроками ни один из них не получит положительной выгоды от перехода к стратегии В. Однако в случае эволюционного подхода стратегия В может возникнуть в качестве мутации и успешно захватить популяцию типа О. А в трижды повторяющейся дилемме заключенных (см. и ) рациональная игра приведет к формированию равновесия в смешанных стратегиях. Однако его биологический аналог, полиморфное состояние, могут захватить мутанты, а значит, это равновесие не будет истинным эволюционно устойчивым. Следовательно, биологическая концепция устойчивости может помочь нам при выборе из всего множества равновесий Нэша в рациональной игре.

В нашем анализе повторяющейся игры есть одно ограничение. Изначально мы исходили из допущения о наличии всего двух стратегий, В («всегда отказ от сотрудничества») и О («око за око»). То есть предполагалось, что больше никаких стратегий нет или не может возникнуть вследствие мутации. В биологии типы появляющихся мутаций зависят от генетических факторов. В социальных, политических или экономических играх формирование новых стратегий предположительно определяется историей, культурой и опытом игроков. Кроме того, способность людей усваивать и обрабатывать информацию также должна сыграть свою роль. Тем не менее в нашей модели в данной ситуации ограничения, которые мы накладываем на комбинацию стратегий, возможных в определенной игре, имеют важные последствия в свете того, какие из этих стратегий (если они есть) могут быть эволюционно устойчивыми. Если бы мы допустили в примере с трижды повторяющейся дилеммой заключенных существование стратегии S, которая сводится к сотрудничеству во время первого раунда и отказу от него в ходе второго и третьего, то мутанты типа S могли бы успешно захватить популяцию, состоящую только из игроков типа О, поэтому стратегия О не была бы эволюционно устойчивой. Дальнейший анализ подобной перспективы содержится в примерах в конце данной главы.

 

3. Игра в труса

Помните юношей 1950-х годов, которые мчатся навстречу друг другу в автомобилях и ждут, кто свернет первым, чтобы избежать столкновения? Теперь предположим, что у них нет выбора: каждый генетически запрограммирован быть либо «тюфяком» (всегда сворачивать в сторону), либо «мачо» (всегда ехать прямо). Популяция состоит из комбинации двух типов. Каждую неделю случайным образом выбираются пары для участия в игре. На рис. 12.6 представлена таблица выигрышей каждого из двух игроков — скажем, А и Б. (Значения в таблице те же, что и в таблице на .)

Рис. 12.6. Таблица выигрышей для игры в труса

Какие результаты получат два типа игроков? Ответ зависит от исходного соотношения типов в популяции. Если она почти полностью состоит из «тюфяков», то мутант типа «мачо» будет выигрывать и в основном получать выигрыш 1, тогда как все «тюфяки» в противостоянии с себе подобными получат большей частью нули. Но если популяция почти полностью состоит из «мачо», то мутант типа «тюфяк» получит −1, что хоть и выглядит плохо, но все же лучше выигрыша −2, который получат все «мачо». Можно представить эту ситуацию с точки зрения биологического контекста и сексизма 1950-х годов: в популяции «тюфяков» новичок «мачо» покажет всем, что они трусы, и тем самым произведет впечатление на девушек. Но если в популяции преимущественно «мачо», то в большинстве случаев они окажутся в больнице, а девушкам придется искать немногочисленных здоровых «тюфяков».

Иными словами, уровень приспособленности каждого типа выше, когда он встречается в популяции относительно редко. Следовательно, каждый тип может успешно захватить популяцию, состоящую из представителей другого типа. В таком случае следует ожидать, что оба типа в популяции находятся в равновесии; то есть эволюционно устойчивая стратегия должна представлять собой комбинацию типов, или быть полиморфной.

Для того чтобы определить соотношение «тюфяков» и «мачо» в такой эволюционно устойчивой стратегии, вычислим уровень приспособленности каждого типа в общей смешанной популяции. Пусть x — это доля «мачо», а (1 — x) — доля «тюфяков». Один «тюфяк» встречается с другим «тюфяком» и получает 0 в (1 — x) случаях, а при встрече с «мачо» — −1 в x случаев. Следовательно, уровень приспособленности «тюфяка» составляет 0 × (1 — x) — 1 × x = —x. Точно так же уровень приспособленности «мачо» равен 1 × (1 — x) — 2x = 1–3x. Уровень приспособленности типа «мачо» выше при выполнении условия

1 — 3 x  > — x ,

2 x  < 1,

x  < 1/2.

Если в популяции меньше половины «мачо», то этот тип будет более приспособленным, а его доля в популяции увеличится. Напротив, если в популяции больше половины «мачо», тогда тип «тюфяк» будет более приспособленным, а доля «мачо» будет сокращаться. В любом случае доля «мачо» в популяции будет приближаться к 1/2, и эта комбинация 50 на 50 будет эволюционно устойчивой полиморфной стратегией.

На рис. 12.7 данный исход представлен в графическом виде. Каждая прямая линия отображает приспособленность (ожидаемый выигрыш в противостоянии со случайно выбранным членом популяции) одного типа, в зависимости от доли «мачо» x. Для типа «тюфяк» эта функциональная зависимость, отображающая приспособленность этого типа как функцию доли «мачо», составляет — x, как мы определили выше. Это прямая с небольшим уклоном, которая начинается на высоте 0 при x = 0 и снижается до −1 при x = 1. Типу «мачо» соответствует функция 1–3x. Это линия с большим уклоном, которая начинается на высоте 1 при x = 0 и снижается до −2 при x = 1. Линия типа «мачо» проходит над линией типа «тюфяк» при x < 1/2 и под этой линией при x > 1/2. Это говорит о том, что уровень приспособленности типа «мачо» выше при малых значениях x, а уровень приспособленности типа «тюфяк» выше при больших значениях x.

Рис. 12.7. Графики уровня приспособленности, а также полиморфное равновесие в игре в труса

Теперь можем сравнить эволюционную теорию этой игры с нашей предыдущей теорией, сформулированной в и , которая основывалась на предположении, что игроки умеют правильно рассчитывать свои лучшие стратегии. Там мы нашли три возможных равновесия Нэша: два в чистых стратегиях, когда один игрок едет прямо, а другой сворачивает, и одно в смешанных стратегиях, когда каждый игрок едет прямо с вероятностью 1/2 и сворачивает с вероятностью 1/2.

Если популяция действительно состоит из 100 % игроков типа «мачо», то все они в равной степени готовы к столкновению (или в равной степени не готовы). Точно так же в популяции, включающей исключительно «тюфяков», все они в равной степени готовы отступить. Но эти мономорфные конфигурации неустойчивы. В популяции, все члены которой «мачо», мутант типа «тюфяк» получит более высокий результат и захватит ее. Наш анализ показывает, что как только в популяции появятся несколько «тюфяков», их доля неуклонно будет увеличиваться до 1/2, как бы мало их изначально ни было. Точно так же популяция, состоящая только из «тюфяков», уязвима для успешного вторжения мутантов «мачо», и этот процесс снова приводит к тому же полиморфизму. Таким образом, полиморфная конфигурация — единственный эволюционно устойчивый исход.

Наибольший интерес представляет связь между равновесием в смешанных стратегиях в рациональной игре и полиморфным равновесием в эволюционной игре. Соотношение стратегий в равновесной стратегии в первой игре точно такое же, как и соотношение типов в популяции во второй игре, где существует комбинация игроков типа «мачо» и «тюфяк» в пропорции 50 на 50. Но интерпретации у этих ситуаций разнятся: в рациональной игре каждый игрок смешивает собственные стратегии, а в эволюционной каждый член популяции использует чистую стратегию, но поскольку разные игроки применяют разные стратегии, образуется комбинация стратегий в популяции.

Такое соответствие между равновесием Нэша в рациональной игре и устойчивыми исходами игры с аналогичной структурой выигрышей в игре по эволюционным правилам — общая норма; мы увидим ее общий характер ниже в . В действительности эволюционная устойчивость обеспечивает дополнительное обоснование для выбора одного из множества равновесий Нэша в играх, основанных на концепции рационального поведения игроков.

При анализе игры в труса с рациональной точки зрения равновесие в смешанных стратегиях казалось несколько озадачивающим. Оно оставляло лазейку для ошибок, которые могли обойтись очень дорого. Каждый игрок ехал прямо в одном случае из двух, а значит, в одном случае из четырех автомобили сталкивались. Равновесие в чистых стратегиях позволяло избежать таких столкновений. В то время это могло навести вас на мысль, что в равновесии в смешанных стратегиях есть нечто нежелательное; может, вы даже задавались вопросом, зачем вообще мы тратим на него время. Теперь вы понимаете причину. На первый взгляд странное равновесие возникает как устойчивый результат естественного динамического процесса, в ходе которого каждый игрок пытается улучшить свой выигрыш в популяции, которой он противостоит.

 

4. Игра в доверие

Из всех широких классов стратегических игр, представленных в , мы с эволюционной точки зрения рассмотрели дилемму заключенных и игру в труса. Осталась только игра в доверие. В мы проиллюстрировали этот тип игры на примере двух студентов, Гарри и Салли, которые решают, где встретиться, чтобы выпить кофе. В эволюционном контексте каждому игроку свойственна врожденная симпатия либо к Starbucks, либо к Local Latte, а в состав популяции входит определенное число игроков каждого типа. Мы будем исходить из того, что пары игроков, которые мы разделяем на генетические категории мужчин и женщин, каждый день выбираются случайным образом для участия в данной игре. Обозначим стратегии как S (Starbucks) и L (Local Latte). На рис. 12.8 представлена таблица выигрышей при случайном отборе пар игроков; выигрыши те же, что и в таблице на .

Рис. 12.8. Таблица выигрышей игры в доверие

Если бы это была игра с участием игроков, делающих рациональный выбор, в ней было бы два равновесия в чистых стратегиях: (S, S) и (L, L), причем второе лучше для обоих игроков. Если игроки общаются и координируют свои действия в явной форме, им не составит труда достичь этого равновесия. Однако если они делают выбор независимо друг от друга, им необходимо скоординировать действия посредством сходимости ожиданий, другими словами, отыскав фокальную точку.

В рациональной игре есть третье равновесие — в смешанных стратегиях, которое мы нашли в . В нем каждый игрок выбирает Starbucks с вероятностью 2/3 и Local Latte с вероятностью 1/3; ожидаемый выигрыш каждого игрока составляет 2/3. Как было показано в , этот выигрыш хуже выигрыша в случае менее привлекательного равновесия в чистых стратегиях (S, S), поскольку независимое смешивание стратегий зачастую приводит игроков к противоречивому или плохому выбору. Здесь же вероятность неблагоприятного исхода (выигрыш 0) равна 4/9: два игрока отправляются в разные места почти в половине случаев.

Что происходит в эволюционной игре? Каждый член большой популяции запрограммирован на выбор либо S, либо L. Произвольно отобранным парам таких игроков дается задание попытаться встретиться. Предположим, x — это доля в популяции игроков типа S, а (1 — x) — доля игроков типа L. Тогда уровень приспособленности определенного игрока типа S (его ожидаемый выигрыш от случайной встречи такого рода) составляет x × 1 + (1 — x) × 0 = x. Аналогично, уровень приспособленности каждого игрока типа L равен x × 0 + (1 — x) × 2 = 2(1 — x). Следовательно, уровень приспособленности типа S выше при х > 2(1 — x) или x > 2/3, а типа L — при x < 2/3. В равновесной точке x = 2/3 оба типа в равной степени приспособлены.

Как и в игре в труса, те же значения вероятности, которые относятся к равновесию в смешанных стратегиях, полученному в результате рационального выбора, появляются и при ведении игры по эволюционным правилам в виде соотношения типов в популяции при полиморфном равновесии. Однако теперь это смешанное равновесие неустойчиво. Малейшее случайное отклонение доли х от равновесной точки 2/3 запустит кумулятивный процесс, который сместит комбинацию типов в популяции далеко от равновесной точки. Если значение x превысит 2/3, уровень приспособленности игроков типа S повысится и он станет еще быстрее расти количественно, еще больше увеличивая значение x. Если значение x окажется меньше 2/3, уровень приспособленности игроков типа L повысится и он станет еще быстрее расти количественно, еще больше снижая значение x. В итоге значение x либо повысится до 1, либо упадет до 0, в зависимости от вида отклонения. Особенность ситуации состоит в том, что в игре в труса каждый тип был более приспособленным при меньшей доле в популяции, поэтому соотношение типов в ней стремилось от экстремальных значений в равновесной точке, попадающей в средний диапазон. Напротив, в игре в доверие уровень приспособленности каждого типа выше при большем количестве членов соответствующего типа в популяции; риск не встретиться с другим игроком снижается по мере увеличения доли игроков того же типа, поэтому соотношение типов в популяции стремится к экстремальным значениям.

На рис. 12.9, очень похожем на , представлены графики уровня приспособленности и равновесия в игре в доверие. Две линии отображают приспособленность двух типов в зависимости от их соотношения в популяции. Пересечение линий образует равновесную точку. Единственное отличие — при удалении от равновесной точки более многочисленный тип становится более приспособленным, тогда как на это был менее многочисленный тип.

Рис. 12.9. Графики уровня приспособленности, а также равновесия в игре в доверие

Поскольку каждый тип менее приспособлен при небольшой численности, только две крайние мономорфные конфигурации популяции могут находиться в эволюционно устойчивом состоянии. Легко убедиться, что оба исхода — это эволюционно устойчивые стратегии согласно статическому критерию: захват другого типа небольшой популяцией мутантов сойдет на нет, потому что у немногочисленных мутантов более низкий уровень приспособленности. Таким образом, в играх в доверие, или координационных играх, в отличие от игры в труса, эволюционный процесс не сохраняет неблагоприятное равновесие, при котором существует положительная вероятность выбора игроками конфликтующих стратегий. Тем не менее эта динамика не гарантирует сходимости к более благоприятному из двух равновесий, если игра начинается с произвольной исходной комбинации фенотипов, — к чему придет популяция, зависит от того, с чего она начнет.

 

5. Три фенотипа в популяции

При существовании только двух возможных фенотипов (стратегий) мы можем выполнить проверку на наличие эволюционно устойчивой стратегии путем их сравнения с мутантом одного типа. Динамику популяции в эволюционной игре можно проиллюстрировать с помощью графиков, аналогичных представленным на , и . Мы покажем, как эти идеи и метод могут быть использованы, когда есть три (или более) возможных фенотипа, а также посмотрим, какие новые особенности при этом возникают.

А. Проверка стратегий на эволюционную устойчивость

Давайте еще раз проанализируем трижды повторяющуюся дилемму заключенных из и посредством включения третьего возможного фенотипа. Эта стратегия, обозначенная как Н, означает «никогда не отказываться от сотрудничества». На рис. 12.10 приведена таблица приспособленности с тремя стратегиями: В («всегда отказ от сотрудничества»), О («око за око») и Н («никогда не отказываться от сотрудничества»).

Рис. 12.10. Трижды повторяющаяся дилемма заключенных с тремя типами (выигрыши исчисляются в сотнях долларов)

Для того чтобы проверить, будет ли одна из этих стратегий эволюционно устойчивой, проанализируем, могут ли популяцию, состоящую из игроков только одного типа, захватить мутанты одного из двух других типов. Например, популяцию из игроков типа В не могут захватить мутанты типа Н или О, а значит, тип В — это эволюционно устойчивая стратегия. Но популяцию из игроков типа Н мутанты типа В захватить могут; при этом тип Н позволяет одурачить себя трижды (какой позор!). Следовательно, Н не может быть эволюционно устойчивой стратегией.

А как насчет типа О? Популяция только из игроков типа О не может быть захвачена типом В. Однако в противостоянии с мутантами типа Н тип О может оказаться на равных: обратите внимание, что в четырех ячейках таблицы у типов О и Н одинаковые выигрыши. В такой ситуации мутанты типа Н не будут размножаться, но и не вымрут. Небольшая доля мутантов может сосуществовать с популяцией, почти полностью состоящей из игроков типа О. Таким образом, тип О не удовлетворяет ни одному из критериев эволюционно устойчивых стратегий, но демонстрирует некоторую способность сопротивляться захвату.

Мы учитываем способность к адаптации, демонстрируемую типом О в нашем примере, и вводим концепцию нейтральной эволюционно устойчивой стратегии. В отличие от стандартной эволюционно устойчивой стратегии, в которой член основной популяции должен однозначно быть более приспособленным, чем мутант, в популяции с небольшой долей мутантов нейтральная устойчивость требует, чтобы член основной популяции имел как минимум такой же уровень приспособленности, как и мутант. Тогда доля мутантов не увеличивается, а может оставаться на исходном низком уровне. Это и есть случай, когда популяцию только из игроков типа О захватывает небольшое количество мутантов типа Н. В игре на присутствует одна стандартная эволюционно устойчивая стратегия (стратегия В) и одна нейтральная эволюционно устойчивая стратегия (стратегия О).

Далее проанализируем ситуацию, в которой популяцию из игроков типа О захватывают мутанты типа Н. Если доля мутантов достаточно мала, оба типа могут благополучно сосуществовать. Однако если количество мутантов составляет слишком большой процент в общей популяции, ее могут захватить мутанты В-типа: игроки типа В добиваются высоких результатов в противостоянии с типом Н, но плохо справляются с типом О. Для большей точности рассмотрим популяцию с долей x игроков типа Н и долей (1 — x) игроков типа О. Уровень приспособленности каждого из этих типов составляет 972. Уровень приспособленности мутанта типа В в этой популяции равен 936(1 — x) + 1080x = 144x + 936. Это больше 972, если 144x > 972–936 = 36, или x > 1/4. Таким образом, тип О может быть нейтральной эволюционно устойчивой стратегией, сосуществующей с небольшой долей мутантов типа Н, но только до тех пор, пока их доля меньше 25 %.

Б. Динамика

Для того чтобы наглядно объяснить динамику в играх с тремя возможными фенотипами, обратимся к еще одной хорошо известной игре «камень, ножницы, бумага» (КНБ). В версии этой игры, основанной на концепции рационального поведения игрока, все участники одновременно выбирают одно из трех возможных действий: камень (сложить кулак), бумага (расправить ладонь) или ножницы (сделать движение двумя пальцами, напоминающее ножницы). Правила игры гласят, что камень побеждает («разбивает») ножницы, ножницы побеждают («режут») бумагу, бумага побеждает («обертывает») камень; при одинаковых движениях будет ничья. Если игроки выбирают разные действия, победитель получает выигрыш 1, а проигравший выигрыш −1; в случае ничьей выигрыш обоих игроков составляет 0.

В качестве примера эволюционной игры рассмотрим ситуацию, с которой сталкиваются пятнистобокие игуаны, обитающие на побережье Калифорнии. Для этого вида характерны три типа поведения самцов при спаривании, причем каждый тип поведения ассоциируется с окраской горла самца. Синегорлые самцы (стражи) охраняют небольшое количество самок и отражают попытки желтогорлых самцов (тихони) прокрасться и спариться с самкой, оставшейся без защиты. Такая стратегия желтогорлого самца эффективна против оранжевогорлых самцов (агрессоров), которые держат большие гаремы и часто преследуют других самцов, как правило, синегорлых, которых оранжевогорлые самцы могут одолеть благодаря своей агрессивности. Взаимодействие между тремя типами самцов можно смоделировать посредством структуры выигрышей игры КНБ, представленной на рис. 12.11, где показаны только выигрыши игрока, которому соответствуют строки. Мы включаем в таблицу столбец для q-комбинации, что позволит нам проанализировать эволюционный эквивалент равновесия в смешанных стратегиях в этой игре, то есть комбинацию типов в популяции.

Рис. 12.11. Выигрыши в эволюционной игре с тремя фенотипами

Допустим, q1 — доля желтогорлых игуан в популяции, q2 — доля синегорлых игуан, а (1 — q1 — q2) — доля оранжевогорлых игуан. В правом столбце таблицы показаны выигрыши каждого игрока строки в противостоянии с такой комбинацией фенотипов, то есть это уровень приспособленности игроков, которым соответствуют строки. Предположим, что в популяции пятнистобоких игуан доля каждого типа увеличивается, когда его приспособленность имеет положительное значение, и уменьшается в случае отрицательного значения. Тогда q1 повышается только при выполнении условия

—  q 2  + (1 — q 1  — q 2 ) > 0,

q 1  + 2 q 2  < 1.

Доля желтогорлых игуан в популяции увеличивается, когда q2 (доля синегорлых игуан) небольшая или (1 — q1 — q2) (доля оранжевогорлых игуан) большая. Это имеет смысл: желтогорлые самцы не особо успешны в противостоянии с синегорлыми, но весьма хороши в противоборстве с оранжевогорлыми самцами. Аналогичным образом q2 повышается только при выполнении условия

q 1  — (1 — q 1  — q 2 ) > 0,

2 q 1  +  q 2  > 1.

Синегорлые самцы добиваются лучших результатов, когда доля желтогорлых соперников большая или оранжевогорлых малая.

Графики на рис. 12.12 наглядно демонстрируют динамику популяции и полученных в итоге равновесий в этой игре. Треугольный сегмент, ограниченный осями координат и линией q1 + q2 = 1, содержит все возможные равновесные комбинации q1 и q2. В нем есть также две прямые линии. Первая линия (более пологая) — это q1 + 2q2 = 1, равновесная линия для q1; если комбинация q1 и q2 ниже этой линии, q1 (доля желтогорлых самцов) возрастает; если комбинация q1 и q2 выше этой линии, q1 сокращается. Вторая линия (линия с большим наклоном) — это линия 2q1 + q2 = 1, равновесная линия для q2. Справа от нее (когда 2q1 + q2 > 1) q2 возрастает; слева (когда 2q1 + q2 < 1) q2 сокращается. Стрелками обозначены направления изменения соотношений типов в популяциях; серые линии соответствуют типичным динамическим путям. Общая идея та же, что и на .

Рис. 12.12. Динамика популяции в эволюционной версии игры КНБ

На каждой из двух серых линий один из показателей q1 и q2 не возрастает и не уменьшается. Следовательно, их пересечение образует точку, в которой q1, q2, а значит, и (1 — q1 — q2) — постоянные. Это означает, что эта точка соответствует полиморфному равновесию. Несложно проверить, что в данном случае q1 = q2 = 1 — q1 — q2 = 1/3. Эти доли типов в популяции эквивалентны вероятностям стратегий в равновесии со смешанными стратегиями в рациональной версии игры КНБ.

Устойчив ли этот полиморфный исход? В общем мы не можем дать однозначного ответа. Динамика указывает на наличие путей (обозначенных на в виде эллипса), которые формируются вокруг данного исхода. Разворачиваются ли они по убывающей спирали по направлению к точке пересечения (в таком случае можно говорить об устойчивости) или по расходящейся спирали (что указывает на неустойчивость), зависит от конкретной реакции соотношения типов в популяции на изменение уровня приспособленности. Эти пути могут даже проходить по траектории, изображенной на , не приближаясь и не отдаляясь от равновесия.

Фактические данные говорят о том, что популяция пятнистобоких игуан вращается вокруг точки полиморфного равновесия с равным соотношением типов; при этом один тип на какой-то период становится более распространенным, но затем более сильный соперник берет над ним верх. Вопрос о том, приближается ли этот цикл к устойчивому равновесию, остается темой дальнейшего изучения. Как минимум один пример такого же взаимодействия, как и в случае КНБ, относится к трем штаммам кишечной палочки, вызывающей пищевые отравления. Каждый штамм бактерии вытесняет любой другой, но вытесняется третьим, как и в игре с тремя типами, о которой шла речь выше. Ученые, изучающие соперничество между тремя штаммами кишечной палочки, доказали, что полиморфное равновесие может быть устойчивым, если взаимодействие между парами остается локальным, а небольшие колонии каждого штамма постоянно перемещаются.

 

6. Игра «ястреб — голубь»

Игра «ястреб — голубь» стала первой изученной биологами в процессе разработки теории эволюционных игр. В ней есть полезные параллели с дилеммой заключенных и игрой в труса, поэтому мы описываем ее здесь, чтобы закрепить и углубить ваше понимание соответствующих концепций.

В игре участвуют не птицы этих двух видов, а двое животных одного и того же вида, а «ястреб» и «голубь» — просто названия их стратегий. Суть игры — соперничество за ресурс. Стратегия «ястреб» агрессивна и направлена на получение всего ресурса стоимостью V. Стратегия «голубь» компромиссна и сводится к готовности разделить ресурс и избежать драки. Когда два игрока типа «ястреб» противостоят друг другу, они вступают в драку. Каждое животное с одинаковой вероятностью (равной 1/2) может либо победить и получить V, либо проиграть, получить травмы и — C. Следовательно, ожидаемый выигрыш каждого игрока равен (V–C)/2. Когда в игру вступают два «голубя», они без драки делят между собой ресурс, поэтому выигрыш каждого из них составляет V/2. Когда игрок типа «ястреб» вступает в противостояние с игроком типа «голубь», последний спасается бегством и получает выигрыш 0, тогда как первый — выигрыш V. На рис. 12.13 представлена таблица выигрышей в этой игре.

Рис. 12.13. Таблица выигрышей для игры «ястреб — голубь»

Анализ этой игры аналогичен анализу дилеммы заключенных и игры в труса, только в ней числовые выигрыши заменены алгебраическими символами. Мы сопоставим равновесия в этой игре, когда игроки рационально выбирают стратегию «ястреб» или «голубь», после чего сравним исходы игры, когда игроки действуют автоматически, а успех вознаграждается более быстрым воспроизводством.

А. Рациональный стратегический выбор и равновесие

1. Если V > C, то это дилемма заключенных, в которой стратегия «ястреб» соответствует стратегии «отказ от сотрудничества», а стратегия «голубь» — стратегии «сотрудничать». Стратегия «ястреб» — доминирующая для каждого игрока, но комбинация стратегий «голубь»/«голубь» — более благоприятный исход для обоих игроков.

2. Если V < C, тогда это игра в труса. Теперь (V–C)/2 < 0, а значит, «ястреб» больше не доминирующая стратегия. В игре два равновесия Нэша в чистых стратегиях: «ястреб»/«голубь» и «голубь»/«ястреб». В игре также есть равновесие в смешанных стратегиях, при котором вероятность p выбора игроком Б стратегии «ястреб» имеет такое значение, которое поддерживает безразличие игрока А в отношении выбора стратегий:

Б. Эволюционная устойчивость при V  >  C

Начнем с популяции, состоящей преимущественно из «ястребов», и проверим, могут ли ее захватить мутанты типа «голубь». Придерживаясь условных обозначений для подобных игр, мы могли бы выразить долю мутантного фенотипа в популяции как m (от слова «mutant»), но для ясности будем использовать для мутанта типа «голубь» обозначение d (от «dove»). Таким образом, доля «ястребов» в популяции составляет (1 — d). Тогда в противостоянии со случайно выбранным соперником «ястреб» будет встречаться с «голубем» в d случаях и получит V в каждом из них, а также встретится с другим «ястребом» в (1 — d) случаях и получит (V–C)/2 в каждом. Следовательно, уровень приспособленности «ястреба» равен [dV + (1 — d)(V–C)/2]. Аналогичным образом уровень приспособленности одного из мутантов типа «голубь» составляет [d(V/2) + (1 — d)×0]. Поскольку V > C, отсюда следует, что (V–C)/2 > 0. Кроме того, V > 0 подразумевает, что V > V/2. В таком случае при любом значении d от 0 до 1 имеем

Стало быть, у «ястреба» более высокий уровень приспособленности, поэтому мутанты типа «голубь» не могут захватить популяцию. Стратегия «ястреб» эволюционно устойчива, а популяция мономорфна (все «ястребы»).

То же самое верно и для любой доли «голубей» в популяции при всех значениях d. Следовательно, какой бы ни была исходная комбинация типов, доля «ястребов» будет расти и они будут доминировать. Кроме того, если исходная популяция состоит только из «голубей», мутанты типа «ястреб» могут ее захватить. Таким образом, эта динамика говорит о том, что «ястреб» — единственная эволюционно устойчивая стратегия. Данный алгебраический анализ подтверждает и обобщает сделанный ранее вывод в числовом примере дилеммы заключенных в контексте игры в ценообразование (см. ).

В. Эволюционная устойчивость при V  <  C

Если исходная популяция преимущественно «ястребы» с небольшой долей d мутантов типа «голубь», то у каждого из них такая же функция уровня приспособленности, как и функции, выведенные в . Однако когда V < C, (V–C)/2 < 0. Мы по-прежнему имеем V > 0, а значит, V > V/2. Но поскольку значение d очень маленькое, сравнение этих членов с (1 — d) играет гораздо более важную роль, чем сравнение с d, поэтому

Следовательно, уровень приспособленности мутантов типа «голубь» выше уровня приспособленности доминирующего типа «ястреб», поэтому мутанты типа «голубь» могут захватить популяцию.

Однако если исходная популяция почти полностью состоит из «голубей», мы должны проанализировать, может ли небольшая доля h мутантов типа «ястреб» захватить ее. (Обратите внимание, что, поскольку мутант теперь относится к типу «ястреб», мы использовали символ h (hawk) для обозначения доли мутантов-захватчиков.) Уровень приспособленности мутантов типа «ястреб» [h(V–C)/2 + (1 — h)V] сопоставим c [h × 0 + (1 — h)(V/2)] в случае мутантов типа «голубь». И снова V < C подразумевает, что (V–C)/2 < 0, а V > 0 подразумевает, что V > V/2. Но когда значение h небольшое, получаем

Это неравенство показывает, что уровень приспособленности «ястребов» выше, поэтому они захватят популяцию «голубей». Таким образом, мутанты каждого типа могут захватить популяцию другого типа. Поэтому она не может быть мономорфной и ни один чистый фенотип не может быть эволюционно устойчивой стратегией. Алгебраические расчеты снова подтверждают сделанный ранее вывод в числовом примере дилеммы заключенных в контексте игры в труса (см. и ).

А что происходит в популяции, когда V < C? Существуют два сценария. В первом каждый игрок придерживается чистой стратегии, но в популяции наблюдается устойчивая комбинация игроков, использующих разные стратегии. Это полиморфное равновесие, сформировавшееся в игре в труса, о которой шла речь в . Второй сводится к применению каждым игроком смешанной стратегии. Мы начнем с полиморфного случая.

Г. V < C : устойчивая полиморфная популяция

Когда доля «ястребов» в популяции равна h, уровень их приспособленности составляет h(V–C)/2 + (1 — h)V, а уровень приспособленности «голубя» — h × 0 + (1 — h)(V/2). Уровень приспособленности «ястреба» выше, если

Это неравенство можно упростить:

V — hC > 0,

В таком случае уровень приспособленности типа «голубь» выше, когда h > V/C, или когда (1 — h) < 1 — (V/C) = (C–V)/C. Стало быть, каждый тип более приспособлен, если его численность меньше. Следовательно, мы имеем устойчивое полиморфное равновесие в равновесной точке, в которой доля «ястребов» в популяции составляет h = V/C. Это и есть рассчитанная в вероятность, с которой каждый отдельный игрок выбирает стратегию «ястреб» в равновесии Нэша в смешанных стратегиях данной игры при условии рационального поведения игроков. К тому же мы также получили эволюционное «обоснование» исхода в виде смешанной стратегии в игре в труса.

Мы предоставляем вам возможность построить для этого случая график, аналогичный представленному на . Для этого вам понадобится определить динамику, в соответствии с которой доли каждого типа в популяции сходятся к устойчивой равновесной комбинации.

Д. V < C : каждый игрок смешивает стратегии

Вспомните рассчитанную в равновесную смешанную стратегию в рациональной игре, где p = V/C — вероятность выбора стратегии «ястреб», а (1 — p) — вероятность выбора стратегии «голубь». Есть ли параллель в эволюционной версии игры, когда фенотип выбрал бы смешанную стратегию? Проанализируем такую возможность. У нас по-прежнему есть игроки типа Я, использующие чистую стратегию «ястреб», и игроки типа Г, использующие чистую стратегию «голубь». Но теперь может существовать еще и третий фенотип С, применяющий смешанную стратегию, включая в нее стратегию «ястреб» с вероятностью p = V/C и стратегию «голубь» с вероятностью 1 — p = 1 — (V/C) = (C–V)/C.

Когда Я или Г встречает С, их ожидаемый выигрыш зависит от p — вероятности того, что С выберет стратегию Я, и от (1 — p) — вероятности того, что С выберет стратегию Г. Тогда каждый игрок получает p, умноженное на его выигрыш в игре против Я, плюс (1 — p), умноженное на его выигрыш в игре против Г. Таким образом, когда Я противостоит С, его ожидаемый выигрыш составит

А когда Г противостоит С, его выигрыш равен

Уровни приспособленности двух типов одинаковы. Это не должно стать неожиданностью: соотношение чистых стратегий должно обеспечивать именно такое равенство. Тогда игрок типа С в противостоянии с другим игроком типа С получит тот же ожидаемый выигрыш. Для того чтобы было проще ссылаться на него в дальнейшем, обозначим его символом K, где K = V(C–V)/2C.

Но такое равенство создает проблему при проверке стратегии С на эволюционную устойчивость. Предположим, популяция целиком состоит из игроков типа С и в нее вторгаются мутанты типа Я, составляющие совсем малую долю h от общей численности популяции. Тогда типичный мутант получит ожидаемый выигрыш h(V–C)/2 + (1 — h)K. Для того чтобы вычислить ожидаемый выигрыш игрока типа С, необходимо учесть, что он противостоит другому игроку типа С в (1 — h) случаях и каждый раз получает выигрыш K. Далее он вступает в противостояние с игроком типа Я в h взаимодействиях и в их ходе использует стратегию Я в p случаях и получает выигрыш (V–C)/2 и стратегию Г в (1 — p) случаев и получает выигрыш 0. Таким образом, общий ожидаемый выигрыш (уровень приспособленности) игрока типа С составляет

Поскольку у h очень малое значение, приспособленность игроков типа С и мутантов типа Я почти эквивалентна. Дело в том, что, когда мутантов очень мало, игроки как типа Я, так и типа С в основном противостоят только игрокам типа С и, как мы только что выяснили, в этом взаимодействии у обоих типов одинаковый уровень приспособленности.

Эволюционная устойчивость зависит от того, будет ли исходная популяция типа С более приспособленной, чем мутант типа Я, когда каждый из них противостоит одному из немногочисленных мутантов. В алгебраической форме тип С более приспособлен, чем тип Я, в противоборстве с другими мутантами типа Я, когда pV(C–V)/2C = pK > (V–C)/2. В нашем примере это условие выполняется, так как V < C, то есть (V–C) имеет отрицательное значение, а K имеет положительное значение. На интуитивном уровне это условие говорит нам о том, что мутант типа Я всегда будет получать более низкие результаты в противостоянии с другим мутантом типа Я из-за высоких издержек в связи с дракой, но тип С вступает в драку только иногда, а значит, несет такие издержки лишь в p случаях. В целом тип С добивается большего в противостоянии с мутантами.

Аналогично успех вторжения типа Г в популяцию С зависит от сравнения уровня приспособленности мутанта типа Г с уровнем приспособленности мутанта типа С. Как и раньше, мутант противостоит другому игроку типа Г в d случаях, а игроку типа С в (1 — d) случаях. Тип С также противостоит другому игроку типа С в (1 — d) случаях, однако в d случаях С противостоит Г и использует стратегию Я в p из этих случаев, получая при этом выигрыш pV, а также применяет стратегию Г в (1 — p) случаях, получая при этом выигрыш (1 — p)V/2. Из этого следует, что уровень приспособленности типа «голубь» составляет [dV/2 + (1 — d)K], тогда как уровень приспособленности типа С равен d × [pV+(1 — p)V/2] + (1 — d)K. Последние члены выражений, описывающих уровни приспособленности, идентичны, а значит, вторжение «голубей» может быть успешным, только если V/2 больше pV + (1 — p)V/2. Это условие не выполняется: последнее выражение содержит взвешенное среднее V и V/2, которое больше V/2 при V > 0. Таким образом, вторжение мутантов типа «голубь» не может завершиться успехом.

Этот анализ говорит о том, что С — эволюционно устойчивая стратегия. Следовательно, если V < C, популяция может продемонстрировать любой из двух эволюционно устойчивых исходов. Один подразумевает смешение типов (устойчивый полиморфизм), а другой — присутствие в популяции только одного типа, смешивающего стратегии в том же соотношении, которое определяет полиморфизм.

Е. Немного общей теории

Теперь обобщим идеи, представленные в данном разделе, чтобы получить теоретическую основу и набор инструментов для дальнейшего использования. Такое обобщение неизбежно требует несколько более абстрактных обозначений и немного алгебры. В связи с этим мы рассмотрим только мономорфные равновесия в одном виде. Читатели, которые владеют математикой на должном уровне, смогут по аналогии описать полиморфные случаи с двумя видами. Читатели, которые не готовы к восприятию данного материала или для них он не представляет интереса, могут пропустить этот раздел без ущерба для целостности изложения материала.

Проанализируем взаимодействие между случайно отобранными из одного вида парами, популяции которого доступны стратегии I, J, K, …, среди которых могут быть как чистые, так и смешанные. Каждый отдельный член популяции запрограммирован на использование только одной из этих стратегий. Обозначим E(I, J) выигрыш игрока I от одного взаимодействия с игроком J. Выигрыш игрока I в противостоянии с другим представителем своего типа составляет E(I, I) в той же системе обозначений. Пусть W(I) — уровень приспособленности игрока I. Это просто его ожидаемый выигрыш в противостоянии с произвольно выбранными соперниками, когда вероятность встретить игрока определенного типа равна доле этого типа в популяции.

Допустим, популяция состоит только из игроков типа I. Проанализируем, может ли такая конфигурация быть эволюционно устойчивой. Для этого представим, что популяцию захватывают несколько мутантов типа J; значит, доля m мутантов в популяции очень маленькая. Уровень приспособленности типа I составляет

W (I) = mE (I, J) + (1 — m ) E (I, I).

Уровень приспособленности мутанта равен

W (J) = mE (J, J) + (1 — m ) E (J, I).

Следовательно, разница между уровнями приспособленности основного и мутантного типов популяции определяется формулой

W (I) — W (J) = m [ E (I, J) — E(J, J)] + (1 — m ) [ E (I, I) — E (J, I)].

Поскольку m очень маленькое, уровень приспособленности основного типа будет выше по сравнению с приспособленностью мутанта, если вторая часть представленного выражения имеет положительное значение, то есть

W (I) >  W (J), если E (I, I) >  E (J, I).

В таком случае основной тип в популяции не может быть захвачен; он более приспособлен, чем мутантный тип, когда каждый противостоит члену основного типа. Это и есть первичный критерий эволюционной устойчивости. Напротив, если W(I) < W(J) — тогда E(I, I) < E(J, I) — вторжение мутантов типа J будет успешным, поэтому популяция, полностью состоящая из игроков типа I, не может быть эволюционно устойчивой.

Однако возможна ситуация, когда E(I, I) = E(J, I), как и происходит на самом деле, если популяция изначально состоит из одного фенотипа, смешивающего чистые стратегии I и J (мономорфное равновесие со смешанной стратегией), как было в последнем варианте игры «ястреб — голубь» (). Тогда разность между W(I) и W(J) зависит от того, насколько успешно оба типа противостоят мутантам. Когда E(I, I) = E(J, I), получаем W(I) > W(J), если E(I, J) > E(J, J). Это вторичный критерий эволюционной устойчивости, который следует применять, только если первичный критерий не позволяет сделать однозначный вывод, то есть если E(I, I) = E(J, I).

При применении вторичного критерия — поскольку E(I, I) = E(J, I) — существует вероятность того, что он также не позволит сделать однозначный вывод. Другими словами, возможно, что E(I, J) = E(J, J). Это случай нейтральной устойчивости, о которой шла речь в . Если ни первичный, ни вторичный критерий не обеспечивают убедительных результатов, то I считается нейтральной эволюционно устойчивой стратегией.

Обратите внимание, что у первичного критерия есть одна особенность. Он гласит, что если стратегия I эволюционно устойчива, то для всех остальных стратегий J, которые может попробовать применить мутант, E(I, I) ≥ E(J, I). Это означает, что стратегия I — наилучший ответ на саму себя. Иными словами, если бы члены этой популяции вдруг начали играть как придерживающиеся рационального поведения игроки, применение ими всеми стратегии I было бы равновесием Нэша. Таким образом, эволюционная устойчивость подразумевает наличие равновесия Нэша в соответствующей рациональной игре!

Это поразительный результат. Если вас не удовлетворяло предположение о рациональном поведении, лежащее в основе теории равновесий Нэша, представленной в предыдущих главах, и вы обратились к эволюционной теории в поисках более подходящего объяснения, то теперь вы убедились, что она дает те же результаты. Поистине занимательное биологическое описание (фиксированное не максимизирующее поведение, но при этом выбор в ответ на полученный в итоге уровень приспособленности) не обеспечивает новых исходов, а, скорее, предоставляет косвенное обоснование равновесия Нэша. Когда в игре есть несколько равновесий Нэша, эволюционная динамика может даже предоставить хороший аргумент для выбора одного из них.

Тем не менее ваша укрепившаяся уверенность в равновесии Нэша должна быть взвешенной. Наше определение эволюционной устойчивости скорее статично, чем динамично. Оно лишь позволяет проверить, что конфигурация популяции (мономорфная или полиморфная с надлежащим соотношением типов), которую мы тестируем на наличие равновесия, не может быть захвачена небольшой популяцией мутантов. Такая проверка не поможет определить, исчезнут ли все нежелательные типы и будет ли достигнута равновесная конфигурация в случае произвольной исходной комбинации типов в популяции. Кроме того, проверка проводится в отношении конкретных классов мутантов, которые считаются логически возможными, но если теоретик некорректно выполнит эту классификацию и в действительности может появиться тип мутантов, который он не учел, этот мутант может совершить успешное вторжение и разрушить предполагаемое равновесие. В конце анализа дилеммы заключенных с двумя повторениями, о которой шла речь в , мы предупреждали о подобной вероятности, и в упражнениях вы увидите, как такое может произойти. И наконец, в мы убедились, что эволюционная динамика может вообще не гарантировать сходимости к более благоприятному из двух равновесий.

 

7. Взаимодействие всех членов популяции и между разными видами

До сих пор мы фокусировались на ситуациях, в которых каждая игра проводится между двумя игроками, отобранными из популяции случайным образом. Однако нередки случаи, когда все члены популяции играют одновременно или взаимодействуют два разных вида; они требуют специального анализа, и мы представим его в данном разделе.

А. Игра по всему полю

В ходе эволюционного взаимодействия встречаются ситуации, когда все члены популяции играют одновременно, а не парами. В биологии стадо животных с определенной комбинацией различных, заданных на генетическом уровне моделей поведения может бороться за тот или иной ресурс или территорию. В экономике или бизнесе многие компании, стратегии которых продиктованы корпоративной культурой, могут конкурировать все со всеми.

Такие эволюционные игры находятся в той же зависимости с рациональными коллективными играми из , что и парные эволюционные игры, представленные в предыдущих разделах, с рациональными играми с двумя участниками, о которых шла речь в главах 4–7. Подобно тому как мы преобразовали графики ожидаемых выигрышей из этих глав в диаграммы уровней приспособленности на , и , мы можем преобразовать графики для игр с коллективным действием (см. ) в графики приспособленности в эволюционных играх.

Рассмотрим в качестве примера вид животных, все члены которого приходят на общее пастбище. В этом виде есть два фенотипа: один агрессивно борется за пищу, а другой бродит вокруг и пытается подобрать то, что удается. Если доля агрессивных особей небольшая, для них это лучше, но если их слишком много, выиграют тихони, которые смогут добыть себе больше пищи, игнорируя постоянные схватки сородичей. По сути, это коллективная игра в труса, в которой был бы точно такой же график приспособленности, как и на . Поскольку здесь не требуется никаких новых принципов или методов, мы предоставляем вам возможность самостоятельно развить эту идею.

Б. Взаимодействие между видами

Теперь рассмотрим последний тип эволюционного взаимодействия, а именно тот, который происходит между членами не одного и того же, а разных видов. Во всех предыдущих случаях у игроков из определенной популяции были одинаковые предпочтения. Например, в игре в доверие из игроки типа L от рождения отдавали предпочтение кафе Local Latte, а игроки типа S — кафе Starbucks, однако уровень приспособленности каждого типа был выше, когда встреча происходила в Local Latte. Структура игры «битва полов» (единственный класс игр, который мы еще не проанализировали) подразумевает иную схему выигрышей. Хотя участники такой игры по-прежнему заинтересованы встретиться либо в Starbucks, либо в Local Latte (если они не встретятся, выигрыш каждого составит 0), теперь каждый тип предпочитает другое кафе. Это предпочтение позволяет выделить два типа. На языке биологии их больше нельзя рассматривать как случайно выбранные из однородной популяции животных. Они, скорее, должны принадлежать к разным видам.

Для изучения таких игр с эволюционной точки зрения расширим нашу методику на случай, когда пары образуются из спонтанным образом выбранных представителей разных видов. Предположим, существует большая популяция «мужчин» и большая популяция «женщин». Из них в случайном порядке выбирается по одному игроку, которым предлагают попытаться встретиться. Все мужчины договариваются между собой о выигрышах при выборе кафе Starbucks, Local Latte и отсутствии встречи. Все женщины договариваются о том же. Но в каждой популяции есть как противники компромисса, так и его сторонники. Противник компромисса всегда будет выбирать любимое кафе своего вида. Сторонник компромисса, понимая, что члены другого вида хотят противоположного, отправится именно в это место.

Если в случайно отобранную пару попадает противник компромисса из одного вида и сторонник компромисса из другого, в итоге будет получен исход, которому отдает предпочтение противник компромисса. Если пару образуют два противника компромисса, встреча так и не состоится; как ни странно, аналогичный результат будет получен в случае двух сторонников компромисса, поскольку каждый из них отправится в любимое кафе другого. (Не забывайте, что игроки должны делать выбор независимо друг от друга и не могут договориться о месте встречи. Возможно, даже если бы у них и получилось собраться вместе заранее, они бы попали в тупиковую ситуацию: «Нет, я настаиваю на том, чтобы уступить твоим предпочтениям».)

Мы изменим таблицу выигрышей на так, как показано на рис. 12.14, — то, что раньше было вариантами выбора, теперь выступает в качестве действий, которые предопределяет тип (противник или сторонник компромисса).

Рис. 12.14. Выигрыши в игре «битва полов»

В сравнении со всеми эволюционными играми, которые мы анализировали до этого, у данной игры есть новое свойство: игрок строки и игрок столбца — представители разных видов. Хотя каждый вид представляет собой однородную совокупность противников и сторонников компромисса, их соотношение не обязательно должно быть одинаковым в обоих видах. Следовательно, нам необходимо ввести две переменные, описывающие эти две комбинации, и изучить динамику в обоих случаях.

Пусть x — доля противников компромисса среди мужчин, а y — среди женщин. Рассмотрим конкретного противника компромисса из числа мужчин. Встречаясь с женщиной — противницей компромисса в y случаях, он получает выигрыш 0, а при встрече с женщиной — сторонницей компромисса в остальных случаях — выигрыш 2. Следовательно, его ожидаемый выигрыш (уровень приспособленности) составляет y × 0 + (1 — y) × 2 = 2(1 — y). Аналогично уровень приспособленности мужчины — сторонника компромисса равен y × 1 + (1 — y) × 0 = y. Таким образом, из всех участников игры уровень приспособленности противников компромисса выше, когда 2(1 — y) > y, или y < 2/3. Будучи более приспособленными, мужчины из числа противников компромисса будут воспроизводиться быстрее; другими словами, x увеличивается, когда y < 2/3. Обратите внимание на новый и на первый взгляд неожиданный аспект полученного исхода: уровень приспособленности каждого типа в пределах соответствующего вида зависит от доли типов в других видах. В этом нет ничего удивительного, поскольку теперь каждый вид ведет игры против другого вида.

Проанализировав аналогичным образом другой вид, получим результат, согласно которому уровень приспособленности у противников компромисса из числа женщин выше, а значит, y увеличивается при x < 2/3. Для того чтобы понять этот результат на интуитивном уровне, обратите внимание на то, что противники компромисса каждого вида добиваются более весомых результатов, когда у другого вида своих противников компромисса не особо много, поскольку при этом они достаточно часто встречались бы со сторонниками компромисса другого вида.

На рис. 12.15 показана динамика конфигураций двух видов. Переменные x и y могут принимать значения от 0 до 1, поэтому мы получили график в виде единичного квадрата с x и y на их обычных осях. Вертикальная линия AB содержит все точки, где x = 2/3 — равновесная точка, в которой значение y не увеличивается и не уменьшается. Если текущие доли типов в популяции находятся слева от этой линии (то есть x < 2/3), значение y увеличивается (смещая долю женщин — противниц компромисса в вертикальном восходящем направлении). Если текущие доли находятся справа от линии AB (x > 2/3), значение y уменьшается (движение в вертикальном нисходящем направлении). Аналогично горизонтальная линия CD отображает все точки, где y = 2/3, то есть равновесную точку для x. Когда доля женщин — противниц компромисса находится ниже этой линии (то есть когда y < 2/3), доля мужчин — противников компромисса (x) увеличивается (движение по горизонтали направо), а когда над этой линией, уменьшается, то есть при y > 2/3 (движение по горизонтали налево).

Рис. 12.15. Динамика популяций в игре «битва полов»

Объединив движение x и y, мы сможем отследить их динамические пути, чтобы определить местоположение равновесия популяции. Например, начиная с исходной точки в нижнем левом квадранте эта динамика подразумевает увеличение значений как x, так и y. Это общее перемещение (в верхний правый угол) продолжается до тех пор, пока либо x = 2/3 и y начнет уменьшаться (движение происходит в правый правый угол), либо y = 2/3 и x начнет уменьшаться (перемещение направлено в верхний левый угол). Аналогичные процессы в каждом квадранте позволяют получить криволинейные динамические пути, показанные на рис. 12.5; их подавляющее большинство ведет либо в нижний правый, либо в верхний левый угол диаграммы, то есть они сходятся в точке (1, 0) или в точке (0, 1). Таким образом, в большинстве случаев эволюционная динамика приводит к конфигурации, в которой один вид состоит только из противников компромисса, а другой — только из его сторонников. Каким будет тип того или иного вида, зависит от исходных условий. Обратите внимание, что динамический путь популяции, начиная с малого значения x и большего значения y, с большей вероятностью сперва пересечет линию CD и направится к точке (0, 1) (все члены популяции женщины — противницы компромисса, y = 1), чем сначала пересечет линию AB и направится к точке (1, 0). Те же результаты будут получены в случае исходной позиции с малым значением y и большим значением x. Вид, который начинает игру с большей долей противников компромисса, имеет преимущество в том смысле, что к ее концу будет состоять только из них и получит выигрыш 2.

Если исходные доли правильно сбалансированы, динамика популяции может привести к полиморфной точке (2/3, 2/3). Но в отличие от полиморфного исхода в игре в труса, полиморфизм в игре «битва полов» неустойчив. Большинство случайных переходов запустят кумулятивный процесс, который приведет к одному из крайних равновесий; это и есть две эволюционно устойчивые стратегии в данной игре. Это общее свойство: игры с участием разных видов могут иметь только эволюционно устойчивые стратегии, мономорфные для каждого вида.

 

8. Эволюция сотрудничества и альтруизма

Теория эволюционных игр основана на двух фундаментальных идеях: во-первых, что отдельные организмы ведут игры с другими организмами своего вида или с членами других видов; во-вторых, что количество генотипов, которые приводят к образованию стратегий, обеспечивающих более высокий выигрыш (более высокий уровень приспособленности), увеличивается, тогда как доля остальных в популяции сокращается. Эти идеи подразумевают ожесточенную борьбу за выживание в том виде, в каком ее подают некоторые интерпретаторы теории Дарвина, которые понимают «выживание самых приспособленных» в буквальном смысле и создали образ «природы с ее законом когтей и клыков». На самом деле в природе немало примеров сотрудничества (когда отдельные животные ведут себя таким образом, что это приносит пользу всей группе) и даже альтруизма (когда отдельные животные несут значительные издержки ради других членов группы). Пчелиный рой и колония муравьев — самые наглядные примеры. Можно ли такое поведение согласовать с эволюционными играми?

Биологи используют классификацию из четырех (фенотипов или генотипов) способов формирования сотрудничества и альтруизма у эгоистичных животных. Ли Дугаткин выделяет четыре категории: 1) семейная динамика; 2) взаимовыгодные сделки; 3) эгоистичное групповое взаимодействие; 4) групповой альтруизм.

Поведение муравьев и пчел — пожалуй, самый доступный для понимания пример семейной динамики. Отдельные члены муравьиной колонии или пчелиного роя близкие родственники, поэтому у них достаточно большое количество общих генов. Все рабочие муравьи в колонии — полные сестры, а значит, у них половина общих генов; выживание и размножение двух сестер способствует размножению генов одного муравья в такой же мере, как и его собственное выживание. Все рабочие пчелы одного роя — полусестры, то есть у них четверть общих генов. Отдельный муравей или пчела не вычисляют, стоит ли рисковать собственной жизнью ради двух сестер, но базовый генотип групп, которые демонстрируют такое поведение (фенотип), будет разрастаться. Мысль о том, что по большому счету эволюция происходит на уровне генов, оказала огромное влияние на биологию, хотя многие неправильно ее истолковали, как произошло в свое время с исходной идеей естественного отбора Дарвина. Интересна идея о том, что так называемый эгоистичный ген может процветать благодаря неэгоистичному поведению в более крупных генных структурах, таких как клетка. Точно так же клетка и ее гены могут процветать за счет кооперативного участия в работе организма и выполнения возложенных на нее задач.

Взаимный альтруизм может возникнуть и между не состоящими в родстве членами одного или разных видов. Такое поведение — это, по сути, пример решения дилеммы заключенных посредством повторения игры, в ходе которой ее участники используют стратегии, поразительно напоминающие стратегию «око за око». Например, некоторые мелкие рыбы или креветки питаются паразитами, которые собираются на зубах и жабрах более крупной рыбы; крупная рыба позволяет мелким рыбешкам заплывать к себе в рот и выполнять «работу чистильщика», не причиняя им вреда. Еще более поразительный, хотя и жуткий пример связан с летучими мышами-вампирами, которые делятся выпитой кровью с теми, у кого охота не задалась. Во время эксперимента, в ходе которого летучих мышей из разных мест обитания объединили в одну группу и некоторых из них лишили пищи, «только летучим мышам, оказавшимся на грани голодания (то есть которые могли погибнуть без пищи в течение двадцати четырех часов), дали свою кровь другие мыши, принимавшие участие в эксперименте. Однако, что еще примечательнее, особи получали кровь только от летучих мышей из своего места обитания… Кроме того, вампиры гораздо чаще отрыгивали кровь, чтобы поделиться ею именно с теми особями из своего места обитания, которые пришли им на помощь, когда они сами в этом нуждались». Опять же, не следует думать, что каждое животное сознательно вычисляет, что отвечает его собственным интересам — продолжение сотрудничества или отказ от него. Напротив, такое поведение носит инстинктивный характер.

Эгоистичное групповое взаимодействие возникает тогда, когда каждый отдельный организм заинтересован в сотрудничестве, если остальные делают то же самое. Другими словами, этот тип кооперативного поведения применим в случае выбора благоприятного исхода в играх в доверие. По мнению Дугаткина, в агрессивной среде популяции более склонны к эгоистичному групповому взаимодействию, чем в более умеренной среде. В неблагоприятных условиях отказ любого члена группы от сотрудничества может закончиться катастрофой для всей группы, в том числе и для уклониста. При таких условиях каждое животное играет важнейшую роль в выживании, поэтому ни один член группы не уклоняется от сотрудничества, если другие несут свою часть общего бремени. В более благоприятной среде каждый может рассчитывать воспользоваться преимуществами, созданными усилиями других членов группы, не подвергая риску выживание всей группы, в том числе и себя самого.

Следующая категория выходит за рамки биологии и распространяется на социологию: организм (а также его клетки и в конечном счете гены) может извлечь пользу из кооперативного поведения в рамках совокупности организмов, а именно общества. Это приводит нас к идее группового альтруизма, которая подразумевает, что определенный уровень сотрудничества должен присутствовать даже между отдельными членами группы, которые не являются близкими родственниками. Нам действительно известны случаи такого поведения. Наглядным примером могут служить группы хищников, таких как волки, и группы человекообразных обезьян, которые часто ведут себя как большие семьи. Сотрудничество возникает даже среди потенциальных жертв, когда отдельные рыбы в косяке по очереди высматривают хищников. Сотрудничество возможно также между разными видами.

Общая идея состоит в том, что группа, члены которой демонстрируют кооперативное поведение, с большей вероятностью добьется успеха во взаимодействии с другими группами, чем группа, члены которой стремятся сыграть роль «безбилетника». Когда в каком-то конкретном контексте эволюционной динамики межгрупповой отбор более сильный фактор, чем внутригрупповой, мы можем наблюдать групповой альтруизм.

Инстинкт заложен в мозге отдельного организма на генетическом уровне, однако взаимность и сотрудничество могут возникнуть как результат целенаправленного мышления или экспериментирования в рамках группы или распространиться не посредством генетики, а путем социализации (с помощью наглядного обучения или наблюдения за действиями старших). Разным видам и ситуациям свойственна своя относительная важность этих двух каналов — природы и воспитания. Можно было бы ожидать, что социализация более важна у людей, но есть примеры ее важной роли и у других животных. Мы хотим привести особенно поразительный пример. В экспедиции Роберта Скотта (1911–1912 годы) на Южный полюс участвовали собаки породы сибирская лайка. Эти собаки, собранные в одну группу и специально подготовленные, за несколько месяцев сформировали поразительную систему сотрудничества и поддерживали ее с помощью схем наказания. «Они чрезвычайно эффективно объединили усилия, направленные против любого члена группы, не желавшего тянуть свою часть ноши, или против того, кто тянул слишком сильно… их методы наказания всегда были неизменны и заканчивались, если их не сдерживать, тем, что они сами, вероятно, назвали бы справедливостью, а мы называем убийством».

Этот воодушевляющий рассказ о том, как кооперативное поведение можно совместить с теорией эволюционных игр, позволяет сделать вывод, что дилемма эгоистичных действий преодолима. На самом деле ученые, изучающие альтруистическое поведение, не так давно сообщили об экспериментальном подтверждении существования такого альтруистического наказания, или сильной взаимности (в отличие от взаимного альтруизма), у людей. Полученные экспериментальные данные свидетельствуют о том, что люди готовы наказывать тех, кто не выполняет свою часть обязанностей в коллективной среде, даже если это сопряжено с определенными издержками и не сулит будущей выгоды. Такая склонность к сильной взаимности может даже помочь объяснить возникновение человеческой цивилизации, если группы с этим качеством обладали более сильной способностью к выживанию в условиях войны и прочих катастроф. Однако, несмотря на все эти выводы, сильная взаимность может не получить широкого распространения в животном мире. «По сравнению с непотизмом, объясняющим сотрудничество муравьев и любого другого существа, заботящегося о подрастающем поколении, примеры взаимности оказались весьма немногочисленными. Вероятно, это вызвано тем, что она требует не только многократных взаимодействий, но и способности распознавать других индивидов, а также “ведения счета” их поступкам». Другими словами, те самые условия, которые, согласно нашему теоретическому анализу, приведенному в , необходимы для решения повторяющейся дилеммы заключенных, по всей вероятности, актуальны и в контексте эволюционных игр.

 

Резюме

Биологическая теория эволюции в некорых аспектах пересекается с теорией игр, используемой социологами. Эволюционные игры разыгрываются поведенческими фенотипами с генетически предопределенными, а не рационально выбранными стратегиями. В эволюционных играх фенотипы с более высоким уровнем приспособленности выдерживают несколько повторных взаимодействий с другими игроками, с тем чтобы воспроизвести и увеличить свою представленность в популяции. Популяция, содержащая один или более фенотипов в определенных пропорциях, называется эволюционно устойчивой, если ее не могут захватить другие, мутантные, фенотипы или если это ограничивающий исход динамики увеличения численности более приспособленных фенотипов. Если фенотип продолжает доминировать в популяции при столкновении с вторжением мутантного типа, его называют эволюционно устойчивой стратегией, а популяция, состоящая только из этого фенотипа, демонстрирует признаки мономорфизма. Если два или более фенотипа сосуществуют в эволюционно устойчивой популяции, она демонстрирует признаки полиморфизма.

Когда теория эволюционных игр применяется к небиологическим играм, стратегии, которых придерживаются отдельные игроки, считаются стандартными рабочими процедурами или эмпирическими правилами, а не заложенными на генетическом уровне. Процесс воспроизводства выступает в качестве более общих методов передачи информации, таких как социализация, обучение и имитация, а мутации представляют собой экспериментирование с новыми стратегиями.

Эволюционные игры могут иметь структуру выигрышей, аналогичную той, о которой шла речь в и , в том числе в дилемме заключенных и игре в труса. В каждом из этих случаев эволюционно устойчивая стратегия отображает либо равновесие Нэша в чистых стратегиях в соответствующей игре, либо соотношение чистых стратегий в равновесной комбинации в такой игре. В дилемме заключенных эволюционно устойчивая стратегия — «всегда отказ от сотрудничества»; в игре в труса у типов всегда наблюдается более высокий уровень приспособленности, когда их количество ограниченно, поэтому наблюдается полиморфное равновесие; в игре в доверие у немногочисленных типов более низкий уровень приспособленности, поэтому полиморфная конфигурация неустойчива, а равновесия представляют собой крайние варианты. Когда в игру вступают два разных типа представителей каждого из двух разных видов, для определения равновесий используется более сложный анализ, хотя и аналогичным образом структурированный.

Игра «ястреб — голубь» — классический биологический пример; ее анализ сходен с анализом эволюционных версий таких игр, как дилемма заключенных и игра в труса; эволюционно устойчивые стратегии зависят от особенностей структуры выигрышей. Данный анализ можно также выполнить в случае, когда во взаимодействие вступают больше двух типов или когда игра формулируется в общих категориях. Эта теория показывает, что для достижения эволюционной устойчивости необходима равновесная стратегия, эквивалентная равновесию Нэша, которого достигают рациональные игроки.

 

Ключевые термины

Вторичный критерий

Генотип

Игра «ястреб — голубь»

Игра по всему полю

Мономорфизм

Мутация

Нейтральная эволюционно стабильная стратегия

Отбор

Первичный критерий

Полиморфизм

Приспособленность

Фенотип

Эволюционная стабильность

Эволюционно стабильная стратегия

 

Упражнения с решениями

S1. Два путешественника покупают одинаковые сувениры ручной работы, упаковывают их в свои чемоданы и отправляются в обратный путь. К сожалению, авиакомпания теряет оба чемодана. Поскольку авиакомпания не знает стоимости потерянных сувениров, она просит путешественников независимо друг от друга ее назвать и соглашается выплатить каждому из них сумму, эквивалентную меньшей из двух названных. Если одно значение будет выше другого, авиакомпания взыщет штраф 20 долларов с того путешественника, который озвучил более высокую цену, и отдаст 20 долларов путешественнику, назвавшему меньшую сумму. Если указанные суммы окажутся равными, не будет ни вознаграждения, ни штрафа. Никто из путешественников не помнит, сколько заплатил за сувенир, поэтому сама цена не имеет значения; каждый просто называет ту, которую предписывает его тип.

Существует два типа путешественников. Тип «высокая стоимость» всегда называет сумму 100 долларов, а тип «низкая стоимость» — 50 долларов. Пусть h — доля в популяции игроков типа «высокая стоимость».

a) Составьте таблицу выигрышей для игры между двумя путешественниками, выбранными из популяции случайным образом.

b) Постройте график уровня приспособленности типа «высокая стоимость», отобразив значения h на горизонтальной оси. На том же рисунке разместите график уровня приспособленности типа «низкая стоимость».

c) Опишите все равновесия в этой игре. По каждому равновесию укажите, оно мономорфное или полиморфное и устойчиво ли оно.

S2. В шла речь о проверке на наличие эволюционно устойчивой стратегии в трижды повторяющейся дилемме заключенных в контексте игры в ценообразование в ресторанах.

a) Воспользовавшись , дайте исчерпывающее объяснение того, почему популяция, состоящая только из игроков типа В, не может быть захвачена ни мутантами типа Н, ни мутантами типа О.

b) Объясните, почему популяция, состоящая только из игроков типа Н, может быть захвачена мутантами типа В и в какой степени ее могут захватить мутанты типа О. Соотнесите это объяснение с представленной в данной главе концепцией нейтральной устойчивости.

c) И наконец, объясните, почему популяция только из игроков типа О не может быть захвачена мутантами типа В, но может быть захвачена мутантами типа Н.

S3. Рассмотрите популяцию, в которой есть два фенотипа: один прирожденный коллективист (ни за что не сознается), второй прирожденный индивидуалист (охотно сознается). При случайном выборе членов этой популяции они получают те же выигрыши в однократной игре, что и выигрыши в представленной ниже . В повторяющемся взаимодействии популяции доступны две стратегии, такие же как в : В (всегда сознаваться) и О (использовать стратегию «око за око», начав с отказа от признания вины).

a) Предположим, пара игроков разыгрывает эту дилемму два раза подряд. Составьте для этой дважды повторяющейся дилеммы заключенных таблицу выигрышей.

b) Найдите все эволюционно устойчивые стратегии в этой игре.

c) Теперь прибавьте третью стратегию Н — «никогда не сознаваться». Составьте таблицу выигрышей для этой дважды повторяющейся дилеммы заключенных с тремя возможными стратегиями и найдите все эволюционно устойчивые стратегии новой версии этой игры.

S4. В игре в доверие («место встречи») в данной главе выигрыши отражали некую материальную ценность, получаемую игроками в случае различных исходов; например, это могли быть призы за успешно состоявшуюся встречу. Другие представители этой же популяции, наблюдая за ожидаемыми выигрышами (уровнем приспособленности) двух типов, могли определить, какой из них выше, и со временем имитировать стратегию, обеспечивающую более высокий уровень приспособленности. В итоге соотношение типов в популяции изменилось бы. Однако мы можем представить биологическую интерпретацию этой игры. Предположим, игроки столбца — всегда женского пола, а игроки строки — мужского. Когда два таких игрока встречаются, они вступают в брак, и их дети относятся к тому же типу, что и родители. Таким образом, эти типы могут размножаться или вымереть в зависимости от того, смогут они встретиться или нет. Формальная математика новой версии игры превращает ее в игру между двумя видами (хотя в биологии этого не происходит). Следовательно, доля игроков женского пола типа S (обозначим ее как x) необязательно должна быть равной доле игроков мужского пола типа S (назовем ее y).

a) Проанализируйте динамику изменения значений x и y с помощью методов, аналогичных использованным в данной главе в контексте игры «битва полов».

b) Найдите устойчивый исход или исходы этого динамического процесса.

S5. Вспомните о двух путешественниках из , которые должны назвать цену утерянных сувениров. Допустим, в популяции есть еще и третий фенотип путешественника. Он всегда смешивает стратегии, то есть использует смешанную стратегию, в одних случаях указывая стоимость сувенира 100 долларов, а в других 50 долларов.

a) На основании своих знаний о смешанных стратегиях в рациональных играх предложите смешанную стратегию, которую третий фенотип мог бы использовать в данной игре.

b) Составьте для этой игры таблицу выигрышей три на три, когда третий фенотип использует смешанную стратегию, предложенную вами пункте а.

c) Определите, будет ли смешивающий фенотип эволюционно устойчивой стратегией в данной игре. (Подсказка: проверьте, может ли тип «высокая стоимость» или тип «низкая стоимость» захватить популяцию смешивающего типа.)

S6. Рассмотрите упрощенную модель, в которой все получают электричество либо из солнечной энергии, либо из ископаемого топлива, когда в обоих вариантах присутствует неэластичное предложение. (В случае солнечной энергии будем считать, что это неэластичное предложение необходимого оборудования.) Использование солнечной энергии требует больших первоначальных затрат, поэтому при низкой цене на ископаемое топливо (то есть когда его мало кто использует и существует высокий спрос на оборудование для использования солнечной энергии) они могут оказаться непомерно высокими. Напротив, когда многие используют ископаемое топливо, на него формируется высокий спрос (а значит, и цена), тогда как спрос на солнечную энергию (и ее цена) находится на относительно низком уровне. Предположим, таблица выигрышей двух типов потребителей энергии выглядит следующим образом:

a) Опишите все возможные эволюционно устойчивые стратегии в этой игре относительно доли потребителей солнечной энергии s, а также объясните, почему каждый исход будет устойчивым или неустойчивым.

b) Допустим, в сфере производства оборудования для использования солнечной энергии существует значимая экономия от масштаба, благодаря чему экономия на затратах позволяет повысить выигрыши в ячейке таблицы («солнечная энергия», «солнечная энергия») до (y, y), где y > 2. Насколько большим должно быть значение y, чтобы в полиморфном равновесии s = 0,75?

S7. Существуют два типа участников забега (черепахи и зайцы), которые соревнуются друг с другом выбранными в случайном порядке парами. В этом мире зайцы неизменно побеждают черепах. Если в забеге участвуют два зайца, он заканчивается ничьей, но к концу забега оба зайца совершенно измучены. Когда в забеге участвуют две черепахи, соревнование также заканчивается ничьей, но в его ходе черепахи наслаждаются приятной беседой. Таблица выигрышей выглядит следующим образом (где с > 0):

a) Предположим, доля черепах t в популяции составляет 0,5. При каких значениях c уровень приспособленности черепах будет выше, чем у зайцев?

b) При каких значениях c уровень приспособленности черепах будет выше, чем у зайцев, если t = 0,1?

c) Если c = 1, сможет ли один заяц захватить популяцию, состоящую только из черепах? Объясните, почему да или почему нет.

d) Насколько большим относительно t должно быть значение c в случае черепах, чтобы черепахи были более приспособленными, чем зайцы?

e) Какой уровень t относительно c в полиморфном равновесии? При каких значениях c установится такое равновесие? Обоснуйте свой ответ.

S8. Рассмотрите популяцию с двумя типами X и Y со следующей таблицей выигрышей:

a) Определите уровень приспособленности X как функцию от x, где x — доля X в популяции, а также аналогично уровень приспособленности Y как функцию от y.

Предположим, динамика популяции от поколения к поколению подтверждает следующую модель:

где x t  — доля X в популяции за период t; x t+ 1 — доля X в популяции за период t + 1; F Xt  — уровень приспособленности X за период t; F Yt  — уровень приспособленности Y за период t.

b) Предположим, x0, доля X в популяции за период 0, составляет 0,2. Чему равны F X 0 и F Y 0?

c) Найдите значение x1 с помощью значений x0, F X 0, F Y 0 в приведенной выше модели.

d) Чему равны значения F X 1 и F Y 1?

e) Найдите значение x2 (округленное до пяти десятичных знаков).

f) Чему равны значения F X 2 и F Y 2 (округленные до пяти десятичных знаков)?

S9. Рассмотрите эволюционную игру между игроками зеленого и пурпурного типов со следующей таблицей выигрышей:

Пусть g — доля зеленых в популяции.

a) Определите уровень приспособленности пурпурного типа через g.

b) Определите уровень приспособленности зеленого типа через g и a.

c) Постройте график приспособленности пурпурного типа относительно доли g пурпурного типа в популяции. Покажите на нем же три линии, отображающие уровень приспособленности зеленых при a = 2, 3 и 4. Какой вывод на основании этого графика вы можете сделать о диапазоне значений а, обеспечивающих устойчивое полиморфное равновесие?

d) Допустим, значение а попадает в диапазон, найденный в пункте с. Чему равна доля зеленых g относительно a в случае устойчивого полиморфного равновесия?

S10. Докажите следующее утверждение: «Если стратегия строго доминирующая согласно таблице выигрышей в игре с участием рациональных игроков, то в эволюционной версии той же игры она исчезнет, каким бы ни был исходный состав популяции. Если стратегия слабо доминируемая, она сможет сосуществовать с некоторыми другими типами, но не в случае смешения всех типов».

 

Упражнения без решений

U1. Рассмотрите игру в выживание, в которой представители большой популяции животных встречаются друг с другом и либо вступают в схватку, либо делят между собой источник пищи. В популяции есть два фенотипа: один всегда дерется, а другой всегда делится пищей. Будем исходить из того, что в популяции не могут появиться другие мутантные типы. Предположим, ценность источника пищи составляет 200 калорий и калорийность пищи определяет репродуктивную приспособленность каждого игрока. Если встречаются два типа, которые делятся пищей, каждый из них получает половину, но если игрок, который делится пищей, встречается с тем, кто всегда дерется, он сразу же уступает и задира получает всю пищу.

a) Допустим, издержки в случае драки (для каждого игрока) составляют 50 калорий, а когда встречаются два драчуна, каждый из них с равной вероятностью может либо победить в схватке и получить всю пищу, либо проиграть и вообще остаться без еды. Составьте таблицу выигрышей в игре с участием двух игроков, выбранных из популяции случайным образом. Найдите в этой популяции все эволюционно устойчивые стратегии. К какому типу можно отнести игру в данном случае?

b) Теперь предположим, что издержки в случае драки составляют 150 калорий. Составьте таблицу выигрышей и найдите все эволюционно устойчивые стратегии в популяции в этой ситуации. Какой тип игры будет в данном случае?

c) Воспользовавшись системой обозначений из игры «ястреб — голубь» данной главы, укажите значения V и C в пунктах a и b и покажите, что ваши ответы в этих пунктах согласуются с анализом, представленным в данной главе.

U2. Допустим, в однократной игре «дилемма заключенных» следующая таблица выигрышей:

В большой популяции, в которой поведение каждого члена генетически предопределено, каждый игрок будет либо всегда отказываться от сотрудничества в любой игре «дилемма заключенных», либо использовать стратегию «око за око». (В дилемме заключенных, состоящей из нескольких раундов, этот игрок выбирает сотрудничество в первом раунде, а в каждом последующем делает то, что сделал соперник в предыдущем раунде игры.) Пары случайным образом выбранных из популяции игроков сыграют серии из n отдельных раундов этой дилеммы (при n ≥ 2). Выигрыш каждого игрока в одной полной серии (состоящей из n раундов игры) равен сумме выигрышей в n раундах.

Пусть p — доля игроков, всегда отказывающихся от сотрудничества, а (1 — p) — доля игроков, всегда выбирающих стратегию «око за око». Каждый член популяции неоднократно играет в таких сериях дилемм, каждый раз против нового, выбранного случайным образом соперника. Игрок, использующий стратегию «око за око», всегда начинает новую серию с сотрудничества в первом раунде игры.

a) В таблице два на два покажите выигрыши игрока каждого типа в случае, если в ходе одной серии каждый игрок вступает в противостояние с соперником каждого из двух типов.

b) Определите уровень приспособленности (средний выигрыш в одной серии против случайно выбранного соперника) игрока, который всегда отказывается от сотрудничества.

c) Определите уровень приспособленности игрока, всегда выбирающего стратегию «око за око».

d) На основании ответов в пунктах b и c докажите, что при p > (n — 2) / (n — 1) тип, всегда отказывающийся от сотрудничества, имеет более высокий уровень приспособленности, а при p < (n — 2) / (n — 1) более высокий уровень приспособленности у типа, всегда выбирающего стратегию «око за око».

e) Если эволюция приводит к постепенному увеличению доли более приспособленного типа в популяции, каковы возможные равновесные исходы этого процесса для популяции, о которой идет речь в упражнении? (Другими словами, каковы возможные эволюционно устойчивые равновесия?) Проиллюстрируйте свой ответ с помощью графика уровней приспособленности.

f) В каком смысле большее количество повторений (более высокие значения n) способствует эволюции сотрудничества?

U3. Предположим, в дважды повторяющейся дилемме заключенных из в популяции может существовать четвертый тип (тип С). Он не признает своей вины в первом раунде, но сознается во втором раунде каждого эпизода в двух подряд раундах игры против того же соперника.

a) Составьте таблицу уровней приспособленности четыре на четыре в этой игре.

b) Может ли новый тип С выступать в качестве эволюционно устойчивой стратегии данной игры?

c) В игре с тремя типами из типы В и О были эволюционно устойчивыми стратегиями, но тип О был нейтрально устойчивым, поскольку с ним могла сосуществовать небольшая доля мутантов Н. Докажите, что тип О не может быть эволюционно устойчивой стратегией в игре с четырьмя типами.

U4. Придерживаясь схемы, описанной в , проанализируйте эволюционную версию игры в розыгрыш очка в теннисе (см. ). Рассматривая подающих и принимающих игроков как отдельные виды, постройте рисунок, аналогичный . Что вы можете сказать об эволюционно устойчивой стратегии и ее динамике?

U5. Вспомните о популяции животных из , борющихся за источник пищи, ценность которого составляет 200 калорий. Предположим, что в пункте b этого упражнения издержки в случае драки (для каждого игрока) равны 150 калорий. Представим также, что в этой популяции есть третий фенотип, который всегда смешивает стратегии, то есть использует смешанную стратегию, порой вступая в драку, а порой делясь пищей с другими.

a) На основании своих знаний о смешанных стратегиях в рациональных играх предложите разумную смешанную стратегию, которую третий фенотип мог бы использовать в данной игре.

b) Составьте таблицу выигрышей три на три для этой игры, когда третий фенотип использует смешанную стратегию, предложенную вами в пункте а.

c) Определите, будет ли смешивающий фенотип эволюционно устойчивой стратегией в данной игре. (Подсказка: проверьте, может ли тип, который всегда вступает в драку, или тип, который всегда делится пищей, захватить популяцию смешивающего типа.)

U6. Рассмотрим эволюционную версию игры между Бейкером и Катлером из . В этот раз Бейкер и Катлер — не два человека, а два разных вида. Каждый раз при встрече они ведут следующую игру. Бейкер выбирает общий приз в размере 10 или 100 долларов. Катлер решает, как разделить приз, выбранный Бейкером; при этом Катлер может разделить приз либо в соотношении 50 на 50, либо в соотношении 90 на 10 в свою пользу. Катлер ходит первым, а Бейкер вторым.

В популяции есть два типа Катлеров: тип F выбирает справедливое разделение приза (50 на 50), тогда как тип G — корыстное разделение (90 на 10). Существует также два типа Бейкеров: тип S просто выбирает большой приз (100 долларов) независимо от действий Катлера, тогда как тип T выбирает большой приз (100 долларов), но при условии, что Катлер его разделит 50 на 50, и маленький приз (10 долларов), если Катлер выберет разделение 90 на 10.

Пусть f — доля типа F в популяции Катлеров, а значит, (1 — f) — доля в этой популяции типа G. Пусть s — доля типа S в популяции Бейкеров, а значит, (1 — s) — доля в этой популяции типа T.

a) Определите уровень приспособленности типов F и G относительно s.

b) Определите уровень приспособленности типов S и T относительно f.

c) При каком значении s у типов F и G одинаковый уровень приспособленности?

d) При каком значении f у типов S и T одинаковый уровень приспособленности?

e) На основании полученных выше ответов начертите график динамики популяций. Отобразите значения f на горизонтальной оси, а значения s — на вертикальной.

f) Опишите все равновесия в этой эволюционной игре, а также укажите эволюционно устойчивые равновесия.

U7. Вспомните . Как оказалось, зайцы весьма заносчивые победители. Каждый раз, когда они обгоняют черепах, они безжалостно высмеивают их медлительность. Бедные черепахи не только проигрывают забег, но и терпят оскорбления со стороны зайцев. Таблица выигрышей в этой игре выглядит так:

a) При каких значениях c уровень приспособленности черепах будет выше, чем у зайцев, если доля черепах t в популяции составляет 0,5? Чем этот результат отличается от ответа, полученного в ?

b) При каких значениях c уровень приспособленности черепах будет выше, чем у зайцев, если t = 0,1? Чем этот результат отличается от ответа, полученного в ?

c) Если c = 1, сможет ли один заяц захватить популяцию, состоящую только из черепах? Объясните, почему да или почему нет.

d) Насколько большим относительно t должно быть значение c в случае черепах, чтобы они были более приспособленными, чем зайцы?

e) Какой уровень t относительно c в полиморфном равновесии? При каких значениях c установится такое равновесие? Обоснуйте свой ответ.

f) Будет ли устойчивым полиморфное равновесие, найденное в пункте e? Почему да или почему нет?

U8 (рекомендуется использовать электронную таблицу). В данной задаче выполняется более глубокий анализ динамики популяции от поколения к поколению, о которой шла речь в . Поскольку математические расчеты могут быстро стать достаточно сложными и громоздкими, рекомендуем выполнить этот анализ с помощью электронной таблицы.

Опять же, рассмотрим популяцию с двумя типами X и Y со следующей таблицей выигрышей:

Вспомните, что динамику популяции от поколения к поколению определяет следующая формула:

где xt — доля X в популяции за период t; x t+ 1 — доля X в популяции за период t + 1; F Xt  — уровень приспособленности X за период t; F Yt  — уровень приспособленности Y за период t.

С помощью электронной таблицы расширьте область этих вычислений на большее количество поколений. (Подсказка: расположите значения x t , F Xt и F Yt в трех смежных горизонтальных ячейках таблицы, а в каждой следующей строке пусть будут представлены периоды [t = 0, 1, 2, 3, …]. Используйте формулы электронной таблицы, для того чтобы соотнести F Xt и F Yt c x t и x t+ 1 в соответствии с представленной моделью динамики популяции.)

a) Если в период 1 (другими словами, когда x0 = 0,5) в популяции имеет место равное соотношение X и Y, какой будет доля X в следующем поколении, то есть x1? Чему равны значения F X 1 и F Y 1?

b) С помощью электронной таблицы выполните соответствующие вычисления для очередного поколения, затем для следующего и т. д. Чему равно значение x20 с точностью до четырех десятичных знаков? Чему равны значения F X 20 и F Y 20?

c) Определите x*— равновесный уровень x. Через сколько поколений популяция будет находиться в пределах 1 процента от x*?

d) Ответьте на вопрос в пункте b при x0 = 0,1.

e) Выполните задание в пункте b при x0 = 1.

f) Выполните задание в пункте b при x0 = 0,99.

g) Возможны ли мономорфные равновесия в данной модели? Если да, устойчивы ли они? Обоснуйте свой вывод.

U9. Рассмотрите эволюционную игру между игроками зеленого и пурпурного типов со следующей таблицей выигрышей:

С учетом параметров a, b, c, d определите условия, которые обеспечивают устойчивое полиморфное равновесие.

U10 (дополнительное упражнение для студентов с хорошей математической подготовкой). Пусть в эволюционной игре с тремя типами, представленной в и на , q3 = 1 — q1 — q2 — доля агрессивных оранжевогорлых игуан. В таком случае динамику изменения доли каждого типа игуан в популяции можно описать так:

q 1 увеличивается тогда и только тогда, когда — q 2  +  q 3  > 0,

q 2 увеличивается тогда и только тогда, когда q 1  — q 3  > 0.

Хотя это и не было оговорено в явном виде в , но аналогичное правило для q3 выглядит так:

q 3 увеличивается тогда и только тогда, когда — q 1  +  q 2  > 0.

a) Выполните более подробный анализ этой динамики. Пусть скорость изменения переменной x во времени t обозначается посредством производной dx/dt. Далее предположим, что

Проверьте, подтверждают ли эти производные сформулированные выше утверждения в отношении динамики популяции.

b) Определим X = (q1)2 + (q2)2 + (q3)2. С помощью формул дифференцирования сложных функций покажите, что dX/dt = 0, иными словами, продемонстрируйте, что значение X остается постоянным по времени.

c) Мы знаем, что q1 + q2 + q3 = 1. Используя этот факт в совокупности c результатом из пункта b, покажите, что с течением времени точка (q1, q2, q3) движется в трехмерном пространстве по кругу.

d) Говорит ли ответ, полученный в пункте c, об устойчивости эволюционной динамики в популяции пятнистобоких игуан?

 

Глава 13. Разработка механизмов для задачи «принципал — агент»

 

* * *

В 1996 году Джеймс Миррлис получил Нобелевскую премию по экономике за новаторскую работу по оптимальному нелинейному налогообложению доходов и связанным с ним политическим вопросам. Многие неэкономисты и некоторые экономисты нашли ее трудной для понимания. Однако журнал Economist дал ей блестящую характеристику, подчеркнув ее важность и значимость, а также отметив, что Миррлис показал, «как иметь дело с тем, кто знает больше вас».

В мы уже видели, как асимметричная информация влияет на анализ игры. Но основная задача, которую пытался решить Миррлис, несколько отличалась от ситуаций, рассмотренных нами ранее. В его работе одному игроку (правительству) требовалось составить такой свод правил, при котором стимулы другого игрока (налогоплательщика) соответствовали бы целям первого игрока. В настоящее время модели, применимые к широкому спектру социальных и экономических взаимодействий и основанные на общей концептуальной схеме, в соответствии с которой менее информированный игрок выполняет действия, выгодные для более информированного игрока, существуют в большом количестве. Обычно менее информированного игрока называют принципалом, а более информированного — агентом; соответственно, такие модели обозначаются термином «модель “принципал — агент”». Сам процесс, используемый принципалом для создания правильного набора стимулов для агента, известен как разработка механизмов.

В модели Миррлиса правительство пытается найти баланс между эффективностью и справедливостью; оно хочет, чтобы более продуктивные члены общества вкладывали усилия в увеличение общего объема производства, после чего правительство бы перераспределяло доходы в пользу неимущих. Если бы ему была точно известна потенциальная производительность каждого человека и оно могло бы отслеживать количество и качество вложенных усилий, каждый член общества просто был бы обязан трудиться в соответствии со своими возможностями, а плоды его труда распределялись бы согласно потребностям людей. Но сбор столь подробной информации слишком дорогостоящий, если вообще возможен, кроме того, не меньше трудностей возникло бы с практической реализацией таких схем перераспределения. Каждый человек прекрасно знает свои способности и потребности, поэтому выбирает собственный уровень усилий, но ему выгоднее скрывать эту информацию от правительства. Когда человек делает вид, что у него меньше способностей и больше потребностей, это позволяет ему выплачивать меньше налогов или получать помощь от правительства; при этом стимул вкладывать усилия ослабевает, когда правительство забирает часть дохода. Правительство должно просчитывать свою налоговую политику или разрабатывать налогово-бюджетный механизм с учетом всех этих нюансов с информацией и стимулами. Миррлису удалось решить сложную задачу разработки механизмов в рамках концептуальной схемы «принципал — агент».

Экономист Уильям Викри разделил с Миррлисом Нобелевскую премию по экономике 1996 года, получив ее за разработку механизмов при наличии асимметричной информации. Наибольшую известность Викри принесла разработка алгоритма проведения аукциона, стимулирующего участников делать ставки по истинной стоимости выставленного на продажу объекта (эту тему мы подробно изучим в ). Однако исследования Викри распространяются и на другие механизмы, такие как система дорожных сборов в период пиковой нагрузки (он и Миррлис заложили основу для обширных изысканий в данной области).

Примечательно, что за последние тридцать лет общая теория разработки механизмов получила серьезное развитие. За сделанный в нее вклад Леониду Гурвицу, Роджеру Майерсону и Эрику Маскину в 2007 году была присуждена Нобелевская премия по экономике. Они и многие другие ученые применили данную теорию во множестве разных областей, таких как системы оплаты труда, страховые полисы и, разумеется, шкала налогообложения и аукционы. В этой главе мы проанализируем несколько известных сфер применения теории разработки механизмов, воспользовавшись нашим обычным методом числовых примеров и упражнений.

 

1. Ценовая дискриминация

Как правило, компания продает свою продукцию различным клиентам с разными уровнями готовности платить. Теоретически она хотела бы получать от каждого клиента максимум, который он готов заплатить. Если бы компания действительно могла назначать каждому клиенту индивидуальную цену, соответствующую его готовности платить, экономисты сказали бы, что она практикует совершенную ценовую дискриминацию, или ценовую дискриминацию первой степени.

Однако совершенная ценовая дискриминация может оказаться невозможной по многим причинам. Самая общая состоит в том, что даже клиент, который готов заплатить много, предпочитает платить меньше. Следовательно, он выберет более низкую цену, и не исключено, что компании придется конкурировать с другими компаниями или торговыми посредниками, которые сбивают ее высокую цену. Но даже при отсутствии прямых конкурентов компания, как правило, не знает, сколько каждый отдельный клиент готов заплатить, поэтому клиенты попытаются сделать вид, что не намерены платить высокую цену, чтобы добиться более низкой цены. Иногда, даже если компания смогла определить готовность платить, может быть незаконно использовать явную дискриминацию первой степени на основании отличительных характеристик клиента. В подобных ситуациях компания должна разработать такую линию продуктов и цен, чтобы выбор клиентами того, что они покупают (а значит, и за что платят), хотя бы в какой-то мере соответствовал ее целям по увеличению прибыли путем ценовой дискриминации.

В терминологии игр с асимметричной информацией, используемой нами в , процесс, посредством которого компания определяет готовность клиента платить на основании решений о покупке, подразумевает скрининг в целях разделения типов (путем самоотбора). Компания не знает тип каждого клиента (его готовность платить), поэтому пытается получить эту информацию, анализируя его действия. Подход, применяемый для этого авиакомпаниями, — общеизвестный пример. Авиакомпании стараются отделить бизнес-пассажиров, готовых заплатить больше, от туристов, более чувствительных к цене билетов, предлагая низкие цены в обмен на различные ограничения на тарифы, неприемлемые для пассажиров бизнес-класса, такие как требования предварительной оплаты и минимальные условия комфорта. Мы проанализируем этот пример более подробно, чтобы уточнить все эти идеи, сделав их поддающимися количественному определению.

Рассмотрим решения по установлению цен, которые принимает PieInTheSky (PITS) — авиакомпания, обслуживающая маршрут из Поданка в Южную Саккоту; ее самолеты перевозят определенное количество бизнес-пассажиров и определенное количество туристов. За любое место, указанное в авиабилете, пассажиры первого типа готовы платить более высокую цену, чем второго. Для того чтобы с выгодой для себя обслужить туристов, не назначая при этом низкую цену пассажирам, совершающим деловые поездки, компания PITS должна найти способ создания разных версий одного и того же рейса. Кроме того, ей необходимо установить такие цены на билеты, чтобы эти два типа пассажиров выбрали разные варианты. Как уже отмечалось выше, авиаперевозчик может провести различие между двумя типами пассажиров, предложив им тарифы с ограничениями и без. Практика продажи билетов в салоны первого и экономкласса — еще один способ разграничить две группы пассажиров (именно ее мы используем в нашем примере).

Предположим, 30 % клиентов авиакомпании PITS — бизнесмены, а 70 — туристы. В таблице на рис. 13.1 показана максимальная готовность каждого из двух типов клиентов платить за каждую категорию обслуживания плюс затраты на предоставление им услуг, а также потенциальная прибыль, которую можно получить в каждом случае.

Рис. 13.1. Ценовая дискриминация в авиакомпании

Начнем с разработки наилучшей с точки зрения авиаперевозчика системы определения цен на билеты. Допустим, авиакомпании известен тип каждого отдельного клиента; скажем, продавцы определяют его по одежде клиентов, когда те приходят бронировать места. Будем также исходить из того, что не существует правовых запретов на дифференцированное ценообразование и нет возможности перепродать более дешевые билеты другим пассажирам. (Реальные авиакомпании предотвращают такую перепродажу посредством требования о достоверной идентификации каждого пассажира, имеющего билет.) При таких условиях компания PITS могла бы применить совершенную ценовую дискриминацию (ценовую дискриминацию первой степени).

Какую цену назначила бы при этом компания PITS клиентам каждого типа? Она могла бы продать билет каждому бизнесмену в салон первого класса за 300 долларов с прибылью 300–150 = 150 долларов на один билет или продать ему же билет в салон экономкласса за 225 долларов с прибылью 225–100 = 125 долларов на один билет. Первый вариант выигрышнее для PITS, поэтому она захотела бы продавать бизнес-пассажирам билеты в салон первого класса по 300 долларов. Каждому туристу авиакомпания могла бы продать билет в салон первого класса за 175 долларов с прибылью 175–150 = 25 долларов или билет в салон экономкласса за 140 долларов с прибылью 140–100 = 40 долларов. В этом случае для PITS лучше второй вариант, поэтому она захотела бы продавать туристам билеты в салон экономкласса по 140 долларов. Следовательно, в идеале компания PITS предпочла бы продавать билеты первого класса только пассажирам, совершающим деловые поездки, и билеты экономкласса только туристам, в каждом случае по цене, эквивалентной максимальной готовности соответствующей группы пассажиров платить. Общий объем прибыли PITS, полученной за счет этой стратегии в расчете на 100 клиентов, составил бы:

(140–100) × 70 + (300–150) × 30 = 40 × 70 + 150 × 30 = 2800 + 4500 = 7300.

Таким образом, наилучший для PITS исход обеспечивает ей прибыль 7300 долларов на каждых 100 пассажиров, которых она обслуживает.

Теперь вернемся к более реалистичному сценарию, в соответствии с которым PITS не может определить тип каждого клиента или не имеет права задействовать эту информацию в целях явной ценовой дискриминации. Как авиакомпания может использовать разные варианты билетов для скрининга своих клиентов?

Первое, что необходимо понять авиаперевозчику, что разработанная выше система ценообразования далеко не самая прибыльная при отсутствии идентифицирующих данных о каждом клиенте. И самое главное — компания не может назначить бизнес-пассажирам максимальную цену в размере 300 долларов, которую они готовы заплатить за места в салоне первого класса, при цене 140 долларов за билет в экономкласс. Ведь тогда бизнесмены могли бы купить билеты в экономкласс, за которые они готовы заплатить 225 долларов, и получить при этом дополнительную выгоду, или, на языке экономистов, излишек потребителя, в размере 225–140 = 85 долларов, который они могли бы использовать, скажем, на оплату более качественного питания или проживания во время поездки. А максимальная цена 300 долларов не обеспечивает им излишка потребителя, поэтому они предпочли бы билеты экономкласса. Следовательно, в данной ситуации скрининг окажется бесполезным. Прибыль компании PITS в расчете на 100 клиентов упала бы до (140–100) × 100 = 4000 долларов.

Максимальная цена, которую PITS сможет назначить за билеты в салон первого класса, должна гарантировать бизнес-пассажирам дополнительную выгоду, не меньше чем 85 долларов, которые они получили бы, купив билет в экономкласс. Стало быть, цена билетов первого класса может составлять максимум 300 − 85 = 215 долларов. (Возможно, следовало бы назначить цену 214 долларов, чтобы дать бизнес-пассажирам однозначный положительный стимул выбрать первый класс, но мы не будем принимать во внимание столь несущественную разницу.) Компания PITS по-прежнему может установить цену 140 долларов на билеты экономкласса, для того чтобы получить максимальную прибыль за счет туристов, поэтому общий объем ее прибыли (на 100 клиентов) при этом составит:

(140–100) × 70 + (215–150) × 30 = 40 × 70 + 65 × 30 = 2800 + 1950 = 4750.

Эта прибыль больше 4000 долларов, которые авиакомпания получила бы вследствие безуспешной реализации схемы совершенной ценовой дискриминации в условиях ограниченной информации, но меньше 7300 долларов, которые ей удалось бы получить при наличии полной информации и успешном применении совершенной ценовой дискриминации.

Установив на билеты первого класса цену 215 долларов, а на билеты экономкласса 140 долларов, компания PITS может без проблем выполнить скрининг и разделить пассажиров на два типа на основании их самостоятельного выбора одного из двух видов обслуживания. Однако ради достижения такой косвенной ценовой дискриминации PITS должна пожертвовать частью прибыли, которую она потеряет из-за необходимости назначить бизнес-клиентам цену, меньшую, чем та, которую они готовы заплатить. В итоге прибыль PITS в расчете на 100 клиентов сократится с 7300 долларов, которую компания могла бы иметь в случае прямой ценовой дискриминации при наличии исчерпывающей информации о типе каждого клиента, до 4750 долларов в случае косвенной дискриминации, основанной на самоотборе. Разница в 2550 долларов в точности равна 85 × 30, где 85 — сумма снижения цен на билеты первого класса по отношению к цене, которую бизнес-пассажиры готовы за них заплатить, а 30 — количество бизнес-пассажиров на 100 обслуженных пассажиров.

Согласно нашему анализу, авиакомпании PITS придется поддерживать цены на билеты первого класса на достаточно низком уровне, чтобы бизнес-пассажиры были заинтересованы в выборе данного класса обслуживания. У них есть вариант предпочесть экономкласс, если это обеспечит им более весомую выгоду (или излишек), поэтому компании PITS необходимо найти способ удержать их от этого шага. Такое требование, или ограничение в отношении стратегии скрининга, возникает во всех задачах, связанных с разработкой механизмов, и обозначается термином ограничение совместимости стимулов.

Единственное, что позволит компании PITS назначить бизнес-пассажирам цену на билеты первого класса более 215 долларов, не спровоцировав их переход на другой класс обслуживания, — это повышение тарифа на билеты экономкласса. Например, если стоимость билета первого класса составляет 240 долларов, а экономкласса — 165 долларов, бизнес-пассажиры получат одинаковую дополнительную выгоду (излишек потребителя) при покупке билетов обоих классов: 300–240 долларов в случае билета первого класса и 225–165 долларов в случае билета экономкласса. Следовательно, они предпочтут первый класс, или по 60 долларов в каждом случае. При таких более высоких ценах бизнес-пассажиры по-прежнему готовы покупать билеты только в салон первого класса, что позволит компании PITS получить более высокую прибыль с каждого билета.

Однако цена билетов экономкласса в размере 140 долларов — предельная сумма, которую готовы заплатить туристы. Если компания PITS поднимет ее, скажем, до 165 долларов, она вообще потеряет клиентов этого типа. Для того чтобы сохранить их готовность покупать билеты, механизм ценообразования, используемый PITS, должен удовлетворять еще одному условию — условию ограничения участия.

Таким образом, стратегия ценообразования, применяемая компанией PITS, находится между двумя ограничениями: ограничением участия туристов и ограничением совместимости стимулов бизнес-пассажиров. Если компания назначит цену X на билеты экономкласса и цену Y на билеты первого класса, она должна обеспечить выполнение условия X < 140, для того чтобы билеты покупали туристы, и условия 225 — X < 300 — Y, или Y < X + 75, чтобы бизнес-пассажиры выбирали первый, а не экономкласс. Вследствие таких ограничений PITS стремится установить как можно более высокие цены. Следовательно, скрининговая стратегия компании, направленная на максимизацию прибыли, сводится к тому, чтобы сделать значение X как можно более близким к 140 долларам, а значение Y как можно более близким к 215 долларам. Исключив из рассмотрения небольшие различия, необходимые для сохранения знака <, будем исходить из того, что цены на билеты составляют 140 и 215 долларов. В таком случае назначение цены 215 долларов на билеты первого класса и 140 долларов на билеты экономкласса и есть решение задачи PITS по разработке механизма ценообразования.

Оптимальна ли эта стратегия для авиакомпании, зависит от конкретных данных, используемых в этом примере. Если бы доля бизнес-пассажиров была значительно больше, например 50 %, PITS пришлось бы пересмотреть оптимальные цены на билеты. Если 50 % ее клиентов составляют пассажиры, совершающие деловые поездки, убытки в размере 85 долларов на каждом бизнес-пассажире могут оказаться слишком высокими, чтобы оправдать сохранение немногочисленных туристов. Возможно, PITS было бы лучше вообще отказаться от обслуживания клиентов этой категории, то есть нарушить условие ограничения участия туристов ради повышения стоимости первого класса обслуживания. В действительности стратегия ценовой дискриминации посредством скрининга при таком соотношении пассажиров разных типов обеспечивает компании PITS следующую прибыль (в расчете на 100 клиентов):

(140–100) × 50 + (215–150) × 50 = 40 × 50 + 65 × 50 = 2000 + 3250 = 5250.

Стратегия обслуживания только бизнес-пассажиров посредством продажи им билетов по цене 300 долларов гарантирует компании PITS более высокую прибыль (в расчете на 100 клиентов), чем при использовании инструмента скрининга:

(300–150) × 50 = 150 × 50 = 7500.

Таким образом, при наличии относительно небольшого количества клиентов с готовностью платить более низкую цену продавец может предпочесть вообще не обслуживать их, чем предлагать достаточно низкие цены множеству клиентов, готовых заплатить высокую цену, чтобы предотвратить их переход на недорогую версию продукта.

Какая именно доля бизнес-пассажиров занимает промежуточную позицию между этими двумя случаями? Мы предоставляем возможность решить эту задачу вам. Нам же остается заметить, что решение авиакомпании снизить тарифы для туристов может быть ее ответом на асимметричность информации, а не признаком особой привязанности к отпускникам!

 

2. Некоторые термины

Итак, мы увидели один пример разработки механизмов в действии. Безусловно, есть еще масса других примеров, и мы расскажем о некоторых из них в следующих разделах. А пока сделаем небольшую паузу, чтобы представить несколько специальных терминов, используемых в большинстве подобных моделей.

Существует два широких класса проблем, связанных с разработкой механизмов. Первый, аналогичный ситуации с ценовой дискриминацией в приведенном выше примере, состоит в том, что один игрок лучше информирован (в нашем примере клиент знает свою готовность платить) и от этой информации зависит выигрыш другого игрока (установление цен авиакомпанией, а значит, и ее прибыль). Менее информированный игрок разрабатывает схему, в соответствии с которой более информированный игрок должен сделать выбор, раскрывающий эту информацию, хотя это и повлечет за собой определенные издержки для первого (в нашем примере отсутствие возможности назначить бизнес-пассажирам цену, соответствующую их максимальной готовности платить).

Второй класс проблем разработки механизмов касается действий, предпринимаемых одним игроком, которые не могут отслеживать другие игроки. Например, работодатель не может видеть качество, а порой даже количество усилий, вкладываемых работником; у страховой компании нет возможности отслеживать действия, предпринимаемые застрахованным водителем или домовладельцем для снижения риска аварии или ограбления. В терминах, представленных в , эта проблема обозначается как моральный риск. Менее информированный игрок разрабатывает схему (например, участие в прибылях для работника или нестрахуемый минимум и участие в оплате при страховании), которая в определенной степени приводит стимулы другого игрока в соответствие со стимулами ее автора.

В каждом из этих случаев механизм разрабатывает менее информированный игрок, которого в стратегической игре называют принципалом. Более информированного игрока называют агентом, что точно отображает суть происходящего в отношении работника, но не столь точно в случае клиента. Тогда данную игру можно назвать проблемой «принципал — агент», или агентской проблемой.

Принципал разрабатывает механизм максимизации своего выигрыша при наличии двух ограничений. Во-первых, ему известно, что агент использует этот механизм для максимального увеличения своего выигрыша (выигрыша агента). Иными словами, механизм принципала должен соответствовать стимулам агента. Как мы уже говорили в , это условие обозначается термином «ограничение совместимости стимулов». Во-вторых, учитывая, что агент реагирует на этот механизм исходя из собственных интересов, агентские отношения должны обеспечивать ему как минимум такую же ожидаемую полезность, как он бы получил в другом месте, например работая на другого работодателя или отправившись в путешествие на автомобиле вместо самолета. В мы обозначили это условие термином «ограничение участия». В ситуации с ценовой дискриминацией в авиакомпании мы видели конкретные примеры этих двух условий; другие примеры и сферы применения будут представлены в следующих разделах данной главы.

 

3. Контракты «затраты плюс» и контракты с фиксированной ценой

При составлении закупочных контрактов на получение определенных услуг вроде строительства скоростной автомагистрали или офисного здания правительства или компании сталкиваются с теми же проблемами разработки механизмов, которые мы рассматриваем в данной главе. Есть два распространенных типа таких контрактов — «затраты плюс прибыль» и «фиксированная цена». В случае первого поставщик услуг получает сумму, эквивалентную его затратам, плюс вознаграждение в размере нормальной прибыли. В контракте с фиксированной ценой заранее оговаривается конкретная цена услуг, при этом их поставщик оставляет себе всю сверхприбыль, если его фактические затраты меньше ожидаемых, и несет убытки, если фактические затраты оказываются выше.

Каждый тип контракта имеет свои достоинства и недостатки. Контракт «затраты плюс» не обеспечивает подрядчику сверхприбыль; этот аспект особенно важен для государственных контрактов на закупку, где в конечном счете именно граждане оплачивают закупленные услуги. Однако поставщик, как правило, лучше информирован о своих затратах, чем покупатель услуг, поэтому у поставщика может возникнуть желание завысить объем затрат или увеличить их, чтобы извлечь для себя выгоду из необоснованно высоких расходов. Напротив, контракт с фиксированной ценой дает поставщику услуг все стимулы удерживать затраты на минимальном уровне, а значит, и обеспечивать эффективное использование ресурсов. Но при таком типе государственных контрактов обществу приходится платить установленную цену и отдавать поставщику услуг сверхприбыль. Оптимальный механизм закупок должен учитывать оба аспекта.

А. Строительство автомагистрали: полная информация

Рассмотрим пример разработки правительством штата механизма закупок в рамках проекта дорожного строительства. Предположим, планируется построить автомагистраль с привлечением местного дорожного подрядчика и органам власти штата необходимо решить, сколько на ней должно быть полос. Чем больше полос, тем больше пользы в виде более быстрого передвижения и меньшего количества аварий (во всяком случае до уровня, превышение которого нанесет чрезмерный ущерб сельской местности). Мы будем исходить из того, что социальная стоимость V (исчисляемая в миллиардах долларов) от наличия N полос на автомагистрали определяется следующей формулой:

Стоимость строительства одной полосы, в том числе вознаграждение в размере нормальной прибыли, могло бы составить либо 3, либо 5 миллиардов долларов в зависимости от типа грунта на строительном участке. На данный момент будем считать, что правительство штата может определить объем затрат на строительство так же, как и подрядчик. В итоге оно выбирает количество полос N и составляет контракт таким образом, чтобы максимально увеличить выгоду для штата (V) за вычетом вознаграждения подрядчику (назовем его F), то есть цель правительства штата — максимизировать свою чистую выгоду G, где G = V — F.

Допустим, властям штата известно, что фактический объем затрат составляет 3 (миллиарда долларов на одну полосу автомагистрали), следовательно, подрядчику придется выплатить 3N за строительство автомагистрали, состоящей из N полос. Далее правительство выбирает такое значение N, которое обеспечивает чистую выгоду G согласно следующей формуле:

В мы вывели формулу поиска значения для максимизации функции этого вида. В частности, максимум функции

Y = A + BX − CX 2

будет при X = B/(2C). В данном примере Y — это G, X — это N, A = 0, B = 12, C = 1/2. Применив формулу решения задачи максимизации, получим оптимальный выбор правительством штата значения N = 12(2 × 1/2) = 12. Следовательно, наиболее целесообразно выбрать автомагистраль на 12 полос, стоимость которой составит 36 миллиардов долларов. Таким образом, правительство предложит следующий контракт: «Мы заплатим 36 миллиардов долларов за строительство 12-полосной автомагистрали». Эта цена включает в себя нормальную прибыль, поэтому подрядчик охотно его подпишет

Аналогичным образом, если затраты составляют 5 миллиардов долларов в расчете на одну полосу, оптимальным значением N будет 10. Правительство предложит контракт на 50 миллиардов долларов за строительство 10-полосной автомагистрали. И подрядчик примет это предложение.

Б. Строительство автомагистрали: асимметричная информация

Теперь представим, что подрядчик знает, как оценить физические условия соответствующей местности, для того чтобы определить объем затрат на одну полосу автомагистрали, а правительство нет; оно может дать лишь приблизительную оценку этих затрат. Будем считать, что, по мнению правительства, объем затрат составит 3 (миллиарда долларов на одну полосу) с вероятностью 2/3 и 5 с вероятностью 1/3.

Что если правительство попытается добиться идеального оптимума и предложит подрядчику два контракта: «12-полосная автомагистраль за 36 миллиардов долларов» и «10-полосная автомагистраль за 50 миллиардов долларов»? Если объем затрат действительно составляет 3 миллиарда долларов в расчете на одну полосу, подрядчик получит больше прибыли, заключив второй контракт, хотя он и предназначен для ситуации, в которой объем затрат равен 5 миллиардов долларов на одну полосу. Истинная стоимость 10-полосной автомагистрали составит при этом 30 миллиардов долларов, и подрядчик заработает 20 миллиардов долларов сверхприбыли.

Такой исход нельзя назвать удовлетворительным. Предложенные контракты не предоставляют подрядчику достаточно сильного стимула выбирать между ними на основании объема затрат: он всегда будет отдавать предпочтение контракту на 50 миллиардов долларов. У правительства должен быть более приемлемый способ создания системы заключения контрактов на закупку.

Поэтому допустим, что правительство может разработать более общий механизм, обеспечивающий разделение типов проектов. Скажем, оно предложит подрядчику два контракта: «Контракт L: мы заплатим вам RL долларов за строительство NL полос» и «Контракт H: мы заплатим вам RH долларов за строительство NH полос». Если контракты L и H составлены правильно, при низком уровне затрат (3 миллиарда долларов на одну полосу) подрядчик выберет контракт L («low» — низкие затраты); при высоком (5 миллиардов долларов на одну полосу) — контракт H («high» — высокие затраты). Для того чтобы этот механизм скрининга работал, нужно, чтобы показатели, которые обозначены символами NL, RL, NH, RH, удовлетворяли определенным условиям.

Во-первых, по каждому контракту подрядчик, который несет соответствующие затраты (низкие при контракте L и высокие при контракте H), должен получить сумму (включающую нормальную прибыль), достаточную для покрытия его расходов. Иначе он не согласится с такими условиями и не станет заключать контракт. Следовательно, контракт должен удовлетворять двум ограничениям участия: 3NL ≤ RL для подрядчика, когда объем затрат составляет 3, и 5NH ≤ RH для подрядчика, когда объем затрат равен 5.

Кроме того, правительству необходимо составить такие два контракта, чтобы подрядчик, зная, что у него будет низкий уровень затрат, не получил выгоду, заключив контракт H и наоборот. Иначе говоря, эти контракты должны также удовлетворять двум ограничениям совместимости стимулов. Например, если истинные затраты низкие, контракт L обеспечит подрядчику сверхприбыль RL — 3NL, тогда как контракт H обеспечит сверхприбыль RH — 3NH. (Обратите внимание, что в последнем выражении количество полос и оплата те же, что и для контракта H, однако затраты подрядчика по-прежнему составляют 3, а не 5.) Для того чтобы удовлетворять ограничению совместимости при низком уровне затрат, контракты должны обеспечивать такое значение второго выражения, которое бы не превышало значение первого выражения. Следовательно, необходимо, чтобы RL — 3NL ≥ RH — 3NH. Точно так же, если истинные затраты низкие, сверхприбыль подрядчика в случае контракта L не должна превышать его сверхприбыли от контракта H. Стало быть, чтобы контракты удовлетворяли ограничению совместимости стимулов, нужно, чтобы RH — 5NH ≥ RL — 5NL.

Правительство стремится максимизировать чистую ожидаемую общественную выгоду от оплаты услуг подрядчика, поэтому использует вероятности этих двух типов в качестве весовых коэффициентов для вычисления математического ожидания. Таким образом, цель правительства — максимизировать функцию

На первый взгляд может показаться, что это очень сложная задача с четырьмя переменными выбора и четырьмя ограничениями в виде неравенства. Однако ее можно существенно упростить, поскольку два ограничения являются избыточными, а оставшиеся два должны быть представлены в виде строгих равенств, что позволит нам подставить полученные выражения в уравнение вместо двух переменных.

Обратите внимание, что если ограничение участия при высоком уровне затрат 5NH ≤ RH, а ограничение совместимости стимулов при низком уровне затрат RL — 3NL ≥ RH — 3NH, выполняются оба условия; в таком случае мы можем получить следующую цепочку неравенств (где мы учитывали тот факт, что значение NH положительное):

R L  — 3N L  ≥ R H  — 3N H  ≥ 5N H  — 3N H  ≥ 5N H  ≥ 0

Первое и последнее выражения цепочки неравенств говорят о том, что RL — 3NL ≥ 0. Поэтому нам нет необходимости отдельно рассматривать ограничение участия при низком уровне затрат 3NL ≤ RL, так как оно удовлетворяется автоматически, когда удовлетворяются два оставшихся ограничения.

Кроме того, на интуитивном уровне очевидно, что компания, которая несет большие издержки, не заинтересована заявлять о себе как о компании с низкими издержками, поскольку тогда она получит меньшую оплату при более высоких затратах. Тем не менее этот интуитивный вывод требует проверки согласно строгой логике данного анализа. В связи с этим поступим следующим образом. Сначала исключим из рассмотрения второе ограничение совместимости стимулов, RH — 5NH ≥ RL — 5NL, что позволит решить задачу с двумя оставшимися ограничениями. Затем вернемся назад и убедимся в том, что решение задачи с двумя ограничениями удовлетворяет третьему ограничению, исключенному из рассмотрения. Иначе говоря, полученное решение должно также быть решением для задачи с тремя ограничениями. (При наличии более подходящего решения оно должно быть приемлемым и для задачи с меньшим количеством ограничений.)

Таким образом, нам остается проанализировать два ограничения: 5NH ≤ RH и RL — 3NL ≥ RH — 3NH. Запишем их в таком виде: RH ≥ 5NH и RL ≥ RH + 3(NL— NH). Обратите внимание, что цель правительства — сделать значения RL и RH настолько малыми, чтобы они были совместимы с указанными выше ограничениями. Такой результат можно получить, представив каждое ограничение в виде равенства. В связи с этим примем такие равенства: RH = 5NH и RL = RH + 3(NL— NH) = 3NL + 2NH. Теперь эти выражения для платежей по контракту можно подставить в формулу целевой функции G. В результате имеем

Целевая функция состоит из двух частей: одна (первые два члена) содержит только NL, а вторая (вторые два члена) только NH. Мы можем применить формулу максимизации отдельно к каждой части. В части NL A = 0, B = 8 и C = 1/3, а значит, оптимальное значение NL = 8/(2×1/3) = 24/2 = 12. В части NH A = 0, B = 2 и C = 1/6, стало быть, оптимальное значение NH = 2/(2×1/6) = 12/2 = 6.

Теперь можем использовать оптимальные значения NL и NH, чтобы получить оптимальные значения платежей (R), воспользовавшись формулами для RL и RH, выведенными выше. Подстановка в них NL = 12 и NH = 6 дает нам RH = 5 × 6 = 30 и RL = 3 × 2 + 2 × 6 = 48. Таким образом, мы имеем оптимальные значения для всех неизвестных в целевой функции правительства. Но не забывайте, что мы исключили из рассмотрения одно из ограничений совместимости стимулов, поэтому теперь нам необходимо к нему вернуться.

Мы должны убедиться, что третье ограничение, RH — 5NH ≥ RL — 5NL, согласуется с вычисленными нами значениями R и N. На самом деле так и есть. Левая сторона выражения равна 30 — 5 × 6 = 0, а правая — 48 — 5 × 12 = –12, а значит, ограничение действительно удовлетворяется.

Наше решение говорит о том, что органам власти штата нужно предложить следующих два контракта: «Контракт L: мы заплатим вам 48 миллиардов долларов за строительство 12 полос» и «Контракт H: мы заплатим вам 30 миллиардов долларов за строительство 6 полос». Как мы можем интерпретировать это решение, чтобы лучше понять его на интуитивном уровне? Интуитивное обоснование наиболее очевидно, если сравнить полученное решение с идеальным решением, найденным в при наличии полной информации о затратах. На рис. 13.2 представлены данные, позволяющие сопоставить оптимальные значения N и R.

Рис. 13.2. Значения показателей в контракте на строительство автомагистрали

Существует два важных различия между оптимальным механизмом в случае асимметричной и полной информации. Во-первых, хотя контракт, который целесообразно выбрать при условии низких затрат, подразумевает строительство такого же количества полос (12), что и при наличии полной информации, оплата по нему больше в асимметричном случае (48 вместо 36). Во-вторых, в случае асимметричной информации и высокого уровня затрат контракт подразумевает строительство меньшего количества полос (6 вместо 10), но обеспечивает такую же оплату, как и во втором варианте (30 = 6 × 5). Эти различия позволяют разделить типы.

В случае асимметричной информации у подрядчика может возникнуть соблазн сделать вид, будто он несет высокие затраты, тогда как на самом деле они низкие. Механизм оптимальной оплаты включает в себя как «пряник» для правдивого признания низких затрат, так и «кнут» за попытку симуляции высоких. «Пряник» — это сверхприбыль в размере 48–36 = 12, которую подрядчик заработает в результате косвенного признания низких затрат посредством выбора контракта L. «Кнут» — сокращение сверхприбыли от контракта H за счет уменьшения количества полос, которые будут при этом построены. Идеальный механизм оплаты при высоком уровне затрат подразумевает строительство 10-полосной автомагистрали за 50 миллиардов долларов; подрядчик с низким уровнем затрат заработал бы на таком контракте 50 — 3 × 10 = 20 миллиардов долларов. Оптимальный контракт с ограниченной информацией подразумевает строительство только шести полос, за что подрядчик получает 30 миллиардов долларов. Если истинный уровень затрат низкий, подрядчик заработает сверхприбыль в размере 30 — 3 × 6 = 12 миллиардов долларов. Следовательно, в этом случае он получит меньшую выгоду от завышенного уровня затрат (косвенно вытекающего из выбора подрядчиком контракта H, хотя его истинные затраты низкие). В действительности эта выгода сокращается ровно на величину, которую гарантирует часть механизма, соответствующая «прянику», что сводит на нет желание подрядчика завысить уровень издержек.

 

4. Фактические данные, касающиеся механизмов раскрытия информации

У рассмотренных выше механизмов есть одно общее свойство: агент владеет определенной частной информацией (в мы определили этот тип игрока). Кроме того, принципалу нужно, чтобы агент выполнил определенное действие, направленное на ее раскрытие. В терминах из эти механизмы представляют собой примеры скрининга в целях разделения типов посредством самоотбора.

Такие механизмы встречаются повсюду. Самые распространенные — механизмы ценовой дискриминации. Пока клиент готов заплатить сумму, превышающую предельные издержки компании на поставку соответствующего продукта, компания может получить прибыль за счет работы с данным клиентом. Однако его готовность платить может быть относительно низкой по сравнению с готовностью других потенциальных покупателей. Если компания должна установить одну и ту же цену всем своим клиентам, в том числе и тем, кто готов платить больше данного клиента, назначение ему цены в соответствии с его готовностью платить означает, что компании придется пожертвовать частью потенциальной прибыли от более платежеспособных клиентов. В идеале компания хотела бы прибегнуть к ценовой дискриминации, предоставив скидку клиентам с меньшей готовностью платить и не предлагая ее тем, кто готов платить больше.

Намерение компании применить ценовую дискриминацию может ограничиваться не только причинами, связанными с информацией. Такая практика может быть запрещена законом. Компания может остерегаться устанавливать высокие цены некоторым из своих клиентов из-за конкуренции со стороны других компаний. А если продукт покупает один клиент и перепродает другим, то конкуренция со стороны других покупателей может быть не менее эффективным ограничением на дискриминационное ценообразование, чем конкуренция между компаниями. Но мы сосредоточимся на информационных причинах ценовой дискриминации, оставив все остальные причины за рамками обсуждения.

По всей вероятности, в вашем местном кафе действует так называемая карта постоянного клиента: на каждых десять купленных чашек кофе вы получаете одну чашку бесплатно. Почему компания заинтересована делать это? Постоянными клиентами чаще всего становятся местные жители, у которых есть время и стимул искать самые выгодные предложения в районе. Для того чтобы переманить их от конкурентов, данному кафе необходимо предложить достаточно привлекательную цену. Напротив, случайными клиентами чаще всего бывают приезжие или люди, которые куда-то спешат и у них нет ни времени, ни стимула искать более выгодные предложения: когда у таких людей возникает потребность выпить чашку кофе и они видят кафе, они готовы заплатить любую цену (в пределах разумного, конечно). Стало быть, установление более высокой цены и выдача карты постоянного клиента позволяют кафе предоставлять скидку чувствительным к цене постоянным посетителям и не делать ее для случайных посетителей. Если у вас нет такой карты, это говорит о том, что вы относитесь ко второй категории и готовы платить больше.

Точно так же многие рестораны предлагают меню из трех блюд по фиксированной цене и недорогие комплексные блюда наряду с обычными блюдами на выбор. Такая стратегия позволяет ресторану выделить различные типы клиентов, отдающих предпочтение разным супам, салатам, основным блюдам, десертам и т. д.

Книжные издательства, как правило, сначала продают новые книги в твердых переплетах, а версию в мягкой обложке издают только через год. Зачастую разница в цене между двумя версиями гораздо больше, чем разница между себестоимостью двух видов книг. Такая схема ценообразования рассчитана на два типа покупателей: тех, кто хочет прочитать книгу как можно быстрее и готов заплатить за это больше, и тех, кто согласен ждать более выгодной цены.

Мы предлагаем вам поискать примеры подобных скрининговых механизмов ценовой дискриминации, когда будете делать покупки. Их множество. Кроме того, об этих методах есть немало интересных статей. Хороший источник информации такого рода — книга Тима Харфорда Undercover Economist.

Существует масса научных работ о механизмах закупок, которые мы представили в . В них описываются ситуации, когда покупатель взаимодействует только с одним продавцом, затраты которого относятся к категории конфиденциальной информации. Данный тип взаимодействия полностью отображает процесс разработки крупных контрактов на производство оборонительных систем вооружения или специализированного оборудования: как правило, есть только один надежный поставщик таких продуктов. Однако в реальной жизни покупатели могут делать выбор из нескольких поставщиков, при этом механизмы, создающие конкуренцию между поставщиками, приносят покупателю выгоду. Многие из этих механизмов принимают форму аукционов. Например, строительные контракты часто предоставляются подрядчику, предложившему выполнить соответствующую работу за минимальную цену (с учетом качества и сроков выполнения работы, а также других условий сделки). Примеры таких механизмов и их анализ представлены в .

 

5. Стимулирование усилий: простейший случай

Теперь перейдем от первого типа проблем разработки механизмов, в котором цель принципала — добиться раскрытия информации, ко второму типу, в котором присутствует моральный риск. В подобных ситуациях цель принципала — составить такой контракт, который бы стимулировал агента прилагать максимум усилий, хотя их уровень принципалом и не наблюдаем.

А. Управленческий надзор

Предположим, вы владелец компании, начинающей новый проект, и должны нанять менеджера, который будет контролировать его выполнение. Чем закончится проект — неизвестно, однако эффективный надзор может повысить вероятность успеха. Но менеджеры — обычные люди и будут пытаться прилагать как можно меньше усилий! Если эти усилия наблюдаемы, вы можете составить контракт, предусматривающий такую оплату труда менеджера, которая стимулировала бы его вкладывать достаточный объем усилий в контроль за выполнением проекта. Но если у вас нет возможности отслеживать усилия менеджера, вам необходимо заинтересовать его в успешном выполнении проекта, например, посредством выплаты премии по его завершении. Однако если приложение больших усилий не гарантирует успешной реализации проекта, то эти премии делают доход менеджера неопределенным. При этом менеджер может быть не расположен к риску, а значит, вы должны компенсировать ему возможные издержки в случае его возникновения. Вам нужно разработать такую политику оплаты труда менеджера проекта, которая бы максимизировала вашу ожидаемую прибыль с учетом того, что выбор менеджером уровня усилий зависит от характера и объема вознаграждения. Это и есть задача разработки механизма, решение которой позволит преодолеть проблемы морального риска в связи с возможным уклонением менеджера от выполнения своих обязанностей.

Рассмотрим пример с конкретными числами. Предположим, успешная реализация проекта принесет компании 1 миллион долларов прибыли сверх материальных затрат и затрат на оплату труда. В случае провала прибыль будет равна нулю. При эффективном контроле за выполнением проекта вероятность успеха равна 1/2, а при неэффективном — всего 1/4.

Как отмечалось выше, менеджер проекта не расположен к риску. В мы видели, что нерасположенность к риску можно описать с помощью вогнутой функции полезности. Возьмем в качестве примера простой случай, когда полезность u дохода y (исчисляемого в миллионах долларов) для менеджера определяется функцией квадратного корня: u = √y. Допустим, дополнительные усилия, необходимые для эффективного контроля, приносят менеджеру отрицательную полезность 0,1, и если он не будет работать на вас, он может получить другую работу, которая не требует дополнительных усилий и оплачивается в размере 90 000 долларов, или 0,09 миллиона долларов, что обеспечивает полезность √0,09 = 0,3. Таким образом, если вы хотите нанять менеджера, не требуя от него эффективного контроля, вы должны заплатить ему как минимум 90 000 долларов. Если вам необходим эффективный надзор, вы должны обеспечить менеджеру хотя бы такую же полезность, какую он мог бы получить на другой работе. Иными словами, вы должны заплатить ему сумму y, при которой √y − 0,1 не меньше 0,3, то есть √y ≥ 0,4, или y ≥ 0,16, или 160 000 долларов.

Если усилия менеджера поддаются наблюдению, вы можете заключить с ним один из двух контрактов: 1) я плачу вам 90 000 долларов, и мне все равно, насколько усердно вы будете работать; 2) я плачу вам 160 000 долларов, но вы должны проводить эффективный надзор за реализацией проекта. Выполнение второго контракта может быть обеспечено в судебном порядке, поэтому, если менеджер согласится его заключить, он не будет увиливать от работы. Ваша ожидаемая прибыль от каждого контракта зависит от вероятности успешного завершения проекта при оговоренном уровне усилий. Таким образом, в случае первого контракта ваша ожидаемая прибыль составит (1/4) × 1–0,09 = 0,160, или 160 000 долларов, а в случае второго (1/2) × 1–0,16 = 0,340, или 340 000 долларов. Следовательно, вам выгоднее заплатить менеджеру проекта за интенсивность усилий. В идеальном мире при наличии полной информации вы воспользовались бы вторым контрактом.

Теперь рассмотрим более реалистичный сценарий, когда усилия менеджера ненаблюдаемы. Эта ситуация не создает никаких дополнительных проблем, если для вас неважен уровень прилагаемых менеджером усилий и вас вполне устраивает первый контракт. Однако если этот вопрос для вас принципиален, вы должны использовать механизм стимулирования, основанный на единственном поддающемся наблюдению событии, а именно успехе или провале проекта. В связи с этим предположим, что вы предлагаете менеджеру контракт, по условиям которого он получит x в случае успешной реализации проекта и y вследствие его провала. (Обратите внимание, что x может быть равным нулю, но если это оптимальное значение, оно должно присутствовать в решении. На самом деле это значение не будет равным нулю по причине нерасположенности менеджера к риску.)

Для того чтобы побудить менеджера выбрать более высокий уровень усилий, вы должны гарантировать, что ожидаемая полезность, которую он при этом получит, превысит ожидаемую полезность в случае уклонения. При высоком уровне усилий менеджер может обеспечить успешное выполнение проекта с вероятностью 1/2, а значит, вероятность неудачи также равна 1/2. При обычном уровне усилий он может гарантировать успешную реализацию проекта только с вероятностью 1/4 (вероятность неудачи 3/4). Таким образом, ваш контракт должен обеспечивать выполнение следующего условия:

(1/2)√ y  + (1/2)√ x  − 0,1>(1/4)√ y  + (3/4)√ x , или (1/4)(√ y  − √ x ) ≥ 0,1,

или √ y  − √ x  ≥ 0,4.

Это выражение представляет собой ограничение совместимости стимулов в данной задаче.

Далее вы должны убедиться, что менеджер получит достаточную ожидаемую полезность и будет готов работать на вас так, как вы хотите (прилагая большие усилия), вместо того чтобы принимать другое предложение. Тогда ожидаемая полезность менеджера от принятия вашего предложения о работе должна превышать полезность от альтернативной работы; таким образом, ваш контракт должен удовлетворять следующему условию:

(1/2)√ y  + (1/2)√ x  − 0,1 ≥ 0,3, или √ y  + √ x  ≥ 0,8.

Это выражение представляет собой ограничение участия в случае контракта, цель которого — добиться от менеджера повышения усилий по контролю за выполнением проекта.

С учетом этих двух ограничений необходимо максимизировать ожидаемую прибыль П. Вы рассчитываете ее, исходя из того, что выполнение указанных выше ограничений позволит вам добиться от менеджера качественной работы. В связи с этим вы надеетесь, что ваш проект будет успешно выполнен с вероятностью 1/2, а ваша ожидаемая прибыль определяется формулой

П = (1/2)(1 — у ) + (1/2)(0 — х ) = (1 — у — х )/2.

Математические вычисления в этой задаче существенно упрощает использование квадратных корней x и y вместо самих x и y (другими словами, значений полезности дохода, а не показателей дохода). Запишем эти значения полезности как X = √x и Y = √y, то есть x = X2 и y = Y2. Далее необходимо максимизировать функцию П = (1 — Y2 — X2)/2 с учетом ограничения участия Y + X ≥ 0,8 и ограничения совместимости стимулов Y — X ≥ 0,4.

В формуле ожидаемой прибыли X и Y указаны со знаком минус, а значит, необходимо сделать оба значения настолько малыми, насколько допускают ограничения. В конечном счете ограничение участия выполняется в случае равенства, когда X и Y имеют малые значения. А как насчет ограничения совместимости стимулов? Если оно не выполняется в случае равенства, то оно не ограничивает выбор значений переменных и его можно исключить из рассмотрения. Предположим, именно так мы и сделали. Тогда мы можем подставить X = 0,8 — Y из ограничения участия в формулу определения прибыли и записать следующее выражение:

П = (1 — Y 2  — X 2 )/2 = [1 — Y 2 —(0,8 — Y ) 2 ]/2 = (1 — Y 2  — 0,64 + 1,6 Y — Y 2 )/2 = (0,36 + 1,6 Y — 2 Y 2 )/2 = 0,18 + 0,8 Y — Y 2 .

Чтобы максимизировать функцию прибыли, мы снова воспользуемся формулой из . Мы имеем B = 0,8 и C = 1, что дает нам значение Y = 0,8/(2 × 1) = 0,4. Тогда X также равно X = 0,8–0,4 = 0,4.

Это решение подразумевает, что при исключении из рассмотрения ограничения совместимости стимулов оптимальный механизм требует равной оплаты труда менеджера как при успехе, так и при провале проекта. Такой оплаты достаточно, чтобы обеспечить менеджеру полезность 0,4 = 0,3 + 0,1 (полезность от легкой работы в другом месте плюс компенсация за отрицательную полезность дополнительных усилий в целях эффективного надзора за выполнением проекта) для выполнения ограничения участия. Этот результат подтверждается на интуитивном уровне и согласуется с анализом оптимального риска в . Менеджер не расположен, а вы нейтральны к риску (все, что вас интересует, — это ожидаемая прибыль), поэтому вам выгоднее взять весь риск на себя и исключить элемент случайности из дохода менеджера.

Но если менеджер получает один и тот же доход независимо от того, как завершится проект, у него нет стимула прилагать ненаблюдаемые усилия. При этом не принятое во внимание ограничение совместимости стимулов не будет выполняться автоматически, и нам необходимо убедиться в том, что X и Y действительно удовлетворяют ему. Следовательно, оба ограничения должны выполняться в случае равенств Y + X = 0,8 и Y — X = 0,4. Объединив их, получим 2Y = 1,2, или Y = 0,6; этот результат сразу же дает нам X = 0,2. В переводе с полезности на денежные суммы имеем x = X2 = 0,04 и y = Y2 = 0,36. Таким образом, менеджеру нужно заплатить 40 000 долларов, если проект завершится провалом, и 360 000 долларов — если успехом. Это меньше оговоренных в контракте 1 (подразумевающем низкий уровень усилий) 90 000 долларов в случае провала и больше оговоренных в контракте 2 (высокий уровень усилий в ситуации с полной информацией) 160 000 долларов в случае успеха. Это означает, что менеджера ожидает сочетание «кнута» (низкая оплата в случае провала проекта) и «пряника» (высокая оплата в случае успеха проекта), как это было с подрядчиком в примере со строительством автомагистрали в .

При такой схеме вы (владелец) получите ожидаемую прибыль П = (1–0,36 — 0,04)/2 = 0,03, или 300 000 долларов. Эта сумма меньше 340 000 долларов, которые вы бы заработали в идеальной ситуации с полной информацией, когда могли бы составить поддающийся принудительному исполнению контракт, требующий высокого уровня усилий. Разница в размере 40 000 долларов — неизбежные издержки в связи с асимметричностью информации.

Схему оплаты труда менеджера можно описать так: базовая заработная плата в размере 40 000 долларов и премия за успешное выполнение проекта в сумме 320 000 долларов, или (что то же самое) 40 000 заработной платы и доля 32 % в операционной прибыли в размере 1 миллион долларов. Нецелесообразно полагаться только на участие в прибылях, не предложив менеджеру базовую зарплату. Почему? Если бы базовая зарплата равнялась нулю, то в случае успешного выполнения проекта вам пришлось бы выплатить менеджеру сумму y, которая определяется формулой (1/2)√y − 0,1 = 0,3 или y = 0,64, или 640 000 долларов, чтобы обеспечить его участие. Ваша ожидаемая прибыль составила бы при этом: П = (1–0,64 — 0)/2 = 0,18, или 180 000 долларов, что на 120 000 долларов ниже, чем если бы вы предложили базовую ставку зарплаты и премию (а также на целых 160 000 долларов меньше, чем в ситуации с полной информацией).

Такое снижение прибыли обусловлено нерасположенностью менеджера к риску. Премиальная система оплаты делает его доход весьма рискованным, поэтому, чтобы обеспечить его участие в проекте, вам необходимо назначить настолько большую премию, что это сократит вашу прибыль. Оптимальная система оплаты в условиях асимметричной информации создает приемлемый баланс между «кнутом» и «пряником», обеспечивая менеджеру достаточный стимул для повышения усилий по надзору за выполнением проекта, но не подвергая при этом его доход существенному риску.

Б. Страхование

Помимо описанных выше ситуаций на рынке труда, моральный риск может возникать и в ходе других взаимодействий. В частности, ему подвержены рынки страховых услуг. Страховым компаниям необходимо решить, как составить приемлемые договоры страхования, стимулирующие клиентов предпринимать действия, снижающие вероятность подачи ими иска о страховом возмещении. Например, страховые компании хотели бы, чтобы люди, которым они продают полисы медицинского страхования, регулярно проходили профилактические медицинские осмотры, а люди, которым они продают полисы автострахования, продолжали практиковать безопасный стиль вождения. Но поскольку у страховой компании, как правило, нет возможности наблюдать за действиями клиентов, создание подходящего страхового полиса требует понимания теории разработки механизмов в условиях асимметричной информации.

Вернемся к примеру с фермером из , который сталкивается с риском потери урожая из-за плохих погодных условий, таких как засуха. Тогда мы выдвинули предположение, что его доход составит 160 000 долларов при благоприятной погоде и 40 000 при неблагоприятной. Когда эти два сценария в равной степени вероятны (вероятность 0,5 в каждом случае), ожидаемый доход фермера составляет 0,5 × 160 000 + 0,5 × 40 000 = 100 000 долларов. Однако при этом среднем значении фермер сталкивается со значительным риском, и если он к нему не склонен, то его будет больше интересовать ожидаемая полезность полученных результатов, а не просто ожидаемый доход.

Предположим, фермер действительно не расположен к риску. В его ситуации функция полезности имеет вид u = √I, где I — доход фермера. Следовательно, фермер получает полезность , если погода хорошая (дожди), и полезность , если погода плохая (засуха). Тогда его ожидаемая полезность равна 0,5 × 400 + 0,5 × 200 = 300.

Что произойдет, если фермеру удастся избежать риска, связанного с угрозой засухи? В частности, в какой ситуации он окажется при наличии возможности всегда получать 100 000 долларов (в данном примере это ожидаемая стоимость), а не 160 000 долларов в одной половине случаев и 40 000 долларов во второй? Давайте на какое-то время оставим в стороне вопрос о том, как фермер мог бы этого добиться, и обратим внимание на то, что при таком исходе он ежегодно получал бы полезность около то есть у фермера была бы более высокая ожидаемая полезность (316 > 300), если бы он нашел способ получать одинаковый доход (а также полезность) в годы с благоприятными и неблагоприятными погодными условиями.

Один из возможных способов добиться выравнивания доходов — страхование. Нейтральная по отношению к риску страховая компания могла бы предложить фермеру контракт, по условиям которого фермер выплачивает компании 60 000 долларов в годы с благоприятными погодными условиями, а страховщик выплачивает фермеру 60 000 долларов в годы с неблагоприятными погодными условиями. Поскольку вероятность каждого исхода — 50 %, ожидаемая прибыль страховой компании при этом равна нулю, что просто обеспечивает ее готовность предложить фермеру такой контракт. С другой стороны, его заключение принесло бы фермеру явную выгоду, так как его ожидаемая полезность возрастает. Следовательно, для обеих сторон был бы приемлем договор страхования, который является полным (покрывает все издержки в связи с неблагоприятным исходом) и справедливым (цена полиса страхования достаточна для возмещения страховых претензий фермера).

До сих пор в этом примере не было проблем с информацией. Однако фермер может предпринимать различные действия, чтобы уменьшить вероятность низкого уровня дохода по причине засухи. Например, он может построить водосборный резервуар, чтобы поливать свои поля в самые засушливые годы. Но строительство и текущий ремонт резервуара требуют определенных затрат. Если фермер построит качественный резервуар и будет за ним следить, то это позволит ему защитить себя от связанных с засухой рисков. Но если резервуар будет протекать, а фермер не будет проводить текущий ремонт, то такой резервуар не выполнит свою функцию, а значит, не снизит риск потери урожая. Если фермер хорошо застрахован, а проверить качество водосборного резервуара и его текущего ремонта посредством обычного осмотра нельзя, у фермера может возникнуть желание уклониться от выполнения этой задачи, чтобы не нести соответствующих затрат. Вероятность такого уклонения и есть источник морального риска в нашем примере.

Предположим, отрицательная полезность в связи с дополнительными затратами на строительство и уход за качественным водосборным резервуаром составляет 25; при этом фермер сокращает вероятность неблагоприятного исхода на 25 %. Тогда при наличии водосборного резервуара ожидаемый доход фермера равен 0,75 × 160 000 + 0,25 × 40 000 = 130 000 долларов, а его ожидаемая полезность (при отсутствии страхования) —  0,75 × 400 + 0,25 × 200 — 25 = 350 — 25 = 325. То есть при наличии водосборного резервуара ожидаемая полезность выше, чем без него (325 > 300), поэтому если страхование недоступно, фермеру целесообразно предпринять усилия по снижению риска, например, построив водосборный резервуар.

Однако фермер все же может извлечь для себя выгоду из страхования. Страховой полис с выравниванием доходов, который гарантирует фермеру 130 000 долларов каждый год, обеспечил бы ему ожидаемую полезность в размере  даже когда он построит качественный водосборный резервуар и будет проводить его текущий ремонт. Эта полезность выше полезности 325, которую фермер получает, если строит резервуар, но не имеет страховки, поэтому фермер непременно воспользуется страхованием.

Предположим, существует возможность составить полный и справедливый договор страхования, в котором сказано, что фермер должен принять меры по снижению вероятности неблагоприятного исхода на 25 %. Допустим также, что страховая компания может это проконтролировать, направив к фермеру страхового агента для проверки состояния водосборного резервуара. В таком случае, согласно условиям договора страхования, обеспечивающего ежегодный доход 130 000, фермер должен выплачивать страховой компании 30 000 за год с благоприятными погодными условиями, а страховщик фермеру — 90 000 долларов за год с неблагоприятными. Как и прежде, ожидаемая прибыль страховой компании равна нулю (0,75 × 30000 — 0,25 × 90000 = 0), но ожидаемая полезность для фермера увеличивается (до 335), поэтому обе стороны примут условия контракта.

Но ситуация меняется, если страховщик не имеет возможности проконтролировать фермера. Фермер может пойти на обман и согласиться на договор страхования «вы платите 30 000 в благоприятный год и получаете 90 000 долларов в неблагоприятный год», но при этом ничего не предпринимать для снижения риска (то есть построить некачественный водосборный резервуар и не проводить его технического обслуживания). Тогда вероятность неблагоприятного года возвращается к 50 %, а доход фермера ежегодно составляет 130 000 долларов. Ожидаемая полезность, которую получит фермер, заключив такой контракт, но не выполняя его условий, равна  — то есть больше, чем во всех предыдущих случаях. Безусловно, эта ситуация невыгодна страховой компании, поскольку ее ожидаемая прибыль составит 0,5 × 30 000 — 0,5 × 90 000 = –30 000 долларов. Стало быть, условия контракта неприемлемы для страховщика, поэтому он не станет предлагать его фермеру.

Означает ли это, что фермер вообще не сможет оформить договор страхования, если построит водосборный резервуар и обеспечит его текущий ремонт, а страховщик не сможет это контролировать? Нет. Однако это означает, что фермер не может получить полное страхование, но у него есть вариант заключить договор частичного страхования, по условиям которого страховая компания берет на себя только часть риска, связанного с неблагоприятным исходом.

Напомним, что если фермер построит качественный резервуар и будет правильно за ним ухаживать, согласно полному страхованию он должен выплачивать страховщику 30 000 долларов за благоприятный год и получать от него 90 000 долларов за неблагоприятный год. В действительности такой контракт не стимулирует фермера строить или содержать водосборный резервуар, поэтому страховщик получает отрицательную ожидаемую прибыль. Для того чтобы разработать в данной ситуации оптимальную схему страхования, страховой компании необходимо определить правильное значение суммы X, которую она должна получить в качестве платежа от фермера за благоприятный год (что оставит фермеру 160 000 — X долларов), и правильное значение суммы Y, которую компания должна выплатить фермеру за неблагоприятный год (что увеличит его доход до 40 000 + Y долларов). В таком случае оптимальный механизм страхования должен максимизировать ожидаемую прибыль страховой компании с учетом значений X, Y и вероятностей различных исходов и в то же время гарантировать как сохранение заинтересованности фермера в строительстве водосборного резервуара, так и его готовность заключить договор страхования.

Поскольку процесс вычисления значений X и Y довольно сложный, мы вместо этого рассмотрим конкретную пару чисел, при которых фермер получит частичное страхование и стимулы принять меры, направленные на снижение риска, а компания сможет выйти на уровень безубыточности. Предположим, страховая компания предлагает фермеру договор, предусматривающий страхование рисков в объеме, равном третьей части полного страхования. По условиям контракта, платеж фермера должен составлять 10 000 долларов за благоприятный год (при этом у него останется 150 000 дохода), а выплата фермеру — 30 000 за неблагоприятный год (что обеспечит ему 70 000 долларов). Если фермер все же построит качественный водосборный резервуар и будет регулярно проводить его техническое обслуживание, то контракт обеспечит страховой компании ожидаемую прибыль 0,75 × 10 000 — 0,25 × 30 000 = 7500–7500 = 0, а значит, компания захочет предложить фермеру страхование на этом уровне.

Но станет ли фермер соблюдать условия контракта? Другими словами, обеспечивает ли контракт совместимость стимулов? Да, если ожидаемая полезность для фермера при условии страхования и выполнения оговоренных условий превышает ожидаемую полезность заключения договора страхования без выполнения оговоренных мер. То есть такой контракт должен удовлетворять следующему неравенству:

Вычисление значений этих двух выражений дает (приблизительно) 331 > 326, неравенство верно. Следовательно, данный договор частичного страхования удовлетворяет ограничению совместимости стимулов, а значит, побуждает фермера прилагать усилия, направленные на снижение вероятности неблагоприятного исхода.

Удовлетворяет ли этот контракт ограничению участия? Да. Он должен обеспечить фермеру минимум такую же ожидаемую полезность, как он бы получил без страхования. Как мы рассчитали выше, она равна 325, а в результате заключения договора составит 331. Следовательно, фермеру выгоднее заключить договор частичного страхования, чем вообще остаться без страховки, поэтому обе стороны согласятся с его условиями.

Фактические данные, подтверждающие эту теорию страхования и морального риска, можно найти в любом договоре страхования. Большинство страховых полисов содержат различные требования о собственном удержании страхователя и участии в оплате, оставляя часть риска держателя полиса незастрахованным в целях снижения морального риска.

 

6. Стимулирование усилий: фактические данные и дополнительные возможности

Система стимулирования усилий менеджера проекта, о которой шла речь в , представляла собой компромисс между созданием для него более мощного стимула к повышению усилий и требованием взять на себя больше риска ответственности за обеспечение прибыли компании. Этот компромисс очень важен на практике, но его необходимо рассматривать в сочетании с другими элементами взаимоотношений компании и работника, большинство из которых связаны со многими аспектами протекающих в компании процессов. Качество и количество усилий не просто вопрос хорошего или плохого отношения к работе, а полученные результаты — не просто вопрос успеха или неудачи; в каждом из этих случаев присутствует широкий диапазон возможностей, а такие элементы, как время работы и прибыль, могут непрерывно меняться. В компании работает много сотрудников, и общий итог ее деятельности зависит от их действий. У большинства компаний широкий ассортимент продукции, а каждый работник выполняет много разных задач. Кроме того, взаимодействие между организацией и ее сотрудниками долгосрочное, а не на время одного проекта или короткого периода. Соответственно, все эти элементы требуют более сложных систем стимулирования. В данном разделе мы кратко проанализируем некоторые из них и предоставим ссылки на большое количество источников для более глубокого изучения данной темы. В основе систем стимулирования лежат сложные математические расчеты, поэтому мы просто объясним их на интуитивном уровне, а строгий формальный анализ оставим для более углубленных курсов.

А. Нелинейные системы стимулирования

Может ли оптимальная система стимулирования усилий менеджера всегда определяться базовой заработной платой и участием в прибылях? Нет. При наличии трех возможных исходов (провал проекта, умеренный успех и большой успех) выраженная в процентах премия за переход от провала к умеренному успеху может не совпадать с премией за переход от умеренного к большому успеху. Следовательно, оптимальная система стимулирования может быть нелинейной.

Давайте немного изменим пример с надзором за выполнением проекта из , включив в него три возможных исхода: прибыль за вычетом материальных затрат и затрат на оплату труда 0 долларов, 500 000 долларов и 1 миллион долларов. Предположим также, что высокий уровень усилий по контролю за выполнением проекта обеспечивает вероятность успеха 1/6, 1/3 и 1/2 по трем возможным исходам в том же порядке. Низкий уровень усилий по надзору обеспечивает обратную последовательность вероятностей успеха — 1/2, 1/3 и 1/6 соответственно. Тогда несколько более сложные вычисления (которые мы оставляем в качестве дополнительного упражнения) показывают, что оптимальная оплата труда менеджера проекта равна 30 625 долларов в случае неудачи проекта, 160 000 долларов при умеренном успехе и 225 625 долларов при наилучшем исходе. Если в этой системе оплаты представить сумму 30 625 долларов как базовую заработную плату, то премия за успешное выполнение проекта составит 129 375 долларов за обеспечение прибыли 500 000 долларов и 195 000 за обеспечение прибыли 1 миллион долларов. Премия представляет собой долю в прибыли в размере 26 % за первый уровень успеха и всего 13 % за второй уровень.

На практике используются особые формы нелинейных систем стимулирования. Самая распространенная подразумевает выплату заранее оговоренной фиксированной премии в случае достижения определенного уровня эффективности или нормы выработки. Когда целесообразно применять такую систему?

Схема выплаты премии за выполнение нормы выработки представляет собой мощный стимул, если эта норма установлена на таком уровне, что повышение усилий работника существенно увеличивает вероятность ее выполнения. В качестве иллюстрации рассмотрим пример, когда компания хочет, чтобы каждый агент по продажам обеспечивал объем продаж в размере 1 миллион долларов, и готова платить за это до 100 000 долларов. Если компания выплачивает агенту по продажам фиксированные комиссионные в размере 10 %, его дополнительные усилия по увеличению объема продаж с 900 000 долларов до 1 миллиона долларов принесут ему 10 000 долларов. Но если компания предложит агенту по продажам заработную плату 60 000 долларов и премию 40 000 долларов за выполнение нормы продаж в размере 1 миллион долларов, то дополнительные усилия агента на последнем этапе позволят ему выполнить норму и заработать еще 40 000 долларов. Таким образом, установление нормы продаж предоставляет торговцу гораздо более сильный стимул приложить дополнительные усилия.

Однако такая система стимулирования не лишена недостатков. Норму выработки необходимо определить достаточно точно. Предположим, компания допускает ошибку в расчетах и устанавливает норму продаж на уровне 1,2 миллиона долларов, при этом агент по продажам понимает, что вероятность ее выполнения крайне мала, даже если он приложит сверхчеловеческие усилия. В итоге он просто откажется от дальнейших попыток, не станет напрягаться и обеспечит объем продаж даже меньше 1 миллиона долларов. Более того, чистая система стимулирования «норма — премия» не дает ему никаких стимулов превысить уровень в 1 миллион долларов. И наконец, норма рассчитана на определенный период, как правило, календарный год, а это порождает еще более порочные системы стимулирования. Агент по продажам, которому просто не везет в течение первых нескольких месяцев, придет к выводу, что у него уже нет шанса выполнить годовую норму, поэтому он может расслабиться и не прилагать особых усилий до конца года. В свою очередь агент, которому сопутствует удача, уже в июле выполнит норму продаж, и у него тоже не будет стимула усердствовать до конца года, так что он может даже попытаться манипулировать такой системой стимулирования, договорившись с некоторыми клиентами отложить выполнение их заказов до следующего года, чтобы повысить свои шансы на выполнение нормы продаж в следующем году. Линейная система стимулирования наподобие описанной выше системы с участием в прибылях менее подвержена таким манипуляциям.

Поэтому компании обычно используют сочетание нормы выработки и более дифференцированной, состоящей из отдельных фрагментов, линейной системы оплаты. Например, агент по продажам может получать базовую заработную плату, низкие комиссионные за объем продаж от 500 000 до 1 миллиона долларов, более высокую ставку комиссионного вознаграждения за объем продаж от 1 до 2 миллионов долларов и т. д.

Управляющие взаимных фондов часто получают вознаграждение за высокую эффективность на протяжении календарного года. Оно выплачивается за счет компании в виде премий, а также за счет инвесторов, вкладывающих деньги в соответствующий фонд. Если эти схемы вознаграждения нелинейные, управляющие реагируют изменением профиля риска инвестиционного портфеля своего фонда. В мы видели, что человек с вогнутой функцией полезности не расположен к риску, а человек с выпуклой функцией полезности склонен рисковать. Подобно тому как любители риска предпочитают рискованные ситуации безопасным, управляющий, столкнувшийся с выпуклой функцией полезности, повысит уровень риска инвестиционного портфеля своего фонда.

Б. Стимулирование в командах

Сотрудники компании редко занимаются выполнением тех или иных задач в одиночку. Агенты по продажам, отвечающие за определенные регионы, наиболее близки к такой модели, но даже их эффективность зависит от поддержки сотрудников главного офиса компании. Как правило, люди работают в командах, и результат работы всей команды определяют усилия каждого ее члена. Например, прибыль компании в целом зависит от эффективности работы всего персонала. Такая зависимость создает особые проблемы в плане разработки системы стимулирования.

Когда заработок одного работника зависит от прибыли всей компании, каждый отдельно взятый сотрудник видит только слабую связь между своими усилиями и совокупной прибылью, при этом каждый получает в ней лишь небольшую долю. А эта доля — весьма слабый стимул прилагать повышенные усилия к выполнению своих обязанностей. Даже в небольших командах у каждого члена может возникнуть соблазн увильнуть от работы и воспользоваться плодами труда своих коллег. (Как в дилемме заключенных с коллективным действием в контексте игры «уличный сад», о которой шла речь в , и , помните?) Если команда невелика и работает в одном составе на протяжении достаточно продолжительного периода, можно ожидать, что ее члены решат дилемму, разработав внутреннюю и, возможно, не денежную схему вознаграждений и наказаний наподобие той, о которой говорилось в .

В другом контексте наличие в одной команде большого количества работников может усилить стимулы. Допустим, в компании многие работники выполняют аналогичные задачи, например продают отдельные продукты из ее продуктовой линейки. Если в продажах каждого работника присутствует общий (положительно коррелированный) случайный элемент, который может зависеть от состояния реальной экономики, то объем продаж одного работника относительно объема продаж другого работника — хороший показатель их относительных уровней усилий. Например, усилия работников 1 и 2, обозначенные как x1 и x2, могут быть связаны с их продажами y1 = x1 +r и y2 = x2 +r, где r — общая случайная погрешность в объеме продаж (или общий «фактор удачи»). Из этого следует, что разности y2 — y1 = x2 — x1 будут уже без всякой случайности; иными словами, разность между фактическими объемами продаж в точности эквивалентна разности между уровнем усилий, прилагаемых работниками 1 и 2.

Работодатель может вознаграждать этих работников в соответствии с относительными результатами каждого из них. Такая система оплаты не содержит для работников никакого риска. Упомянутый в компромисс между обеспечением оптимального уровня усилий и участием в прибылях в этой системе отсутствует. Если у первого работника низкий объем продаж и он объясняет это невезением, компания может возразить: «Тогда почему второй работник добился весомых результатов? Вы же оба находились в одинаковых условиях, значит, вы, наверное, прилагали меньше усилий». Безусловно, если эти работники могут вступить в сговор, это поставит под угрозу цель компании, но если этого не произойдет, компания может внедрить эффективную систему стимулирования, заставив работников конкурировать друг с другом. Показательный пример такой системы — состязание, в котором приз получает тот, кто демонстрирует более высокие результаты.

Соревнования позволяют смягчить еще одну потенциальную проблему морального риска. В реальной жизни критерии успеха не так уж легко поддаются наблюдению. Поэтому у владельца компании может возникнуть искушение заявить, что никто из работников не проявил особого рвения и никто не заслуживает премии. Состязание с призом, который необходимо кому-то вручить, или заранее выделенный совокупный премиальный фонд, подлежащий распределению среди работников, устраняет этот моральный риск, возникающий по вине принципала.

В. Множественные задачи и результаты

Работники обычно выполняют несколько задач для своих работодателей, что приводит к получению ряда наблюдаемых исходов усилий работника. При этом между стимулированием усилий по выполнению различных задач возникает зависимость, усложняющая разработку механизма стимулирования.

Исход каждой задачи агента отчасти зависит от его усилий и отчасти от случая. Именно поэтому схема стимулирования, основанная на полученных результатах, зачастую подвергает риску выигрыш агента. Если элемент случайности незначителен, риск агента низкий, а значит, стимул прилагать усилия можно повысить. Безусловно, результаты выполнения различных задач зависят от случая в разной степени. Следовательно, если принципал будет разрабатывать систему стимулирования, отдельно анализируя каждую задачу, он использует более сильные стимулы для усилий по выполнению задач с меньшим элементом случайности и более слабые для усилий по выполнению задач, результат которых является более неопределенным показателем усилий агента. Однако мощный стимул для одной задачи отвлечет усилия агента от другой, что еще больше снизит эффективность ее выполнения. Для того чтобы предотвратить такое перераспределение усилий, принципал должен ослабить стимул и в случае этой задачи.

Подобные примеры нередки в нашей жизни. В обязанности профессора входит как научно-исследовательская работа, так и преподавание. Существует много точных показателей эффективных научных исследований: публикации научных работ, назначения на должности редакторов престижных журналов, избрание в академию наук и т. д. Напротив, результаты преподавательской работы в меньшей степени наблюдаемы, а если это и происходит, то с большим запаздыванием. Студентам, как правило, необходимо накопить многолетний опыт, прежде чем они поймут ценность того, чему научились в университете; в краткосрочной перспективе на них скорее произведет впечатление умение преподавателя показать себя, а не передать свои знания. Если бы эти две задачи, стоящие перед преподавателями, рассматривались по отдельности, администраторы университета привязали бы более сильные стимулы к научным исследованиям, а более слабые — к преподаванию. Однако тогда профессора перенаправили бы усилия с преподавания на научную работу (даже в большей степени, чем они уже это делают в некоторых вузах). В связи с этим отсутствие возможности точно отследить результаты преподавания вынуждает деканов факультетов и ректоров университетов предлагать слабые стимулы за научные исследования.

Самый известный пример ситуации с множественными задачами и результатами касается школьного обучения. Некоторые результаты преподавания, такие как баллы за тесты, поддаются точному наблюдению, тогда как другие значимые аспекты образования, например способность работать в команде или умение выступать на публике, измеримы в меньшей степени. Если вознаграждение учителей зависит от баллов, полученных их учениками за тесты, они будут готовить к ним учеников, а другие аспекты обучения игнорировать. Такое «обыгрывание» системы стимулирования распространяется и на спорт. Если в бейсболе хиттер получает вознаграждение только за выбитые хоум-раны, он будет пренебрегать другими аспектами отбивания (принятие подач, выполнение сэкрифайс-бантов и пр.), хотя порой они могли бы повысить шансы его команды на победу. Точно так же агент по продажам может пожертвовать долгосрочными отношениями с клиентом ради достижения краткосрочных целей по обеспечению продаж.

Если проблема деструктивного влияния некоторых стимулов на другие задачи становится слишком серьезной, могут понадобиться другие системы вознаграждения за выполнение задач. В таком случае может быть использован более целостный, хотя и более субъективный критерий эффективности работы, такой как общая оценка со стороны руководителя: работники могут направить свои усилия на те виды деятельности, которые одобрил босс!

Г. Стимулирование в долгосрочной перспективе

Как правило, трудовые отношения поддерживаются на протяжении длительного времени, что позволяет компаниям создавать системы стимулирования, основанные на концепции отложенного вознаграждения, то есть эффективность вашей работы вознаграждается впоследствии. Компании регулярно используют продвижение по службе, оплату по стажу и прочие формы отсроченного вознаграждения. По сути, труд работников на начальных этапах карьеры компания оплачивает по заниженной ставке, а затем ставка поднимается. Перспектива будущего вознаграждения мотивирует более молодых работников прилагать больше усилий к выполнению своих обязанностей, а также побуждает их оставаться в компании, что снижает текучесть кадров. Безусловно, у компании может возникнуть соблазн отказаться от своего неявного обещания о более высокой оплате в последующие годы, поэтому эффективность таких систем зависит от их достоверности. Чаще всего они наиболее действенны в компаниях, имеющих долгую историю стабильности и известных хорошим отношением к работникам старшего возраста.

Еще один способ обеспечить мотивацию работников посредством перспективы будущего вознаграждения — использование так называемой эффективной заработной платы. Компания платит работнику заработную плату, превышающую общепринятый уровень, а разница между двумя ставками представляет собой излишек, или экономическую ренту работника. Работник получает ее при условии добросовестного выполнения обязанностей, но если он начнет филонить, это может быть обнаружено и его уволят. В итоге ему придется вернуться на общий рынок труда, где он сможет получать только общепринятую заработную плату.

Компания сталкивается с задачей разработки механизма при попытке определить приемлемый уровень эффективной заработной платы. Предположим, общепринятая ставка заработной платы составляет w0, а эффективная заработная плата компании равна w > w0. Пусть денежный эквивалент субъективных издержек в связи с приложением надлежащих усилий равен e. На протяжении каждого периода оплаты работник может выбирать, насколько интенсивно трудиться. Если он решит не прилагать особых усилий, это позволит ему сэкономить e, однако с вероятностью p такое увиливание от работы будет обнаружено. Тогда работник потеряет излишек (w — w0) начиная со следующего периода оплаты, и это будет продолжаться неопределенное время. Пусть r — процентная ставка между двумя периодами. Если работник уклоняется от работы сегодня, ожидаемая приведенная стоимость его убытков за следующий период составит p (w — w0)/(1 + r). Кроме того, работник будет терять w — w0 с вероятностью p на протяжении всех последующих периодов оплаты. Вычисления, аналогичные сделанным для повторяющихся игр в и в , показывают, что общая ожидаемая приведенная стоимость будущих убытков работника равна

Для того чтобы у работника не возникало желания уклоняться от выполнения своих обязанностей, компании необходимо сделать так, чтобы его ожидаемый убыток был не меньше прямой выгоды от увиливания от работы, e. Следовательно, компания должна платить работнику эффективную заработную плату, удовлетворяющую следующему условию:

Следовательно, при минимальной эффективной заработной плате это выражение превращается в равенство. Чем точнее компания сумеет определить факт уклонения от работы (то есть чем выше значение p), тем меньше может быть превышение эффективной заработной платы над общепринятой ставкой.

Кроме того, повторяющееся взаимодействие позволяет компании разработать и более эффективную систему стимулирования. Как мы уже говорили, результаты труда работника за любой отдельно взятый период представляют собой сочетание приложенных им усилий и элемента случайности. Однако если эти результаты оставляют желать лучшего год за годом, работник не может постоянно списывать это на счет невезения. Стало быть, согласно закону больших чисел, средний результат за длительный период можно использовать в качестве более точного показателя среднего уровня прилагаемых работником усилий и исходя из этого вознаградить работника или наказать.

 

Резюме

Изучение процесса разработки механизмов можно кратко описать как анализ ситуации «как иметь дело с тем, кто знает больше вас». Такие ситуации возникают во множестве контекстов, как правило, в ходе взаимодействия между более информированным игроком, то есть агентом, и менее информированным, то есть принципалом, который стремится разработать механизм, позволяющий ему привести стимулы агента в соответствие со своей целью.

Существует два типа проблем, связанных с разработкой механизмов. Первый касается раскрытия информации, когда принципал создает систему скрининга информации, имеющейся в распоряжении агента. Второй относится к моральному риску, когда принципал создает систему, позволяющую добиться от агента оптимального уровня наблюдаемых действий. В обоих случаях принципал пытается максимизировать свою целевую функцию с учетом таких ограничений агента, как ограничение совместимости стимулов и ограничение участия.

Компании используют механизмы раскрытия информации при создании систем ценообразования, позволяющих разделить клиентов на типы по их готовности платить за продукцию компании. Контракты на закупки также помогают разделить проекты (или подрядчиков) на типы в соответствии с уровнем затрат. На реальных рынках можно найти конкретные примеры как ценовой дискриминации, так и скрининга посредством закупочных контрактов.

При наличии морального риска работодатели должны составлять контракты таким образом, чтобы побуждать работников к приложению оптимальных усилий. Аналогичным образом страховые компании составляют полисы страхования, стимулирующие клиентов принимать меры по предотвращению страховых случаев. В некоторых простых ситуациях в качестве оптимальных контрактов могут выступать линейные схемы, тогда как при более сложном взаимодействии часто выгоднее нелинейные схемы. Системы стимулирования, предназначенные для членов команд или рассчитанные на длительное взаимодействие, как правило, сложнее, чем разработанные для более простых ситуаций.

 

Ключевые термины

Агент

Принципал

Проблема (взаимоотношение) «принципал — агент»

Разработка механизма

Ценовая дискриминация

 

Упражнения с решениями

S1. Компании, предоставляющие клиентам страховую защиту на случай убытков в связи с грабежом или аварией, вне всяких сомнений, заинтересованы в надлежащем поведении держателей страховых полисов. Предложите несколько идей для разработки системы стимулирования, которую могла бы использовать страховая компания для предотвращения и обнаружения мошенничества или неосторожного поведения со стороны держателей полисов.

S2. Некоторые компании продают свои продукты либо по отдельности, либо в наборах, чтобы увеличить прибыль посредством разделения клиентов с разным предпочтениями.

a) Приведите три примера оптовых скидок в зависимости от количества купленного товара, предлагаемых компаниями.

b) Как такие скидки позволяют компаниям выполнить скрининг клиентов для выяснения их предпочтений?

S3. Компания Omniscient Wireless Limited (OWL) планирует развернуть новую национальную беспроводную телефонную сеть широкополосного доступа в следующем месяце. OWL провела маркетинговое исследование, по результатам которого было установлено, что 10 миллионов ее потенциальных клиентов разделены на два сегмента, которые в компании назвали так: «нерегулярные пользователи» и «регулярные пользователи». Среди первых более низкий спрос на услуги беспроводной телефонной связи, в частности они вряд ли смогут создать для компании ценность, превышающую 300 минут звонков в месяц. Вторые испытывают более высокую потребность в услугах беспроводной телефонной связи и могут создать для компании ценность, превышающую 300 минут звонков в месяц. Аналитики OWL определили, что лучше всего предложить клиентам такие тарифные планы: 300 минут и 600 минут в месяц соответственно. По их оценкам, 50 % клиентов относятся к сегменту нерегулярных пользователей и 50 % — к сегменту регулярных пользователей, причем каждому типу свойственна следующая готовность платить за каждый тип услуг:

Затратами OWL на одну дополнительную минуту беспроводной связи можно пренебречь, поэтому абонплата составляет 10 долларов в месяц на одного пользователя, какой бы тарифный план он ни выбрал.

Каждый потенциальный клиент вычисляет чистый выигрыш (выгода минус цена), который он получит от каждого тарифного плана, и выбирает план, обеспечивающий более высокий чистый выигрыш, если он не является отрицательным. Если оба плана обеспечивают клиенту эквивалентные неотрицательные чистые выигрыши, он выбирает 600 минут; если оба плана приносят клиенту отрицательные чистые выигрыши, он не покупает ни один из них. Компании OWL необходимо максимизировать свою ожидаемую прибыль на одного потенциального клиента.

a) Предположим, компания предлагает пользователям тарифный план на 300, а не на 600 минут. Какую оптимальную цену следует назначить, и какую среднюю прибыль на одного потенциального клиента получит при этом OWL?

b) Допустим, компания предлагает пользователям тарифный план на 600 минут. Какую оптимальную цену следует назначить, и какую среднюю прибыль на одного потенциального клиента получит при этом OWL?

c) Предположим, компания решила предложить оба тарифных плана, причем ей выгодно, чтобы нерегулярные пользователи покупали тарифный план 300 минут, а регулярные пользователи — 600 минут. Составьте ограничение совместимости стимулов для нерегулярного пользователя.

d) Аналогичным образом составьте ограничение совместимости стимулов для регулярного пользователя.

e) Используя результаты, полученные в пунктах c и d, вычислите оптимальные цены на тарифные планы 300 и 600 минут, чтобы каждый пользователь покупал предназначенный для него тарифный план. Какой будет прибыль компании на одного потенциального клиента?

f) Проанализируйте исходы, описанные в пунктах а, b и e. В каждой из трех ситуаций определите, является ли соответствующий исход разделяющим, объединяющим или полуразделяющим.

S4. Mictel Corporation обладает мировой монополией на производство персональных компьютеров. Компания может выпускать компьютеры двух типов: с низкой производительностью и с высокой производительностью. Пятая часть потенциальных покупателей пользуются компьютерами только время от времени, тогда как остальные постоянно.

Затраты на производство двух типов ПК, а также выгода, которую они приносят двум типам потенциальных покупателей, представлены в следующей таблице (все данные отображены в тысячах долларов):

Каждый тип покупателей рассчитывает свой чистый выигрыш (выгода минус цена), который он получил бы в случае покупки компьютера каждого типа, и покупает ПК, обеспечивающий более высокий чистый выигрыш, если он не отрицательный. Если оба типа компьютеров обеспечивают эквивалентные неотрицательные выигрыши, покупатель выбирает высокопроизводительный компьютер; если оба типа приносят отрицательные чистые выигрыши, он вообще ничего не покупает. Компании Mictel необходимо максимизировать свою ожидаемую прибыль.

a) Если бы Mictel располагала всей полнотой информации, то, зная тип потенциального клиента, она могла бы предлагать ему только один вид компьютера по установленной цене, придерживаясь принципа «хотите берите, хотите нет». Какой компьютер и по какой цене компания предложила бы каждому типу покупателей?

На самом деле компании Mictel неизвестен тип каждого отдельно взятого покупателя, поэтому она составляет каталог, из которого все покупатели могут выбирать компьютеры.

b) Сначала предположим, что компания выпускает только компьютеры с низкой производительностью и продает их по цене x. Какое значение x обеспечит Mictel максимальную прибыль? Почему?

c) Теперь допустим, что компания выпускает только компьютеры с высокой производительностью и продает их по цене y. Какое значение y обеспечит Mictel максимальную прибыль? Почему?

d) И наконец, предположим, что компания выпускает оба типа компьютеров, продавая ПК с низкой производительностью по цене x, а с высокой по цене y. Каким ограничениям совместимости стимулов должна удовлетворять компания по значениям x и y, если она хочет, чтобы случайные пользователи покупали компьютеры с низкой производительностью, а постоянные — с высокой производительностью?

e) Каким ограничениям участия должны удовлетворять значения x и y для того, чтобы случайные пользователи были готовы покупать компьютеры с низкой производительностью, а постоянные — компьютеры с высокой производительностью?

f) С учетом ограничений, найденных в пунктах d и e, какие значения x и y максимизируют ожидаемую прибыль компании, когда она продает оба типа ПК? Какова ожидаемая прибыль Mictel вследствие такой политики?

g) С учетом всех сделанных выше выводов определите, какой политики в области производства и ценообразования должна придерживаться компания.

S5. Еще раз выполните  исходя из предположения, что половина клиентов компании Mictel — случайные пользователи.

S6. На основании выводов, полученных в и , решите  для общего случая, в котором доля случайных пользователей составляет c, а доля постоянных пользователей — (1 — c). Ответы на некоторые части этих упражнений зависят от значения c. В этих случаях перечислите все возможные варианты и объясните, как они зависят от значения c.

S7. Дисконтный кинотеатр Sticky Shoe продает попкорн и газированную воду в специальных торговых точках. Кэмерон, Джесси и Шон — постоянные клиенты Sticky Shoe; каждый из них оценивает попкорн и газированную воду следующим образом:

Кроме этой троицы, в кинотеатр Sticky Shoe ходят еще 2997 жителей Харкинсвилля, одна треть которых оценивают попкорн и газированную воду так же, как Кэмерон, еще одна треть — как Джессика, и еще треть — как Шон. Если клиенту безразлично, покупать попкорн и напитки или нет, он покупает. Приготовление дополнительной порции попкорна или напитка Sticky Shoe не стоит практически ничего.

a) Если Sticky Shoe устанавливает отдельные цены на попкорн и напитки, какой должна быть цена каждого продукта, чтобы максимизировать прибыль? Какую прибыль получит Sticky Shoe, продавая попкорн и газированную воду отдельно?

b) Что будет покупать каждый тип клиентов (Кэмерон, Джессика и Шон), если Sticky Shoe установит отдельные цены на попкорн и газированную воду, обеспечивающие максимальную прибыль?

c) Вместо продажи продуктов по отдельности Sticky Shoe решает продавать их вместе, назначая одну цену на весь набор. Какая единая цена за набор обеспечит Sticky Shoe максимальную прибыль? Какую прибыль получит Sticky Shoe, продавая попкорн и газированную воду только вместе?

d) Что будет покупать каждый тип клиентов, если Sticky Shoe установит единую цену на попкорн и газированную воду в одном наборе, обеспечивающую максимальную прибыль? Чем этот ответ отличается от ответа в пункте b?

e) Какой схеме ценообразования отдает предпочтение каждый тип клиентов? Почему?

f) Если бы кинотеатр Sticky Shoe продавал попкорн и газированную воду как в наборах, так и отдельно, какие продукты (попкорн, газированную воду или их набор) он захотел бы продавать каждому типу клиентов? Как Sticky Shoe может добиться, чтобы каждый клиент покупал продукт, предназначенный именно для него?

g) Какие цены (на попкорн, газированную воду и набор из этих продуктов) установил бы Sticky Shoe, чтобы максимизировать свою прибыль? Какую прибыль получит Sticky Shoe, продавая продукты по этим трем ценам?

h) Чем отличаются ответы в пунктах а, c и g? Объясните причины.

S8. В данной главы рассказывается о проблеме «принципал — агент» в контексте компании, которая решает, как стимулировать менеджера проекта прилагать больше усилий к повышению вероятности его успешной реализации. Стоимость успешного проекта составляет 1 миллион долларов; вероятность успеха при высоком уровне усилий равна 0,5; при низком — 0,25. Полезность дохода для менеджера равна квадратному корню из суммы вознаграждения (исчисляемого в миллионах долларов), а отрицательная полезность приложения больших усилий составляет 0,1. Однако минимальная заработная плата менеджера равна теперь 160 000 долларов.

a) Какой контракт предложит компания менеджеру проекта, если ее устраивает его низкий уровень усилий?

b) Какова ожидаемая прибыль компании в случае, если ее система стимулирования обеспечивает низкий уровень усилий менеджера проекта?

c) Какую пару контрактов (y, x), где y — заработная плата в случае успешного выполнения проекта, а x — заработная плата в случае провала проекта, компания должна предложить менеджеру, чтобы он был заинтересован повысить уровень усилий?

d) Какова ожидаемая прибыль компании при обеспечении высокого уровня усилий?

e) Какого уровня усилий компания ждет от менеджера? Почему?

S9. Компания застраховала свое основное производственное предприятие от пожара. Вероятность пожара на предприятии без программы противопожарных мероприятий равна 0,01, а при наличии такой программы 0,001. В случае пожара размер убытков составит 300 000 долларов. Выполнение программы противопожарных мероприятий обошлось бы в 80 долларов, но страховая компания не может без дополнительных затрат отслеживать ход выполнения противопожарных мероприятий.

a) Почему в этой ситуации возникает моральный риск? Каков его источник?

b) Может ли страховая компания устранить проблему морального риска? Если да, то как? Если нет, объясните почему.

S10. В 1781 году Моцарт переехал из Зальцбурга в Вену, надеясь получить место при дворе Габсбургов. Но вместо того чтобы просить его, Моцарт решил ждать, когда император призовет его к себе сам, поскольку «если кто-то делает шаг первым, он получает меньшую оплату». Проанализируйте эту ситуацию с точки зрения теории игр с асимметричной информацией, в том числе принципов сигнализирования и скрининга.

S11 (дополнительное упражнение, требующее исчисления). Вы министр Океании по вопросам мира, и ваша работа — закупать военное имущество для своей страны. Исчисляемая в долларах Океании чистая выгода от объема Q этого имущества равна 2Q1/2 — M, где M — сумма денег, выплаченных за имущество.

Есть только один поставщик военного имущества — Baron Myerson’s Armaments (BMA). Вы не знаете, какие производственные затраты он несет. Общеизвестно, что затраты BMA на производство единицы продукции — это постоянная величина, равная 0,10 с вероятностью p = 0,4 и 0,16 с вероятностью 1 — p. Назовем BMA компанией с низким уровнем затрат, если ее производственные затраты не превышают 0,10, и компанией с высоким уровнем затрат, если ее затраты составляют 0,16. Истинный тип затрат известен только самой BMA.

В прошлом ваше министерство использовало два типа контрактов на закупку: «затраты плюс» и контракт с фиксированной ценой. Но контракты «затраты плюс» создают для BMA стимул завышать свой уровень затрат, а в случае контрактов с фиксированной ценой компании может быть заплачено больше, чем необходимо. Вы принимаете решение предложить BMA на выбор два возможных контракта:

Контракт 1: мы выплатим вам сумму M 1 за поставку количества Q 1 .

Контракт 2: мы выплатим вам сумму M 2 за поставку количества Q 2 .

Необходимо выбрать такие значения Q1, M1, Q2 и M2, чтобы для компании BMA с низким уровнем затрат более выгодным был контракт 1, а для компании BMA с высоким уровнем затрат — контракт 2. Если другой контракт обеспечивает аналогичную прибыль, то BMA с низким уровнем затрат выберет контракт 1, а BMA с высоким уровнем затрат — контракт 2. Кроме того, независимо от уровня затрат, компании BMA нужно получить как минимум нулевую экономическую прибыль в случае любого выбранного контракта.

a) Составьте формулы для определения прибыли BMA с низким уровнем затрат и BMA с высоким уровнем затрат в случае, когда компания получает сумму M за поставку количества Q.

b) Выведите формулы ограничения совместимости стимулов, побуждающих BMA с низким уровнем затрат выбрать контракт 1, а BMA с высоким уровнем затрат — контракт 2.

c) Сформулируйте ограничения участия для каждого типа BMA.

d) Выведите формулу определения ожидаемой чистой выгоды Океании в случае, если компания BMA каждого типа выберет контракт, ориентированный именно на этот тип.

Теперь ваша задача — выбрать значения Q1, M1, Q2 и M2, обеспечивающие максимальную ожидаемую чистую выгоду, вычисленную в пункте d, с учетом ограничения совместимости стимулов (incentive-compatibility, IC) и ограничения участия (participation constraint, PC)

e) Допустим, Q1 > Q2, а также предположим, что ограничения IC1 и PC2 связывающие, то есть выполняются в случае равенства, а не в случае слабого неравенства. Используйте их для определения нижних пределов значений M1 и M2, достижимых при соответствующих значениях Q1 и Q2.

f) Докажите, что в случае связывающих ограничений IC1 и PC2 ограничения IC2 и PC1 удовлетворяются автоматически.

g) Подставьте выражения, полученные в пункте c, вместо M1 и M2, чтобы выразить целевую функцию через Q1 и Q2.

h) Запишите условия максимизации первого порядка и решите их относительно Q1 и Q2.

i) Найдите решение относительно M1 и M2.

j) Какую ожидаемую чистую выгоду получит Океания, предложив такой выбор контрактов?

k) Какие общие принципы скрининга проиллюстрированы в этом списке контрактов?

S12 (дополнительное упражнение). Вернитесь к задаче из и проанализируйте, чем оптимальный список найденных в ней контрактов отличается от некоторых альтернативных контрактов.

a) Если бы вы решили предложить один контракт с фиксированной ценой, ориентированный на привлечение только BMA с низким уровнем затрат, каким бы он был? Другими словами, какая пара (Q, M) была бы оптимальной, если бы вы знали, что BMA — компания с низким уровнем затрат?

b) Приняла бы компания BMA с высоким уровнем затрат контракт, предложенный в пункте а? Почему да или почему нет?

c) Какой была бы ожидаемая чистая выгода Океании от предложения контракта из пункта а с учетом вероятности того, что BMA — это компания с низким уровнем затрат? Как этот показатель отличается от ожидаемой чистой выгоды в случае списка контрактов, составленного в ?

d) Какой контракт с фиксированной ценой вы бы предложили BMA с высоким уровнем затрат?

e) Компания BMA с низким уровнем затрат согласилась бы принять контракт, составленный в пункте d? Какой была бы ее прибыль в случае согласия?

f) С учетом вашего ответа в пункте e какой была бы ожидаемая чистая выгода Океании, если бы она предложила контракт из пункта d? Как этот показатель отличается от ожидаемой чистой выгоды в случае списка контрактов, составленного в ?

g) Рассмотрите случай, когда сотрудник BMA, занимающийся промышленным шпионажем, пообещал сообщить вам точный объем затрат на единицу продукции, что позволит Океании предложить только один контракт с фиксированной ценой, рассчитанный на истинный тип компании BMA. Какой была бы ожидаемая чистая выгода Океании, если бы ей было известно, что она получит информацию об истинном типе BMA? Как это соотносится с пунктами c и f данного упражнения, а также с ?

 

Упражнения без решений

U1. Какие проблемы морального риска и (или) неблагоприятного отбора могут возникнуть в следующих ситуациях? В каждом случае кратко опишите некоторые системы стимулирования и (или) стратегии сигнализирования и скрининга, направленные на преодоление этих проблем. От вас не требуется никаких математических вычислений, но вы должны дать четкое экономическое обоснование того, почему и как работают предложенные вами методы.

a) Ваш финансовый консультант говорит вам, какие акции покупать или продавать.

b) Вы обращаетесь к риелтору, решив продать свой дом.

c) Вы посещаете своего врача либо для проведения планового медицинского осмотра, либо для лечения.

U2. MicroStuff — компания по выпуску программного обеспечения, которая продает два популярных приложения WordStuff и ExcelStuff. Выпуск дополнительной копии программ не требует от MicroStuff никаких затрат. У MicroStuff есть три типа потенциальных клиентов, которых представляют Ингрид, Хавьера и Кэти. В общем существует 100 миллионов потенциальных клиентов каждого типа, для которых каждое приложение представляет такую ценность в долларах:

a) Если компания MicroStuff устанавливает отдельные цены на приложения WordStuff и ExcelStuff, какой должна быть цена каждого из них, обеспечивающая компании максимальную прибыль?

b) Что предпочтет каждый тип клиентов (Ингрид, Хавьера и Кэти), если MicroStuff установит отдельные цены на WordStuff и ExcelStuff, обеспечивающие максимальную прибыль?

c) Вместо продажи приложений WordStuff и ExcelStuff по отдельности MicroStuff решает продавать их вместе, назначая одну цену на весь комплект. Какая единая цена за пакет обеспечит MicroStuff максимальную прибыль? Какую прибыль получит MicroStuff, продавая WordStuff и ExcelStuff только в комплекте?

d) Что будет покупать каждый тип клиентов (Ингрид, Хавьера и Кэти), если MicroStuff установит единую цену на комплект приложений WordStuff и ExcelStuff, обеспечивающую максимальную прибыль? Чем этот ответ отличается от ответа в пункте b?

e) Какой схеме ценообразования отдает предпочтение каждый тип клиентов? Почему?

f) Если бы компания MicroStuff продавала приложения WordStuff и ExcelStuff как в комплекте, так и отдельно, какие продукты (WordStuff, ExcelStuff или пакет приложений) она захотела бы продавать каждому типу клиентов? Как MicroStuff может добиться того, чтобы каждый клиент покупал продукт, предназначенный именно для него?

g) Какие цены на WordStuff, ExcelStuff или пакет приложений установила бы компания MicroStuff, чтобы максимизировать свою прибыль? Какую прибыль получит MicroStuff, продавая свои продукты по этим трем ценам?

h) Чем отличаются ответы в пунктах а, c и g? Объясните причины.

U3. Рассмотрите пример с уровнем усилий менеджера проекта, аналогичный примеру из . Стоимость успешного проекта составляет 420 000 долларов; вероятность успеха равна 1/2 при наличии эффективного контроля за выполнением проекта и 1/4 без него. Менеджер нейтрален к риску, а не избегает его, как в , поэтому его ожидаемая полезность равна ожидаемой прибыли за вычетом отрицательной полезности усилий. Он может получить работу в другом месте с оплатой 90 000 долларов; при этом отрицательная полезность дополнительных усилий, которые ему придется прилагать к выполнению вашего проекта, составляет 100 000 долларов.

a) Продемонстрируйте, что стимулирование высокого уровня усилий потребует от компании предложить менеджеру систему вознаграждения с отрицательной базовой ставкой заработной платы; другими словами, если проект потерпит неудачу, менеджер должен выплатить компании оговоренную в контракте сумму.

b) Как можно реализовать на практике идею отрицательной базовой ставки заработной платы?

c) Докажите, что если отрицательную базовую ставку заработной платы установить невозможно, то компании выгоднее пойти на низкую оплату труда менеджера при низком уровне усилий с его стороны.

U4. Cheapskates — профессиональная хоккейная команда низшей лиги. Спорткомплекс команды может вместить всех 1000 болельщиков, которые захотят посмотреть ее домашние матчи, и может предложить два типа мест: обычные и эксклюзивные. Есть также два типа болельщиков: 60 процентов — болельщики из числа «синих воротничков», а остальные — «белые воротнички». Данные о затратах на предоставление мест каждого типа, а также о готовности болельщиков за них платить приведены в следующей таблице (в долларах):

Каждый болельщик купит максимум одно место, в зависимости от излишка потребителя (максимальная готовность платить минус фактическая цена). Если этот излишек в обоих случаях отрицательный, то болельщик вообще не станет покупать билет. Если хотя бы один тип мест обеспечивает болельщику неотрицательный излишек, то он купит место того типа, который предоставляет более высокий излишек. Если оба типа мест гарантируют эквивалентные неотрицательные излишки, тогда «синий воротничок» выберет обычное место, а «белый» — эксклюзивное.

Владельцы команды предоставляют разные места и определяют на них цены таким образом, чтобы максимизировать свою прибыль. Они устанавливают цены на каждый тип мест, продают по ним как можно больше билетов, а затем предоставляют информацию о количестве и типах мест каждого вида, на которые были проданы билеты.

a) Сперва предположим, что владельцы команды могут определить тип каждого отдельно взятого болельщика, который приходит к окошку билетной кассы (скажем, по типу воротничка), и могут предложить ему соответствующий тип места по установленной цене, придерживаясь принципа «хотите берите, хотите нет». Какой была бы максимальная прибыль владельцев команды π* при такой системе?

b) Теперь допустим, что владельцы команды не имеют возможности определить тип каждого отдельно взятого болельщика, но им известна доля «синих воротничков». Пусть цена обычного места равна X, а цена эксклюзивного — Y. При каких ограничениях совместимости стимулов «синие воротнички» будут покупать обычные места, а «белые» — эксклюзивные? Постройте график этих ограничений на плоскости с осями X и Y.

c) Какие ограничения участия определяют решения болельщиков о покупке билетов? Отобразите эти ограничения на графике, построенном в пункте b.

d) Какие цены X и Y с учетом ограничений, найденных в пунктах b и c, обеспечат владельцам команды максимальную прибыль π2 при такой системе ценообразования? Чему равно значение π2?

e) Владельцы команды подумывают установить цены на таком уровне, чтобы билеты покупали только «белые воротнички». Какой будет прибыль владельцев πw , если они решат обслуживать только эту категорию болельщиков?

f) Сравнив значения π2 и πw , определите политику ценообразования, которую выберут владельцы команды. Как прибыль, полученная ими вследствие такой политики, отличается от прибыли π* при наличии полной информации?

g) Чему равны затраты на преодоление асимметричности информации в пункте f? Кто несет на себе эти затраты? Почему?

U5. Выполните , исходя из предположения, что 10 % болельщиков относятся к числу «синих воротничков».

U6. На основании выводов, полученных в и , решите для общего случая, в котором доля «синих воротничков» составляет B, а доля «белых воротничков» — (1 — B). Ответы на некоторые части упражнения зависят от значения B. В этих случаях перечислите все возможные варианты и объясните, как они зависят от значения B.

U7. Во многих ситуациях агенты прилагают большие усилия к тому, чтобы получить более высокооплачиваемую должность, при этом оплата труда фиксированная и агенты конкурируют между собой за эти должности. Теория состязаний рассматривает группу агентов, конкурирующих за фиксированную совокупность призов. В этом случае все, что нужно для победы, — это позиции одного агента относительно другого, а не абсолютный уровень эффективности.

a) Сформулируйте причины, по которым компания может прибегнуть к описанной выше состязательной системе. Проанализируйте ее влияние на стимулы компании и ее работников.

b) Сформулируйте причины, по которым компания может отказаться от использования описанной выше состязательной системы.

c) Приведите один конкретный прогноз теории состязаний, а также пример эмпирических данных, поддерживающих этот прогноз.

U8. Выполните  со следующими изменениями: из-за ухода некоторых самых талантливых инженеров вероятность успеха при высоком уровне усилий по надзору составляет всего 0,4, а вероятность успеха при низком уровне усилий снижается до 0,24.

U9 (дополнительное упражнение). Преподаватель хочет определить, насколько его студенты уверены в своих способностях, и предлагает следующую схему: «После того как ответите на вопрос, укажите свою оценку вероятности того, что вы правы. Затем я проверю ваш ответ на вопрос. Предположим, вы оценили вероятность как x. Если ваш ответ действительно правильный, вы получите оценку log(x), если неправильный — log(1 — x)». Продемонстрируйте, что такая схема будет стимулировать студентов давать правдивую оценку; иными словами, покажите, что если вероятность правильного ответа равна p, то приведенная студентами оценка x = p.

U10 (дополнительное упражнение). Выполните , исходя из предположения о том, что BMA — компания с низким уровнем затрат с вероятностью 0,6.

U11 (дополнительное упражнение). Выполните , исходя из предположения, что в компании BMA с низким уровнем издержек затраты на единицу продукции составляют 0,2 с вероятностью 0,38. Пусть вероятность того, что BMA — это компания с низким уровнем затрат, составляет 0,4.

U12 (дополнительное упражнение). Вернитесь к истории с Океанией, где она закупает военное имущество у BMA (см. ). Теперь проанализируйте ситуацию, в которой в BMA есть три возможных типа затрат: c1, c2 и c3, где c3 > c2 > c1. BMA несет затраты c1 с вероятностью p1, затраты c2 с вероятностью p2 и затраты c3 с вероятностью p3, где p1 + p2 + p3 = 1. Далее будем говорить, что компания BMA принадлежит к типу i, если ее затраты составляют c i при i = 1, 2, 3.

Вы предлагаете выбор из трех возможностей: «Мы выплатим вам сумму M i за поставку количества Q i при i = 1, 2, 3». Предположим, выбор более одного контракта обеспечивает равную прибыль, поэтому BMA типа i выберет контракт i. Для того чтобы удовлетворять условию участия, контракт i должен гарантировать компании BMA типа i неотрицательную прибыль.

a) Выведите формулу определения прибыли BMA типа i в случае, когда компания получает сумму M за поставку количества Q.

b) Сформулируйте условия ограничения участия для каждого типа BMA.

c) Укажите шесть ограничений совместимости стимулов. Другими словами, составьте выражение для каждого типа i, согласно которому прибыль, которую получит BMA в случае выбора контракта i, будет больше или равна прибыли, которую она получит при выборе двух других контрактов.

d) Составьте формулу определения ожидаемой чистой выгоды Океании B. Это и есть целевая функция (функция, которую необходимо максимизировать).

Теперь ваша задача — выбрать три значения Q i и три значения M i , обеспечивающие максимальную ожидаемую чистую выгоду с учетом ограничения совместимости стимулов (IC) и ограничения участия (PC).

e) Начните с трех ограничений: ограничение IC в отношении типа 2 подразумевает, что компания предпочтет контракт 2 контракту 3; ограничение IC в отношении типа 1 подразумевает, что компания предпочитает контракт 1 контракту 2; а также ограничение участия в отношении типа 3. Предположим, Q1 > Q2> Q3. Используйте эти ограничения для определения нижних пределов значений М1, М2 и М3, достижимых при соответствующих значениях c1, c2 и c3, а также Q1, Q2 и Q3. (Обратите внимание, что в выражении для нижней границы по каждому значению M может присутствовать два или более значения c и Q.)

f) Докажите, что три ограничения (два IC и одно PC), о которых идет речь в пункте е, связывающие в точке оптимума.

g) Теперь докажите, что, если три ограничения в пункте f связывающие, еще шесть ограничений (оставшиеся ограничения IC и два ограничения PC) удовлетворяются автоматически.

h) Подставьте соответствующие выражения вместо М i , выразив целевую функцию только через три Q i .

i) Запишите условия максимизации первого порядка и решите их относительно Q i . То есть возьмите три частные производные ∂Q i /∂B, приравняйте их к нулю и решите это уравнение относительно Q i .

j) Докажите, что указанное условие Q1 > Q2 > Q3 будет выполнено в точке оптимума, если