Игра случая. Математика и мифология совпадения

Мазур Джозеф

Раздел 2

Математика

 

 

Здесь мы предложим читателю некоторые математические инструменты для исследования историй о совпадениях: закон больших чисел, закон действительно больших чисел, задачу о дне рождения, основы теории вероятностей и теории распределения чисел. Этот раздел охватывает математику, которая будет полезна для понимания основной идеи книги, а именно: если есть сколь угодно малая вероятность наступления некоторого события, когда-нибудь оно обязательно произойдет. Эти математические средства будут использованы для того, чтобы проанализировать истории, представленные в разделе 1; мы также вернемся к этим средствам в разделе 3.

 

Глава 4

Каковы шансы?

 

Совершенно невероятные истории о совпадениях неизменно заканчиваются вопросом: «Ну и каковы шансы, что нечто подобное может произойти?» Обычно вопрос является риторическим, поскольку на него в буквальном смысле сложно ответить. И хотя есть фундаментальные статистические методы и проверенные экспериментальные модели для изучения редких совпадений, у математиков все еще нет общей теории для данного предмета. Проблема заключается в самом определении слова. Все-таки «совпадение» предполагает событие без очевидной причины, включая случайности и чудеса. Что бы мы делали без веры в чудеса? Возможно, измерение вероятности совпадения – это оксюморон. Как мы можем узнать вероятность события, не имеющего видимой причины? Кто-то может утверждать, что выпадение двух шестерок на паре игральных костей не имеет видимой причины, за исключением сотни не поддающихся оценке переменных, которые определяют их движение, но тем не менее мы в состоянии оценить шансы против такого исхода как 35 к 1. У нас имеются точные и столь необходимые для страховых компаний данные о шансе дожить до возраста x лет. Так что же мешает нам измерить вероятность чуда или того, что сбудется сон, в котором мы встретили таинственного незнакомца посреди переполненной людьми комнаты? Нам не всегда необходимо знать причину события для того, чтобы разобраться с измерением его вероятности. Мы не знали, почему курение вызывает рак, когда выяснили это с помощью оценки статистической вероятности возникновения болезни. Это произошло после Второй мировой войны, когда женщины, которые до войны не курили, пошли работать на заводы и в учреждения – и начали курить. Тут же подскочила заболеваемость раком, – и бинго! – мы предположили наличие корреляции и сложили два и два. Проблема со многими совпадениями заключается в гигантском числе переменных, которых мы можем не знать или быть не в состоянии вывести из статистической выборки. Совпадения непросто оценить с помощью методов количественного анализа; однако есть качественные основания для предположения о том, что они происходят чаще, чем мы ожидаем. Даже физики избегают количественных прогнозов, предпочитая качественные.

Размышляя о совпадениях, мы имеем в виду правдоподобие. Попробуйте рассказать историю о совпадении, и кто-нибудь непременно спросит: «Ну и каковы шансы того, что такое могло произойти?» Ответ почти всегда сводится к словосочетанию «довольно незначительные». Объяснить нам, что значит «довольно незначительные», или по крайней мере заставить задуматься – задача специалистов по теории вероятностей. Меру правдоподобности события в числовом выражении математики называют вероятностью. Она всегда находится в пределах от 0 до 1, где 0 означает невозможность, а 1 – абсолютную достоверность. Существует несколько способов ее измерения. Один – рассмотреть относительную частотность большой выборки. В принципе, вероятность события – это отношение двух чисел, каждое из которых можно определить, повторяя испытание и вычисляя долю случаев, когда событие произошло. По мере увеличения числа испытаний частота наступления события приближается к вероятности этого события. Второй способ измерения – посчитать логические возможности: брошенная правильная игральная кость может приземлиться только на одну из шести сторон. Нам нет необходимости бросать кости, чтобы узнать, что вероятность выбросить четное число составляет 1/2, или 50 %.

Если два события связаны таким образом, что оба не могут произойти одновременно ввиду некоего логического ограничения (например, невозможность вытянуть одновременно красную даму и даму пик при условии, что тянут только одну карту, из стандартной колоды в 52 карты), тогда вероятность наступления одного либо другого события – это сумма вероятностей каждого из событий. Другими словами, вероятность вытянуть красную даму или даму пик составляет 1/26 + 1/52 = 3/52.

Общий смысл следующий: предположим, что X обозначает исход испытания, а P (X) – вероятность наступления события. Тогда вероятность того, что событие не наступит, будет 1 – P (X). Например, если вы подбрасывали монетку, то P (орел) будет равняться 1/2, как и P (решка). Если бросают пару игральных костей, то P (4) = 1/12, а P (не 4) = 11/12. Если X и Y – возможные взаимоисключающие исходы, то вероятность наступления события X и Y равна 0 и вероятность наступления X или Y равна P (X) + P (Y).

В качестве примера из жизни возьмем следующие события: первое – случайно встретиться с лучшим другом на Бора-Бора утром в следующий вторник; второе – случайно встретить двоюродного брата или сестру после полудня в тот же самый день в Рейкьявике. Первое имеет влияние на второе. Если вы не располагаете личным истребителем F-15, вы не можете случайно встретиться с лучшим другом на Бора-Бора и случайно встретиться с двоюродным братом или сестрой в Рейкьявике. Естественно, допущение обеих возможностей дает лучшие шансы. В случае с картами: можно вытянуть красную даму или (черную) даму пик. Если, с другой стороны, мы имеем ситуацию, где одно событие совершенно не зависит от другого, тогда вероятность того, что наступят оба, – это произведение вероятностей каждого из событий. Вероятность вытянуть красную даму, а затем, вернув ее в колоду, вытянуть даму пик будет 1/26 × 1/52 = 1/1352.

Действительно, требование о том, чтобы наступили два заданных события, дает меньшие шансы. С другой стороны, вероятность вытянуть из колоды обе карты, не возвращая в колоду первую карту, немного осложняет задачу. Нам потребуется найти вероятность того, что одно событие наступит после другого: условная вероятность. Случай со сдачей двух карт из одной колоды поучителен. Если допустить, что сданную карту не возвращают в колоду, то вероятность вытянуть красную даму, а затем – даму пик составит 1/26 × 1/51 = 1/1326. В момент сдачи второй карты в колоде не будет одной красной дамы или попросту одной карты. Таким образом, вероятность вытянуть даму пик на второй сдаче будет вероятностью вытянуть ее из колоды в 51 карту. Не возвращая карту в колоду, мы тем самым увеличиваем вероятность сдачи дамы пик. В данном случае важно то, что мы имеем дело с произведением двух чисел, оба из которых меньше единицы, а это означает, что полученная вероятность будет меньше вероятности каждого из событий. Для ясности отметим: мы условились, что дама пик была вытянута после красной дамы. Если бы условием была сдача любой из карт – дама пик вытянута первой по счету или второй, вероятность была бы больше. Мы рассматривали бы две вероятности: вероятность сдачи дамы пик, а затем красной дамы и вероятность сдачи красной дамы, а затем дамы пик.

 

Разница между шансом и вероятностью

Мы видим различие между понятиями «шанс» и «вероятность». Когда мы говорим, что шанс – это m: n, мы имеем в виду, что ожидаем, что событие не наступает в m случаях из n, когда оно наступает. Стандартная запись выглядит как m: n, что на словах означает «отношение m к n». Если шанс – это m: n, то вероятность будет отношением n/m+n, т. е. шанс 4 к 1, если перевести в вероятность, будет 1/5. Для вычисления шансов наступления события p вычислим отношение (1 – p)/p и сократим его до m/n. Тогда шанс того, что событие наступит, составит m к n. В случае с p = 1/5 отношение превращается в (1 – (1/5))/(1/5) = 4/1, таким образом шанс составляет 4:1.

Понятие шанса взято из азартных игр. С его помощью легче вычислять выигрыш; если выигравшая ставка в $1 оплачивается как m к 1, то выигрыш составит $m, т. е. сумма включает также и величину первоначальной ставки. Равные шансы или равная ставка означают, что шансы 1 из 1. В этой книге мы постараемся ограничиться случаями, где m = 1. Понять, насколько вероятно или невероятно событие, проще, когда мы знаем, что на одно удачное испытание приходится m неудачных. В определенных случаях мы будем использовать выражение «шансы 1 из m», подразумевая, что на m испытаний будет приходиться одно удачное. Так, например, «шансы вытянуть туза пик из колоды в 52 карты составляют 1 из 52», что можно выразить и как «шанс вытянуть туза пик из колоды в 52 карты составляет 51 к 1».

 

Вероятностный мысленный эксперимент

Выберем два любых маловероятных события. Примем в качестве первого – черная кошка перейдет вам путь в следующую среду. В качестве второго – вы когда-нибудь получите заказное письмо от юридической конторы, в котором будет сказано, что ваш двоюродный дедушка, о котором вы никогда не слышали, скончался и оставил вам миллион долларов. Предположим, что первое событие имеет вероятность 0,000001, учитывая численность черных кошек, шатающихся по улицам в вашем районе. Предположим, что вероятность второго – 0,000001, учитывая, что у ваших родителей не слишком много дядьев, о которых вы не знаете. (Эти числа я выбрал исключительно умозрительно.) Вероятность наступления обоих событий необычайно мала – всего 0,000000000001. Эта вероятность меньше, чем вероятность того, что наступит хотя бы одно из событий, и выше, чем вероятность того, что оба события произойдут одновременно. Несомненно, что вероятность наступления одного или другого события выше.

Теперь рассмотрим десять отдельных редких событий:

а) Черная кошка переходит вам путь в среду.

б) Двоюродный дедушка, о котором вы никогда не слышали, умирает и оставляет вам в наследство миллион долларов.

в) Кольцо, которое вы потеряли 20 лет назад, появляется на гаражной распродаже на вашей улице.

г) Сон, в котором мы встретили таинственного незнакомца посреди переполненной людьми комнаты, сбывается.

д) Вы играете в лотерею Texas Lotto и дважды выигрываете.

е) Вы случайно встречаете собственного брата на Бора-Бора.

ж) Находясь за границей, вы находите экземпляр книги Марка Твена «Таинственный незнакомец» с вашей подписью на титульном листе.

з) Вы получаете новый паспорт, номер которого совпадает с номером вашего социального страхования.

и) Вы находите экземпляр книги Марка Твена «Таинственный незнакомец», который был у вас во время учебы в школе, на скамье в парке (да, событие очень похоже на события «ж»).

к) Вы берете такси в Чикаго и узнаете в водителе человека, который подвозил вас в Нью-Йорке в прошлом году.

Я выбрал эти события произвольно. Некоторые из них являются совпадениями, некоторые – просто отдельные события. Они могли бы быть совершенно самостоятельными событиями, если бы не пресловутая бабочка над Тихим океаном, которая, как видно, влияет на все на свете: от погоды в Париже до результатов скачек «Кентукки Дерби», чем постоянно вызывает непредвиденные волнения. Почему кошка появилась в определенный момент? Таинственный незнакомец мог оказаться тем парнем, которому кошка принесла ваше давно потерянное кольцо.

Вероятность некоторых из этих событий и им подобных узнать чрезвычайно сложно даже приблизительно. Для простоты предположим, что вероятность каждого из событий составляет 0,000001, т. е. меньше, чем вероятность получить с раздачи флеш-рояль при игре в покер. Особых причин для того, чтобы брать именно это число, нет, кроме простого факта – такое событие не невозможно, но слишком уж рассчитывать на него не стоит. Может показаться, что вероятность наступления одного из двух событий в списке составит 2 × 0,000001 = 0,000002, потому что вероятности складываются, когда необходимо вычислить вероятность наступления одного из двух событий. Тогда можно наивно предположить, что, рассматривая только два события из предложенных, мы тем самым удваиваем вероятность. Но мы должны быть внимательны. Расчет игнорирует возможность того, что оба события (например, «ж» и «и» из списка) могут произойти одновременно. Нам необходимо вычесть вероятность такого исхода из суммы двух вероятностей. Если события независимы, то вероятность их одновременного наступления равна произведению вероятностей, то есть 0,000001 × 0,000001 = 0,00000000001, относительно небольшое число. Тогда действительная вероятность составит 0,00000199999 – немного меньше, чем ожидалось. Это подводит нас к любопытному вопросу. Ответ на него может заставить по-другому посмотреть на мир совпадений. В мире всевозможных необычайно удивительных событий должны быть тысячи – если не миллионы или миллиарды – событий, которые могут произойти с вами в течение одного года. Давайте предположим, что вероятность каждого из миллиона таких событий будет, скажем, 0,000001. Тогда вопрос в следующем: что произойдет, если мы объединим все эти события и попробуем найти вероятность того, что хотя бы одно из них произойдет в течение года? Нет реального способа определить, насколько независимыми друг от друга будут события числом в миллион. Мы не можем предполагать, что ни у одной из возможных пар событий нет прямой связи. Мы не можем не принимать в расчет возможность того, что одно событие может быть причиной другого или влиять на него или что отдельное событие может зависеть от другого. Например, если вы один раз выиграли в лотерею и потратите часть выигрыша на повторные попытки, это окажет влияние на второй выигрыш, он будет зависеть от первого. Также мы не можем просто сложить вероятности, чтобы получить вероятность того, что произойдет одно событие из миллиона. Это привело бы нас к абсурдным расчетам, из которых следует, что вероятность одного события составит 1 000 000 × 0,000001 = 1, т. е. событие будет достоверным! (Мы бы складывали 0,000001 миллион раз.) Чтобы такие расчеты сработали, события должны быть изолированными, т. е. не иметь ничего общего. Если они имеют что-то общее, то любая серьезная оценка вероятностей становилась бы делом непомерно сложным, если не невозможным. К примеру, нам пришлось бы исключить вероятность того, что черная кошка, которая может пересечь вам путь в следующую среду, также найдет ваше давно потерянное кольцо в водосточной трубе и принесет его таинственному незнакомцу, который попытается продать его на гаражной распродаже. Но даже при выполнении всех этих требований нам все же придется учитывать огромное число пересекающихся возможностей, которые могли бы снизить те или иные шансы. С другой стороны, если бы все из миллиона событий были взаимоисключающими, то математика говорила бы нам, что мы можем быть уверены – одно из них произойдет. Конечно! Любой активный человек может встретиться с миллионом возможных событий. Просто выйдя из дома, человек встречает необозримое число возможностей.

Событие «д» – единственное в нашем списке имеет довольно точно определяемую вероятность, но даже оно зависит от личности победителя. Чтобы выиграть дважды, нужно сначала выиграть в первый раз. Это значит, в первый раз выбрать шесть правильных чисел. Вероятность того, что это произойдет один раз, близка к 0,000000038 – в самом деле, достаточно малое число. Иначе говоря, ваши шансы на выигрыш составляли бы 25 827 164 к 1.

Как это рассчитано? Есть 54 варианта выбора числа. Когда выбрано первое число, оно исключается, т. е. остается 53 возможных варианта для второго числа. Подобным образом для третьего есть 52 варианта, для четвертого – 51, для пятого – 50, для шестого – 49. Поэтому существует 54 × 53 × 52 × 51 × 50 = 18 595 558 800 различных способов выбрать шесть чисел, каждое от 1 до 54. Есть 1 × 2 × 3 × 4 × 5 × 6 = 720 различных способов расположения шести чисел. Поскольку порядок, в котором выбраны числа, значения не имеет, мы делим на 720 и получаем 25 827 165 – число различных возможных вариантов, только один из которых верен.

Вероятность выиграть во второй раз остается такой же; числа в лотерее не обладают способностью к запоминанию, равно как и вероятность. Вероятность, однако, зависит от того, как мы о ней думаем. Если вы забываете о том факте, что выиграли в первый раз, то вероятность не меняется. Ваши шансы составляют 25 827 164 к 1, а вероятность – 0,000000038. Вероятность выиграть во второй раз составляет 0,000000038 × 0,000000038 = 0,000000000000001444, что выглядит очень, очень маловероятно. Мы знаем, что ранее выигравшие числа из следующих лотерей не исключаются и никак на последние не влияют. Однако сам факт выигрыша странным образом такое влияние оказывает, а основано оно на личности победителя. Как преступники возвращаются на место преступления, так победители продолжают играть в лотерею. И делают это, имея полные карманы денег, покупая куда больше билетов, чем раньше. Таким образом, наши расчеты не учитывают всех прочих попыток сыграть в лотерею. Человек мог сыграть 100 раз, прежде чем случился второй выигрыш. В главе 7 (а именно в табл. 7.1) мы найдем шансы на выигрыш в лотерею 4 раза за 4 попытки, что является куда более сложным делом.

 

Глава 5

Дар Бернулли

 

Возможен ли математический закон, который откроет нам будущее? После того как пара игральных костей брошена, они «забывают» о том, где и как легли. Если кости «честные» и брошены без жульничества, нельзя заранее сказать, каков будет результат, и все же мы можем быть вполне уверены, что, если бросать кости достаточно долго, 7 будет появляться намного чаще, чем любое другое число. Дело в геометрии игральных костей и простых арифметических правилах: существует больше пар чисел от 1 до 6, в сумме дающих 7, чем любых других пар, которые можно получить в результате броска двух игральных костей.

Математика вероятности – относительно новая область знания. Она зародилась примерно в XVI в. До начала XVI в. математика не занималась неопределенными проблемами. Натурфилософы и математики больше интересовались познанием серьезных вещей, которые для одних могли быть абстрактными понятиями теории чисел и геометрии, для других – более практичными и полезными делами: например, геодезия или другие строительные технологии (в частности, строительство соборов). Само математическое понятие случайного было впервые описано в «Книге об азартных играх» (Liber de Ludo Aleae) Джероламо Кардано – сборнике работ, содержащих основы понимания природы случайности и того, что мы сейчас называем вероятностью; книга была написана около 1563 г. Но «Книга об азартных играх» оставалась неизданной еще сто лет.

Джероламо Кардано был миланским врачом, математиком и игроком. Наибольшую известность ему принесла его книга «Великое искусство» (Ars Magna), опубликованная в 1545 г. В ней изложено все, что было известно на тот момент о теории алгебраических уравнений. «Книга об азартных играх» – это 15 страниц бессвязных математических и философских заметок. Кардано не собирался ее публиковать. Но в книге мы находим полезные инструменты для изучения частотности совпадений. Она считается краеугольным камнем теории вероятности, расчетных величин, средних величин, таблиц распределения, свойств сложения вероятностей и различных способов вычисления k успешных испытаний из N – общего числа испытаний. В ней даже содержалось предположение о существовании математического закона, который позже станет известен как слабый закон больших чисел. В общих чертах закон говорит о том, что разность между наблюдаемой вероятностью (которая совершенно не известна до момента наступления событий) и математически вычисленным средним значением p может оказаться сколь угодно малой при условии, что число испытаний N достаточно велико.

В строгом выражении он выглядит как загадочная скороговорка: вероятность P, что средний коэффициент успешности испытаний отличается от p, сколь угодно близка к нулю, при условии что N может быть сколь угодно большим для выполнения данного условия. В современной записи, где ε представляет любое выбранное малое число, сходится к 1 по мере того, как растет N. Для тех читателей, которые подскочили, увидев этот набор символов, позвольте пояснить. Мы используем запись, разработанную для того, чтобы говорить о вероятности события, описанного в квадратных скобках. Например, P [на следующее 4 июля Центральный парк накроет ураган] обозначает вероятность того, что ураган накроет Центральный парк на следующее 4 июля. Таким образом, обозначает вероятность того, что разность между отношением k/N и p, взятая по модулю, будет меньше, чем любое выбранное малое число ε .

Это принцип, которому следуют средние величины в долгосрочной перспективе. Уместно спросить: как могут случайные события (без какой-либо памяти о каждом отдельном исходе) иметь среднее значение, настолько близкое к математически рассчитанной величине? К сожалению, этот замечательный истинный закон даже сегодня часто путают с тем, что некоторые называют законом средних чисел, который и не закон вовсе, а скорее, нелепое предположение, утверждающее, что если достаточно долго бросать монетку, то половина бросков придется на орла, а половина – на решку. Если только мы не примем «достаточно долго» за «неограниченно долго», то утверждение не так уж истинно.

Да, слабый закон больших чисел – действительно поразительная вещь. Но еще более удивительно то, что его можно доказать математически! Он показывает, что случайные события – события с широким диапазоном возможных исходов и без какой-либо памяти о каждом отдельном исходе – могут иметь эмпирическое среднее значение, близкое к математически рассчитанной величине. Математика может рассказать нам об определенных феноменах реального мира – строении мостов и плотин, которые подчиняются математическим законам. Летящий самолет и разбитое окно также следуют математическим законам. Стекло разбивается при определенных резонансных частотах; аэродинамический профиль крыла поднимает самолет, когда давление над крылом меньше давления под ним. Но, когда речь заходит о случайности, связи кажутся куда более загадочными. Игральные кости? Как можем мы знать, какая комбинация выпадет при следующем броске?

Кардано оставил после себя способ сделать это. До его «Книги об азартных играх» случай – счастливый или нет – был в руках Тихеи, Фортуны или других божеств, которые влияли на исход случайных событий в пользу того или иного исхода. Даже у греков, достигших удивительных высот во многих областях математики, не было математической теории азартных игр. Они просто бросали кости, полагая, что удача, случай или некое божество решали их судьбу. О, конечно же, они знали, что некоторые числа выпадали чаще других. Несомненно, знали, что 7 выпадает чаще любого другого числа. Все, что им нужно было сделать, – это сосчитать число вариантов выбросить 7 и сравнить с числом вариантов других комбинаций. Но, насколько мы можем судить, у них не было понятия о прогнозной вероятности.

Небольшая рукопись Кардано содержала первые крупицы знаний и ключи к науке о случайном. Мы узнали, что наблюдаемые факты помогают определить, что может случиться. Согласно Анри Пуанкаре, именно тогда мир узнал, что удача одного человека равна удаче любого другого и даже удаче богов.

Мы должны помнить о том, что во времена Кардано еще не существовало простого научного понятия случайности. Например, математики не задумывались о том, почему одни числа выпадают чаще других. Галилей разрешил эту загадку через полвека после смерти Кардано, когда написал небольшой трактат об игре в кости, хотя маловероятно, что Галилей знал о «Книге об азартных играх» Кардано. Он перечислил все комбинации и обнаружил, что для трех игральных костей существует 27 различных способов получить в сумме 10 или 11, но только 25 способов получить 9 или 12.

Конечно, опытным игрокам это и так известно. У них есть фундаментальное понимание игры, основанное на народной мудрости, накопленной веками практики и наблюдений. У них также есть интуитивное знание шансов выпадения комбинаций; так, для 3 игральных костей, как они хорошо знают, 10 и 11 встречаются гораздо чаще, чем любое другое число. Но существует разница между интуицией и математическим объяснением. С уверенностью, которую дает математика, можно практически рассчитывать на успех. Для тех, кто знает, как вычислить математический шанс, решения уже не выглядят столь рискованными. В конечном итоге это уже практически достоверность, несмотря на отдельные уколы неопределенности, вызываемые случайностями и совпадениями.

 

Две шестерки и рождение вероятности

Центральные понятия математической вероятности можно отследить уже в 1654 г. Зима в Париже была необыкновенно холодной. Даже Сена замерзла. Сообщалось, что парижане катались по реке на коньках, а на перекрестках горели костры, рядом с которыми священники раздавали беднякам хлеб. Экономика была задушена 30 годами религиозных войн в Европе, опустошившими французскую казну. Государство было вынуждено повысить налоги на рабочий класс, но бесчестные сборщики налогов мало что доносили до казны. На троне восседал Людовик XIV, а знать, освобожденная от налогообложения, накапливала ужасающе непомерные богатства. Не случайно праздные богачи открыто предавались азарту в игровых залах по всему Парижу. Как не случайно и то, что нарождающаяся математическая теория вероятностей появилась именно тогда, в ту самую зиму 1654 г.

Несмотря на то что азартные игры известны с начала времен или по крайней мере с тех пор, когда троглодиты стали катать кости по полу своих пещер, к середине XVII в. они стали основным видом развлечений во Франции. Серьезной математической теории случайного не существовало, кроме грубых попыток, которые мы находим в ошибочных математических работах и книге Фра Лука Пачоли «Сумма» (Summa), опубликованной в 1494 г., – учебнике, в основном посвященном алгебре. К 1654 г. рукопись Кардано «Книга об азартных играх» вышла в свет с некоторыми подсказками по поводу того, сколько раз нужно бросить пару игральных костей, чтобы иметь шансы на комбинацию из двух шестерок выше, чем один к одному.

Философ-математик Блез Паскаль прочел экземпляр «Книги об азартных играх» в поисках этого числа, но не поверил в приведенное решение. Он заболел и пролежал в постели весну и лето, ведя переписку со своим другом, юристом и математиком Пьером Ферма. Вместе они пришли к выводу, что шансы выбросить две шестерки немного меньше, чем 1 к 1, при 24 попытках и немного больше при 25.

Паскаль знал, что «глаза змеи» (две единицы) и «товарные вагоны» (две шестерки) появляются очень редко, поскольку шанс их выбросить – 1 к 36, тогда как шанс выбросить семерку – 1 к 6 (рис. 5.1). Он понял, что проще будет вычислить шанс не выбросить две шестерки, т. е. 1 – 1/36 или 35/36. Он также понял, что каждый бросок не зависит от предыдущего и что вероятность двух независимых событий – это произведение вероятностей каждого из событий, а тогда вероятность не выбросить две шестерки за n бросков – (35/36)n . Он вычислил, что (35/36)24 равняется 0,509, а (35/36)25 равняется 0,494, и пришел к выводу, что шанс получить две шестерки за 24 броска немного ниже, чем 1 к 1, и немного выше, чем 1 к 1, за 25 бросков.

Основы учения о вероятности пришли из задачи об игральных костях и ей подобных. Внешний слой вероятностного или стохастического мира можно проиллюстрировать одной картинкой. Давайте поразмыслим о мире следующим образом: если на событие влияет некая причина, то шансы, что эта причина придаст направление возможному будущему событию, выше, чем один к одному. Если на событие не влияет никакая причина, то возможное будущее развитие события может пойти в том или ином направлении без предрасположенности к какому-либо конкретному исходу. Есть ли причина, нет ли ее – шансы выше, чем один к одному, оставляют открытой дверь для случайности или совпадения. На рис. 5.2 мы показываем это с помощью так называемой доски Гальтона в качестве модели.

Доска Гальтона моделирует события, определяемые объективной случайностью. На набор стержней бросают шарик таким образом, что шарик ударяется точно о середину верхней части стержня, при этом шансы, что шарик отскочит влево или вправо – точно 1 к 1. Если шарик отскакивает вправо, то он опускается на стержень, находящийся ниже, и либо снова ударяется точно о середину верхней его части, либо отклоняется в одну или другую сторону. В теории шарик может удариться точно о середину верхней части стержня. На практике, однако, этого никогда не происходит. Почему? Сначала мы должны задуматься: что значит «верхняя часть стержня»? Значит ли это верхнюю молекулу стали (если предположить, что стержни сделаны из стали)? Но ее не существует. Тогда на практике есть причины того, что шарик отклоняется в одну или другую сторону. Возможно, это малейший поток воздуха, через который должен пройти шарик, или малейшие колебания, проходящие через опоры стержней, или мельчайшая частичка пыли, оказавшаяся в месте соударения шарика и стержня. На практике есть сотни переменных, определяющих, в какую сторону отскочит шарик после столкновения со стержнем. Кроме того, следует учитывать микроскопические вмятины и упругость соударения.

Сэр Фрэнсис Гальтон, английский генетик, живший в XIX в., построил такую доску со штырями, расположенными в шахматном порядке – как точки на грани игральных костей с числом 5. Гальтон хотел показать, что физические явления движутся с попутным ветром случайности. В идеальной доске Гальтона, т. е. в такой, где шарик всегда попадает ровно в центр верхней части стержней, шарик отклоняется вправо или влево так, как если бы для выбора направления кто-то подбрасывал монетку. В реальности же бабочка, взмахнувшая крыльями над Тихим океаном, или корова, пукнувшая на кукурузном поле в Айдахо, могут определять этот выбор. Перед каждым соударением результат предыдущего – это забытое прошлое; шарик уже не помнит предыдущего исхода, а потому ведет себя так, как если бы ударился о первый стержень. И все же совокупный результат, похоже, учитывает историю всех предыдущих.

Давайте рассмотрим это с точки зрения математики. Предположим, что шарик ударяется о четыре ряда стержней на пути вниз. Шанс того, что шарик пойдет после каждого удара вправо или влево, – 1 к 1, в результате чего шарики формируют под стержнями кривую в форме колокола. Подсчет числа вариантов падения шариков это доказывает. Предположим, что ход снижения брошенного шарика записывается буквами L и R, означающими отскок влево и вправо соответственно. Тогда у нас будут следующие возможные исходы:

Вариантов с разными буквами больше, чем только с одной буквой, и, поскольку шансы того, что шарик пойдет влево или вправо, равны, есть тенденция к тому, что шарики будут чаще падать в сторону центра под верхним стержнем. Причина в том, что в результате серий, скажем 12 выборов L и R (как показано на рис. 5.3), существует больше серий с шестью L и шестью R, чем любого другого числа L и R.

В результате каждого столкновения со стержнями считаем падение шарика влево как –1, а вправо – как +1. После столкновения с 12 рядами стержней шарик оказывается в одной из 12 ячеек в нижней части доски.

Так, например, шарик в крайней левой ячейке на рис. 5.3 получает совокупное значение –12. Конечное положение каждого шарика представляет отдельное совокупное значение. Шарики демонстрируют тенденцию к тому, чтобы отклоняться в центр. Однако, хотя достаточно много шариков падают в два центральных слота, большее их число оказывается в остальных слотах.

На рис. 5.3 набор шариков представляет конечное совокупное значение 140 испытаний: 31 шарик упал в пять слотов слева, 55 – в пять слотов справа и 54 – в два средних слота. Верно, что конечное положение каждого отдельного шарика ничего не говорит об истории его путешествия. Почти 60 % шариков упали вне двух центральных слотов. В общем, шарик, упавший на несколько рядов вниз и находящийся слева, может закончить свой путь справа, но так же верно и то, что, чем дальше он отклоняется влево, тем меньше у него шансов вернуться вправо.

Сегодня теория вероятностей развивается в двух направлениях: эмпирическом и абстрактном. Например, эмпирическим подходом будет использовать большие выборки, чтобы оценить вероятность, тогда как абстрактным подходом – задействовать научный принцип, чтобы зафиксировать вероятность через известные факты, такие как аргумент симметрии или физическая теория. Нам известна вероятность того, что идеальные игральные кости выпадут на 1 в силу кубической геометрии самих костей. Но вероятность выпадения 1 на обычных игральных костях может быть найдена посредством большого числа испытаний и записи числа испытаний, когда выпадает 1; эта вероятность может оказаться немного больше или меньше 1/6 – все-таки это реальные несовершенные кости.

Многое зависит от самой кости. Кости, которые входят в наборы для настольных игр, выполнены довольно грубо. Ятзи – игра в кости, появившаяся в 1950-е гг. В игре используется 5 кубиков. Если при броске все 5 костей дают одно и то же число, такая комбинация называется ятзи. Шансы выбросить ятзи – 1295 к 1. Вы могли бы решить: чтобы выбросить такую комбинацию, потребуется 1296 попыток. Но если достаточно большое число людей по всему миру уделят игре хотя бы немного времени, то такая комбинация может запросто выпасть с первой попытки. Именно так думал Брэди Харан, когда попросил сотни подписчиков своего сайта попробовать выбросить ятзи и записать бросок на видео. Как вы могли догадаться, некоторые выбросили ятзи после нескольких первых попыток, а многим это удалось после нескольких сотен бросков.

В XVIII в., чтобы найти вероятность события, вы бы просто посчитали отдельные случаи: вы взяли бы отношение числа желаемых исходов к числу всех возможных случаев. «Честные» кости могут выпасть одной из возможных сторон, поэтому вероятность p того, что кость выпадает конкретной стороной, – 1/6. Но Бернулли задал вопрос иначе. Он хотел его расширить, чтобы включить проблемы, касающиеся болезней и погоды, с надеждой охватить другие научные вопросы.

 

Теорема Бернулли

Математиков часто приводит в восхищение величие и красота абстрактного принципа. Их увлекает красота, возникающая, когда теорию можно изящно применить к природному миру. Швейцарский математик Якоб Бернулли торжествовал, когда ему удалось доказать слабый закон больших чисел после знакомства с «Книгой об азартных играх» Кардано. Этот закон поистине удивителен, ведь он говорит нам, что, пусть природа и непредсказуема и содержит неизмеримое число компонентов и переменных, у нас все же имеются поразительно искусные способы измерить ее тайны. Он дает нам удивительную возможность разобраться с неопределенностью.

Когда Якоб Бернулли умер в 1705 г., он оставил кипы неоконченных и неопубликованных рукописей своему племяннику Николаю Бернулли. В течение следующих восьми лет Николай разбирался в бумагах своего дяди и наконец опубликовал «Искусство предположений» (Ars Conjectandi) – революционную работу, за которой и сейчас признается новаторство в области описания важнейших понятий теории относительности. В посмертно опубликованной книге в 1713 г. применен уникальный подход, реализованный в виде примера, где говорится об урне, наполненной черными и белыми жетонами, а нам необходимо найти соотношение черных и белых, даже если мы не знаем, что в урне содержится 3000 белых жетонов и 2000 черных. Надо понимать, что существует математическая вероятность, представленная в виде отношения числа белых жетонов к числу черных жетонов. Но числа эти нам неизвестны. Как в таком случае узнать математическую вероятность? Вот план Бернулли: вы вслепую выбираете один жетон, записываете его цвет, кладете его обратно и трясете урну. Если вы повторите это действие, вслепую выбирая жетоны один за другим достаточно долгое время, то по мере увеличения числа попыток становитесь все ближе в этой таинственной математической вероятности. Предположим, например, что после 200 слепых выборок вы записали: 120 белых и 80 черных. Тогда отношение числа белых к черным составит 3 к 2. Далее, вы можете предположить, что вероятность выбрать белый – 120/200, или 3/5.

«Искусство предположений» Бернулли дает нам слабый закон больших чисел. Если подбросить правильную монету N раз в надежде, что орел выпадет k раз, теорема говорит о вероятности того, насколько близко будет отношение k/N к 1/2, математической вероятности того, что орел выпадет за одну попытку. Некоторые игроки, выдавая желаемое за действительное, полагают, будто это означает, что для больших значений N исходы событий приблизятся к вероятностям этих исходов. Таким образом, если опять использовать бросание монеты в качестве примера, заблуждающийся игрок полагает, что, поскольку p = 1/2, общее число исходов орел сойдется к общему числу исходов решка в долгосрочной перспективе. Теорема говорит только о том, что существует возможность сходимости общего результата к достоверности в долгосрочной перспективе. Нет никаких гарантий того, что это произойдет в любом из отдельных случаев. В качестве примера давайте предположим, что у нас есть игра, состоящая из N повторяющихся событий, таких как бросание монеты N раз, и мы считаем число раз, когда выпадает орел. Математическая вероятность того, что правильная монета выпадает орлом, – 1/2. Что мы увидим, подбрасывая монету в реальной жизни? Будет ли коэффициент успешности испытаний близок к 1/2, скажем, настолько близок, что будет в пределах 1/10 000? На самом деле ответа мы дать не можем, но мы можем выразиться иначе и спросить: будет ли вероятность того, что разность k/N и 1/2 меньше, чем 1/10 000, когда-нибудь больше, чем, скажем, 0,999. Теорема Бернулли говорит, что да, такое случится, если N продолжит увеличиваться со временем. Но она не исключает полностью случаев, когда разность между k/N и 1/2 больше, чем 1/10 000, даже для больших значений N. На деле, даже если коэффициент успешности испытаний k/N приближается к 1/2, нет гарантии, что он продолжит это делать. Кроме того, оказывается, что немного усиленная версия теоремы Бернулли говорит нам: хотя коэффициент успешности испытаний k/N, очевидно, сходится к 1/2, реальные значения успешности демонстрируют склонность ко все более своенравному поведению. Рассмотрим следующее удивительное утверждение: вероятность расхождения реального числа успешных испытаний с ожидаемым числом k/2 успешных испытаний (т. е. выпадения орлов) становится все больше и больше по мере увеличения числа испытаний. Хотя это утверждение и противоречит нашей интуиции, но оно верно. Однако оно также говорит, что в долгосрочной перспективе разность между действительным средним, которое мы получаем эмпирически после испытаний (и совершенно нам не известное до момента завершения этих испытаний), и математически вычисленным средним может быть сколь угодно малой при условии, что число испытаний N достаточно велико. Это означает, что случайные эмпирические события (не имеющие совершенно никакой памяти о каждом из исходов) имеют среднее, близкое к математически вычисленному числу!

Бернулли был так доволен своей теоремой, что предполагал ее применение к наиболее важным событиям всего сущего. В своем «Искусстве предположений» он написал:

Этот замечательный результат показывает нам, что, если бы наблюдение всех событий продолжилось вечно (и вероятность обратилась бы в совершенную достоверность), тогда мы бы наблюдали, как все явления случаются с постоянными коэффициентами и неизменной цикличностью. Таким образом, даже за наиболее случайными и удачными нам надо будет признать определенную квазинеобходимость и, так сказать, фатальность. Я не знаю, захотел бы Платон включить этот результат в догмат о всеобщем возвращении вещей в их предыдущие положения [ апокастасис ], в котором он предсказывал, что по прошествии бесчисленного множества веков все вернется в свое исходное положение {49} .

В теории теорема Бернулли должна была стать интеллектуальной бомбой, чудом математической оценки неопределенности. Она сулила предсказание будущего. Здесь мы впервые встречаем математический закон, который дал нам замечательный и простой способ понять, как ведет себя случайность в реальном мире; теорему, которую Бернулли с гордостью называл строгой, оригинальной и такой блистательной, что она придала значимость всем разделам его работы. Но Бернулли был разочарован некоторыми из своих экспериментов, которые относились к задачам, связанным с болезнями и погодой. Он честолюбиво задал для себя предельно высокий критерий достоверности даже по сегодняшним стандартам.

Бернулли дал нам огромные возможности для оценки неопределенного поведения природы, а также азартных игр – метод расчета математического ожидания без какой-либо априорной информации. «В самом деле, если заменить урну, к примеру, на воздух или человеческое тело, содержащие в себе возбудителя [fomitem] различных изменений в погоде или болезней, как урна содержит жетоны, мы сможем ровно таким же образом определить посредством наблюдения, насколько проще может произойти то или иное событие в этих объектах».

Когда Эйнштейн остроумно заметил: «Бог не играет в кости с Вселенной», – он говорил о возникшей тогда квантовой механике, которая не могла достоверно предсказывать исходы рассматриваемых ею явлений. Фортуна никогда не согласится с тем, что результат броска игральных костей на самом деле неслучаен, как лотерейная комиссия никогда не признает, что шарики для пинг-понга с выигрышными номерами выпадают неслучайно. Никто еще не предложил машину, дающую совершенно случайные числа. «Брошенные кости, – пишет физик Роберт Оэртер, – по сути своей не случайны; исход только кажется случайным из-за нашего невежества относительно маленьких деталей, скрытых переменных (например, угла пуска или трения), которые определяют исход броска». У большинства феноменов в нашей Вселенной (в особенности тех, которыми движут атомные силы) слишком много этих скрытых переменных, чтобы математика могла предсказывать исходы. Мы, как правило, не осведомлены о подробностях таких чудес. И все же у нас есть этот удивительный дар, который был тайной вплоть до XVII в., – дар, дающий ключ к пониманию случайности, а также средства к предсказанию будущего: знание о том, что большинство явлений неквантового механического мира подчиняются слабому закону больших чисел, пусть каждое явление в отдельности и не обладает памятью о собственном прошлом. Играет Бог в кости или нет – долгосрочные тенденции ожиданий предсказуемы и почти всегда достоверны.

Доказательство Бернулли опирается на число возможных комбинаций предметов, и их расчет не имеет ничего общего со случайными поворотами фортуны. Эдит Дадли Силла, известная переводчица «Искусства предположений», говорит, что Бернулли объяснял связь посредством теологии. Она писала: «Он уверяет, что в сознании или воле Бога есть четкие и определенные ситуации, известные Богу вечно, и со временем проявляющие себя в опыте или наблюдении». Говоря о «вечности», она имеет в виду то, что Бернулли игнорировал фактор времени в расчетах коэффициентов успешности случайных событий. Силла указывает на следующий довод Бернулли: «Нет существенной разницы между тем, чтобы выбросить желаемым образом одну игральную кость в течение некоторого времени, и тем, чтобы бросить сразу такое число игральных костей, которое равнялось бы числу сделанных бросков одной кости».

 

Математическое ожидание

Ожидание, измеряемое математическим ожиданием (мы дадим определение ниже), – это упряжь, которой взнузданы тайны неопределенности. Вместе со стандартным отклонением, которое измеряет объем того, что выпадает из ожидания, оно дает нам возможность рассмотреть стохастический (случайный) мир. Две эти величины – математическое ожидание и стандартное отклонение – колеса и винтики статистики частотного распределения, показывающей насколько приближаются данные к некоему центральному значению. Чудесным образом с помощью этих величин и простой алгебры у нас есть если не прямое управление, то по крайней мере теоретическое измерение феноменологической вероятности посредством слабого закона больших чисел. В физическом мире каждый бросок игральных костей и каждое падение шарика для пинг-понга определяется большим количеством изменчивых сил и обстоятельств, которые едва ли возможно измерить (скорость, траектория, воздушные потоки, гироскопический эффект, момент инерции, столкновения и т. д.), все же определимые в идеальном мире математики.

В 1657 г. голландский математик и астроном Христиан Гюйгенс опубликовал работу «О расчетах в азартных играх» (De Ratiociniis in Aleae Ludo), которая еще полвека оставалась главным учебником по теории вероятностей. Это первая из напечатанных работ, указывающая на отличие между числом успешных исходов и возможным числом успешных исходов:

Хотя исходы игр, которые определяются исключительно жребием, неопределенны, меру того, насколько человек ближе к выигрышу, чем к проигрышу, всегда можно установить. Таким образом, если человек ручается выбросить шестерку с первой попытки, нам на самом деле неизвестно, сможет ли он это сделать, но то, насколько более вероятен для него проигрыш, чем выигрыш, – вещь, вполне определенная и поддающаяся вычислению {58} .

Гюйгенс дает пример азартной игры, где для участия необходимо платить. Человек прячет три монеты в одной руке, семь – в другой; вы выбираете руку и забираете спрятанные в ней монеты. Чтобы продолжать игру, вы должны платить. Но вот в чем вопрос: сколько вам следует платить за игру? Первое утверждение Гюйгенса дает нам ответ: «Если я могу ожидать либо события a, либо b и любое может выпасть мне с одинаковой легкостью, то можно сказать, что мое ожидание будет равняться (a + b)/2». Ответ – 5, иначе говоря, ожидаемая выгода (сумма, которую вы ожидаете получить взамен), или среднее 3 и 7. Совсем не очевидно, что Гюйгенс понимал, какую поразительную силу будет иметь эта идея для будущего анализа рисков, азартных игр и собственно науки. Но он точно понимал, что ядро теории вероятностей – это просто математическое ожидание. Для математика середины XVII в. было бы совершенно преждевременно узнать истину: что все случайные процессы в природе, включая аннуитет, страхование, метеорологию и медицину, а также азартные игры, можно в той или иной мере предсказывать с помощью вычисления математического ожидания. Вообще математическое ожидание можно вычислить, умножив вероятность на размер выплаты. В большинстве случаев это средневзвешенное значение всех возможных величин, которые могут возникать; в качестве весов берутся вероятности. Это сумма всех возможных значений, после того как каждое значение умножено на вероятность его возникновения. В этом есть смысл; в конце концов вы ожидали бы получить 50 центов с доллара, если бы бросали монетку и ставили бы каждый раз по доллару на орла.

Например, возьмем лотерею Texas Lotto. В табл. 5.1 показаны результаты совпадения 3, 4, 5 и 6 чисел. Чтобы получить математическое ожидание от игры, перемножим вероятность и размер выплаты по каждому возможному совпадению и сложим все возможные совпадения.

Если мы предположим, что джекпот равняется, скажем, $2 млн, тогда математическое ожидание составляет 0,000000038 ($2 000 000) + 0,00001115 ($2000) + 0,000654878 ($50) + 0,013157894 ($3) = $0,171517582. Другими словами, реальная стоимость каждого играющего билета – всего 17 центов.

На том раннем этапе истории теории вероятностей люди использовали математическое ожидание как меру риска, не зная, что оно окажется самым естественным показателем центра распределения – склонности данных группироваться вокруг некоего центрального значения, как показано на рис. 5.3.

 

Глава 6

Длинная серия орлов

Согласно данным Всемирной организации здравоохранения, доля рождения мальчиков к общей рождаемости по всему миру составляет 0,515. Если рассмотреть данные по конкретным регионам или странам, то шансы далеки от равных. В Мексике доля новорожденных мальчиков очень низкая, тогда как в США и Канаде их доля выше 0,5. Однако для всего населения Земли – а оно уже больше 7 млрд – шансы рождения мальчиков по отношению к девочкам почти равны. Причина проста: у человеческого сперматозоида равное число X и Y хромосом, и у каждой из них равные шансы в момент зачатия. Это бросок правильной монеты.

После того как мы подбросили правильную монету 7 млрд раз, мы можем ожидать, что в половине из бросков выпадет орел. Но можем ли мы ожидать серию из миллиона орлов последовательно? Машина для бросания монеты показывает нам, что, несмотря на случайность траектории движения монеты, ее можно заставить выпадать орлом в 100 % случаев.

Вероятность падения правильной монеты орлом вверх – 1/2. Благодаря математике мы знаем, что по мере увеличения числа бросков монеты отношение орлов к решкам постепенно приближается к 1. Эвристическая оценка нарушает смысл последнего предложения, превращая его в утверждение того, что длинная серия решек неким образом окажется сбалансирована серией орлов. Легко стать жертвой ошибочного впечатления, что если одна из сторон очень долго не выпадала, то шансы ее появления увеличиваются с каждым ходом, хотя мы знаем, что теоретически каждый раз, когда брошена монета, шансы за и против каждого из исходов совершенно одинаковы – монета может с равным успехом выпасть «орлом» или решкой. Дело в том, что люди путают исходы событий и частотность.

Длинные серии орлов могут иметь место. Я наблюдал очень длинные серии орлов. На интуитивном уровне нам может казаться странным, что происходит нечто подобное. Предположим, что вы бросаете монету 10 раз и орел выпадает 7 раз. Пропорция орлов к решкам тогда составит 7 к 3. Бытовые представления подсказывают нам, что в ходе следующих десяти бросков решка должна выпасть больше шести раз, чтобы сбалансировать превысившее ожидания число ранее выпавших орлов. Но у монеты нет памяти о том, что с ней произошло ранее, есть только история результатов, записанная наблюдателем. Ничто не мешает монетке выпасть орлом в ходе следующих 500 бросков, однако, если это произойдет, мы сильно удивимся.

На рис. 6.1 представлен сгенерированный компьютером совокупный результат 500 бросков монеты (+1 для каждого орла, – 1 для каждой решки). Горизонтальная линия обозначает 0. Орел и решка перехватывают лидерство друг у друга. Это как гонка двух лошадей с равными шансами. Этого вполне можно ожидать. Суждение, основанное на бытовых представлениях, говорит в пользу того, что график должен был бы прыгать около нулевой линии. Однако чаще всего такие графики подолгу остаются с одной стороны от нуля.

Абсолютная случайность как теория и та же абсолютная случайность в реальном, физическом мире – не одно и то же. Пронумерованные шарики для пинг-понга, которые кружатся в акриловой сфере, а потом вылетают по специальной трубке, движутся вовсе не случайным образом, но для стороннего наблюдателя они определенно выдают случайные числа. Бросок монеты, который определяет, кто начинает матч в американском футболе, весьма далек от того, чтобы быть случайным. На самом деле результат броска монеты – вопрос элементарной физики. Уже созданы машины, которые могут бросать монету сколь угодно долго – тысячу раз, миллион – и всегда выпадает орел.

Недавние эксперименты показывают, что монеты, даже правильные монеты, склонны выпадать той же стороной, с которой начинается бросок, а исход броска зависит от угла между нормалью к плоскости монеты и вектора углового момента. Другими словами, полет монеты определяется начальными условиями. Диаконис, Холмс и Монтгомери построили машину, которая подбрасывает монеты посредством пружинно-храпового механизма. С этой машиной любая монета, движение которой начинается из положения «орел», всегда (в 100 % случаев) выпадает орлом вверх. Так что результат броска монеты определяется физикой, а не случайностью. Рука того, кто бросает, и множество переменных внешней среды вызывают разнообразные исходы, которые кажутся случайными.

Но мы можем обмануться иллюзией того, что монета крутится, в то время как на самом деле она просто прецессирует в воздухе, как медленно вращающийся гироскоп. Ориентация монеты в полете определяется вектором ее углового момента, который может быть всегда направлен вверх. Итак, монета, которая начинает движение из положения «орел», может всегда выпадать орлом, поскольку следует определенной траектории, хотя кажется, что орел и решка крутятся.

Когда речь идет о бросании монеты в реальных условиях, а исходы событий определяются малейшим воздействием от землетрясений, происходящих в тысяче километров от нас, или надоедливой бабочкой-смутьянкой над Тихим океаном, все иначе. Но иначе не значит объяснимо или постижимо. Падение монеты очень даже может быть случайным, но наше человеческое представление о случайности часто не в ладах с нашим же предчувствием относительно случайных исходов. Поскольку у монеты нет памяти о предыдущих исходах, нам не следовало бы удивляться, если она выпадет решкой 100 раз подряд, но мы все же удивляемся.

На рис. 6.2 мы увидим странную историю. Исходы вполне следуют ожиданиям вплоть до 45-го броска, когда решка вдруг перехватывает инициативу примерно на 105 следующих бросков! Затем идет достаточно долгий период, когда лидирует орел, и совокупное значение опять приближается к 0. Но около 286 броска решка опять надолго вырывается вперед. Не то чтобы события не согласовывались с нашими интуитивными ожиданиями. Действительное отношение орлов к решкам наверняка приблизится к 1 в ходе значительно более долгого времени, но в краткосрочной перспективе этого не происходит. За 500 бросков решка выпала только на 12 раз больше, чем орел. Это достаточно мало, но последовательности орлов и решек могут расходиться значительно сильнее в совокупных результатах. Например, рассмотрим следующее испытание, показанное на рис. 6.3.

Орел полностью контролирует ситуацию. Совокупный исход показывает, что орел ведет настолько уверенно на протяжении всей серии бросков, что кажется, будто решка никогда уже не вырвется вперед.

Результаты компьютерной модели 1 млн бросков разобраны в табл. 6.1. Отношение k/N, где k – число успешных исходов, а N – число испытаний, называют эмпирической частотой успешности испытаний. В правой колонке в табл. 6.1 приведены абсолютные значения разности между эмпирической частотой успешности испытаний и 1/2 – математически предсказанной частотой успешности испытаний.

Слабый закон больших чисел не исключает, что какие-то маловероятные события будут происходить часто на раннем этапе игры или на более поздних. На самом деле, даже если коэффициент успешности приближается к математически предсказанному, нет гарантии, что он таким и останется. Чуть более сильный математический результат говорит нам, что, хотя коэффициент успешности может сходиться к теоретически вычисленному, действительные значения коэффициента склонны к довольно странному поведению по мере увеличения числа испытаний. Контринтуитивно, но это так.

Слабый закон больших чисел, примененный к любому событию, вероятность которого равна p, говорит нам, что вероятность приближается к 1 по мере увеличения N. Возьмем ԑ = 0,0001 (выбрано произвольно) с p = 1/2 для ситуации с бросанием монеты и спросим, насколько возможно, что  Обратите внимание (табл. 6.1), что имеет резкие перепады при низких значениях N. Но они, очевидно, есть также и при высоких значениях. От 100 000 до 200 000 оно увеличивается. Даже с 800 000 до 900 000 оно увеличивается, пока не падает на миллионе. Создается обманчивое впечатление, что разность между орлом и решкой приближается к нулю. Но ничего не говорится о волатильности этого приближения при увеличении числа испытаний. Как мы видим, волатильность увеличивается по мере увеличения числа бросков монеты.

Итак, что же здесь происходит? Похоже, что у более высокого N есть некоторая свобода от закона больших чисел, поскольку в масштабах больших чисел больше места для незаметных ошибок.

Для 5000 бросков были 2561 орел и 2439 решек с разностью 122. Это дает ошибку в 2,4 %, что не так уж плохо. Но, если не знать распределение этих орлов, может случиться так, что 122 орла были выброшены последовательно. Придерживаясь этой точки зрения, представьте, что 758 решек выброшены последовательно за 67 500 бросков или 694 орла выброшены последовательно за 82 500 бросков. Другими словами, нет математического закона, который исключает возможность последовательного выпадения огромного числа орлов при большом N.

 

Глава 7

Треугольник Паскаля

 

В физическом мире не существует совершенной симметрии, искусственных машин с бесконечно малым допуском или идеальных моделей. Это мир множества скрытых переменных, явления которого слишком трудно охватить точной мерой. Иными словами, подлинные случайности действительно происходят, и мы часто обращаемся к вероятностным картинам событий, чтобы понять сложный феномен случайности.

Что если бы у вас обнаружили миелодиспластический синдром – редкую форму рака, при котором костный мозг не вырабатывает достаточно красных кровяных телец? Вы столкнулись бы с дилеммой: согласиться на трансплантацию костного мозга с 70 % вероятностью успеха или не делать ничего и с 70 % вероятностью умереть в течение следующих 10 лет. Конечно, у трансплантации имеются свои риски. Помимо необходимости химиотерапии и риска инфекции будет еще 30 % вероятность смерти в течение следующих 6 месяцев.

Брайан Зикмунд-Фишер, который преподает теорию рисков и теорию вероятностей в Медицинской школе Мичиганского университета, столкнулся с такой дилеммой в 1998 г. Ему диагностировали миелодиспластический синдром и сказали, что без лечения он проживет всего 10 лет, а с лечением у него будет 70 %-ная вероятность жить нормальной жизнью. Он сделал ставку на трансплантацию. Смысл в том, что шансы ничего не говорят об отдельном человеке. Вероятность в 70 % получена посредством сбора статистических данных о сотнях (возможно, тысячах) людей, которые столкнулись с той же дилеммой, – государственная, нелокальная статистика. Статистические группировки описывают тенденции и возможности, а не отдельные случаи, когда можно выиграть или проиграть.

Возьмем некое событие, которое вы могли бы счесть редким. Его математические шансы могут быть один к миллиону, но, вероятно, такие цифры связаны с тем, что событие оценивается как локальный феномен. В качестве примера можно взять белку, которую ударило молнией в тот момент, когда она пересекала дорогу. Когда мы говорим на этом знакомом языке шансов, то часто выражаемся фигурально, без какого-либо последовательного метода определения терминов. Итак, «один на миллион» обычно применяется к событию, которое, как мы думаем, происходит в довольно широких пределах Соединенных Штатов. Но США – большая страна. Это нетрудно увидеть, пролетев над маленькими домиками, маленькими деревьями и обширными зелеными полями. Мы не думаем ни о том, сколько там внизу белок, ни о том, сколько из них пересекают дорогу в отдельный момент времени. Ученые оценивают численность белок в США в 1,12 млрд, что в 3 раза больше населения страны. И белки постоянно пересекают дороги.

Учитывая 1,12 млрд белок, 6,5 млн км дорог и 9,5 млн км2 площади США, вполне возможно, что каждую минуту 300 белок пересекают дороги. Во время грозы это число может быть даже больше. В среднем в Соединенных Штатах случается 110 000 гроз в год. Летом гроз гораздо больше, чем зимой, что делает возможность поражения белки ударом молнии летом действительно очень большой.

Каждое явление в природе вызывается большим числом неопределенных возможностей. Когда бросают игральную кость, то результат сильно зависит от ее начального положения в руке бросающего и значительно слабее – от звуковых волн, создаваемых голосами присутствующих в комнате. Это лишь два внешних фактора, направляющих кость к положению, в котором она остановится.

То, как она ударяется об стол, точность ее балансировки, ее движение по руке, упругость соударения со столом – все это повлияет на то, какая из сторон будет направлена вверх, когда кость остановится.

Рассмотрим игру, в которой возможен только выигрыш или проигрыш, а вничью сыграть невозможно. Пусть X обозначает исход испытания, а P (X) – вероятность наступления этого исхода. Если бы вы, например, бросали монету, P (орел) равнялось бы 1/2, как и P (решка). В колесе для американской рулетки 38 ячеек, включая 0 и 00: 18 красных; 18 черных; 0 и 00 – зеленые. Если вы ставите на красное, P (красное) равняется 18/38 или, если упростить, 9/19, а P (не красное) равняется 10/19. Если бы вы бросали игральную кость, надеясь выбросить «очко» (1), то P (1) равняется 1/6.

Выберите любую подобную игру и спросите себя: какова вероятность выиграть 0, 1, 2, 3 или 4 раза? Вполне уместный вопрос, поскольку реальные азартные игры предполагают совокупные последовательности выигрышей или проигрышей. Вспомним о Джоан Гинтер, о том, как она 4 раза выиграла в лотерею. Вам также могут быть интересны шансы сыграть лучше, чем если бы вы остались при своих, или по крайней мере шансы не проиграть больше 2 из 4 ставок.

Обозначим последовательностями из букв W и L серии выигрышей или проигрышей. Четырехкратный проигрыш будет обозначен через LLLL, а четырехкратный выигрыш – через WWWW. Есть лишь один способ выиграть все 4 раза и только один – не выиграть ни разу. А если выиграть 1 раз из 4? Есть 4 способа выиграть 1 раз из 4, а именно: WLLL, LWLL, LLWL и LLLW. И, конечно, способов проиграть только 1 раз из 4 также 4. Как насчет 2 выигрышей за 4 тура? Двухкратный выигрыш будет представлен 6 вариантами: WWLL, WLWL, WLLW, LWWL, LWLW и LLWW. При независимых событиях, где исход первого события не имеет памяти о других (например, туры при игре в рулетку или игра в орлянку), вероятности одного или другого из 2 событий – это произведение вероятностей каждого из них. Исходя из того, о чем мы говорили в главе 4, если A и B – это возможные исходы, вероятность наступления и A, и B – это произведение P (A) P (B), а вероятность наступления A или B – P (A) + P (B) – P (A) × P (B).

Теперь давайте возьмем случай с 2 выигрышами. Чтобы упростить запись, примем, что p означает P (W), а q – P (L). Вероятность 1 отдельного выигрыша – p, и, поскольку выигрыш и проигрыш в разных турах – события независимые (т. е. каждый тур не зависит от предыдущего), мы видим, что вероятность 2 выигрышей в 4 турах – это p²q². Так происходит потому, что вам необходимо 2 раза выиграть и 2 раза проиграть, а когда логической связкой является «и», вероятности перемножают. Но, как мы выяснили, это может произойти 6 различными способами: WWLL, WLWL, WLLW, LWWL, LWLW и LLWW.

Поскольку логической связкой является «или», вероятность наступления любого из этих событий будет: ppqq + pqpq + pqqp + qppq + qpqp + qqpp, или просто 6p²q².

Рассмотрим четыре разные игры. В первой игре мы играем в рулетку и ставим на красное. Во второй мы подбрасываем монетку и ставим на выпадение орла. В третьей мы подбрасываем две игральные кости и выигрываем, если в сумме выпало 7, а во всех остальных случаях проигрываем. Наконец, в последней игре мы покупаем билет Texas Lotto и рассматриваем как выигрыш только джекпот. В таблице 7.1 приведены вероятности выиграть в каждой из этих игр (первый столбец). Мы также можем сыграть несколько раз. Допустим, мы играем четыре раза – тогда можем выиграть ноль, один, два, три или четыре раза. Вероятности соответствующих событий также приведены в таблице 7.1.

В теории и для рулетки, и для орлянки в соответствии с табл. 7.1 наиболее вероятен выигрыш в 2 турах из 4. Мы могли бы составить таблицу вероятностей для 100 туров рулетки и орлянки, однако это было бы ужасно долгим и непрактичным занятием. Вместо этого позвольте сказать только то, что в 100 турах орлянки игрок, ставящий на орла, с наибольшей вероятностью выиграет 50 раз, а в 100 турах рулетки, делая ставку на «красное», игрок с наибольшей вероятностью выиграет (как будет показано) только 37 раз. Священный Грааль игрока – знать, какие именно 37 раз.

Отметим симметричность, присущую рулетке и орлянке, асимметричность костей и предельную асимметричность лотерей. Как насчет строки для рулетки в табл. 7.1? На гистограмме, изображающей число туров, когда выпадает «красное», против вероятности наступления этого количества туров, где выигрывает «красное» (см. рис. 7.1A), около числа 2 есть некоторая асимметрия, а центр притяжения (геометрическая точка равновесия), видимо, немного меньше 2. Когда число туров увеличивается до 8, отклонение становится еще более явным (см. рис. 7.1B).

Увеличение числа туров в рулетке приводит к сглаживанию графика. Для 100 туров у нас будет 101 прямоугольник с основанием в одно деление.

На рис. 7.2 изображено то, что называется частотным распределением. Высота прямоугольника над каждым из чисел означает то, как часто ожидается наступление отдельных событий. Столбцы распределяются по горизонтальной оси таким образом, что общая сумма их площадей равняется 1. Другими словами, площадь графика составляет 100 % всех возможных событий. Большая часть распределения частот концентрируется между 32 и 62, самый высокий столбец – 47. Меньше 32 и больше 62 вероятности настолько малы, что на графике их не видно. Например, P (31) = 0,00034, а P (63) = 0,0006. Весьма маловероятно, что «красное» выпадет 20 или 80 раз, однако, как все совпадения, не исключено.

В случае орлянки, где p равняется q, симметрия идеальна. Но p не обязательно равняется q. Мы обнаруживаем все более выраженную асимметрию по мере того, как увеличивается разрыв между p и q. В табл. 7.1 мы видим идеальную симметрию в 5-й колонке слева и почти никакой симметрии в 7-й колонке. И все же все вычисления основываются на 3-й колонке и производятся с помощью так называемого треугольника Паскаля – ключе к хранилищу инструментов теории вероятностей.

Треугольник Паскаля – это числа, расположенные в виде треугольника следующим образом:

Каждое число на рис. 7.3 – это сумма двух чисел, расположенных точно над ним в линии сверху: например, 3-е число (10) в 5-й линии сверху – это сумма 4 и 6 на 4-й линии. Сперва отметим симметричность, а затем обратим внимание на то, что числа те же, что мы видели, когда раскладывали по степеням сумму двух переменных p и q. Мы находим те же числа, когда раскладывали по степеням (p + q) n. Например, при n = 2 (p + q)² = (p + q) (p + q) = p (p + q) + q (p + q) = p² + pq + qp + q² = p² + 2p¹q¹ + q².

Если мы возведем в степень n = 1, 2, 3, 4, 5, 6…, получим следующую матрицу в форме треугольника:

Для любого n константы в разложении двучленов (p + q)n  – это как раз числа из треугольника Паскаля.

История этого треугольника начинается задолго до Блеза Паскаля. Он в 1527 г. появился в работах китайского алгебраиста XIII в. Чу Шикей, позже – на титульном листе «Учебника по арифметике» Петера Апиана (который можно увидеть на картине «Послы» [1533 г.] работы Ганса Гольбейна-младшего), больше чем за век до того, как Паскаль исследовал треугольник, названный его именем. В современном Иране треугольник известен как треугольник Хайяма, в честь известного персидского поэта и математика Омара Хайяма, который использовал треугольник в XII в., чтобы создать метод нахождения корней n-х степеней. В современном Китае он называется треугольником Ян Хуэя, в честь другого математика, который описал его в XIII в. В Италии это треугольник Тарталья, в честь математика Никколо Тарталья, жившего за век до Паскаля. Однако Паскаль, собрав уже известные наработки о треугольнике, использовал их в теории вероятностей.

 

Распределение вероятностей

На рис. 7.2 показана вероятность выигрыша при ставке на «красное» в 100 турах рулетки. Мы уже видели, какую форму принимает график, когда рассматривали примеры вычислений в табл. 7.1 и коэффициенты, получаемые в результате разложения двучленов (p + q)n . Распределение столбцов на графике справедливо называют биномиальным распределением. Слово «биномиальное» происходит от конструкции, основанной на двух мономах p и q. По мере увеличения n график выравнивается и принимает форму колокола. Чем больше n, тем плавнее кривая.

Выберем некоторое большое значение n. Мы изменим гистограмму, сохранив без изменений ее площадь, а следовательно, и вероятность. Поскольку основание каждого столбца имеет ширину в одно деление, распределение вероятностей представлено в виде площадей прямоугольников, а также их высотами. Некоторые разумные изменения – сдвиг, сжатие и растяжение – дают нам новый график, который сохраняет всю полезную информацию оригинала. Конечно, теперь, в измененном графике, вертикальная ось уже не обозначает вероятность. Вероятность заключена в площадях прямоугольников, а эти площади не изменялись, потому что мы растянули график по вертикали и сжали по горизонтали в одной пропорции.

Чего мы достигли? Вот оно – чудо, вдохновенная идея. Кривую (гистограмма биномиального распределения, показанная на рис. 7.2), которая изображает вероятность выигрыша при ставке на «красное» в 100 турах рулетки, можно близко аппроксимировать к одной определенной математической кривой. Тут важно понимать, что одна эта кривая описывает великое множество природных феноменов, являющихся результатами случайностей. Поразительно, но эта кривая моделирует события рулетки, хотя и не имеет очевидной связи с шариками, падающими в красные ячейки колеса рулетки. Еще более удивительно, что та же кривая моделирует также и орлянку. Всего одна кривая описывает вероятности столь различных явлений. Чтобы получить информацию о вероятности конкретного явления, нам нужно ввести некоторые данные в модель. Мы должны предоставить два числа – среднее (среднее значение) и стандартное отклонение (мера разброса от среднего). Два этих числа дают информацию для модели, скажем, о рулетке, а именно: вероятность наступления события p (шарик падает в красную ячейку) – 9/19. Как только у нас есть эти конкретные p и N (число сыгранных туров рулетки), мы можем вычислить стандартное отклонение для нашей конкретной игры – ставки на «красное» в рулетке. Это мера того, насколько велик разброс исходов от среднего, или стандартное отклонение от среднего, чаще называемое просто стандартным отклонением.

Итак, каждая кривая биномиального распределения трансформируется с помощью математического трюка (посредством сдвигов и масштабирования) в особую могущественную кривую нормального распределения, график которой изображен на рис. 7.4.

Числа в основании кривой на рис. 7.4 – это стандартные отклонения от среднего. Мы объединили испытания в группы по стандартному отклонению. Отдельные вероятности исходов событий теперь не видны. Переменная X под кривой на рис. 7.4 показывает отклонение числа эмпирических успешных исходов от наиболее вероятного их числа. Иными словами, X, переменная горизонтальной оси, измеряется в стандартных отклонениях. Высота кривой – это уже не вероятность, поскольку мы ее масштабировали и сжали, сохранив площадь под кривой. Но в обмен на это масштабирование и сжатие мы получаем некоторые ценные сведения. Первое: около 68 % площади под кривой лежат на одном стандартном отклонении от среднего и около 95 % площади – на двух стандартных отклонениях от среднего. Второе: одно стандартное отклонение отмечено точками перегиба, т. е. точками на кривой, где кривая меняет форму с вогнутой на выпуклую.