Рассказы о математике с примерами на языках Python и C

Елисеев Дмитрий

12. Парадоксы теории вероятности

 

 

На интуитивном уровне понимание теории вероятности довольно-таки просто. Возьмем кубик с 6 гранями, подбросим и посмотрим какая грань выпала. Интуитивно ясно, что вероятность выпадения 1 грани из 6 будет 1/6. Действительно, вероятностью называют отношение числа равновероятных событий к числу всех возможных вариантов:

Какова вероятность что выпадут 2 цифры подряд? Она равна произведению вероятностей: (1/6) * (1/6) = 1/36.

Вроде все просто, однако несмотря на простоту, есть довольно-таки много задач, где математика не всегда совпадает с бытовым «здравым смыслом». Рассмотрим несколько таких парадоксов.

 

Дети мистера Смита

Эту задачу описывал Мартин Гарднер. Известно что у мистера Смита двое детей, и один из них мальчик. Какова вероятность, что второй из них тоже мальчик? Интуитивно кажется, что вероятность пола ребенка всегда равна 1/2, но не все так просто.

Рассмотрим возможные варианты семей с двумя детьми:

‐ мальчик-мальчик

‐ мальчик-девочка

‐ девочка-мальчик

‐ девочка-девочка

Исходя из списка вариантов, ответ понятен. Вариант «девочка-девочка» по условию не подходит. Всего остается 3 варианта семей где есть мальчик (М + М, М + Д, Д + М), значит вероятность что второй ребенок окажется мальчиком, равна 1/3.

 

Бросание кубика

Вернемся к бросанию кубика. Допустим, мы бросили кубик 5 раз, и все разы выпала цифра «3». Какова вероятность, что мы бросим кубик еще раз, и выпадет снова цифра «3»?

Ответ прост. Интуитивно кажется, что вероятность такого события очень мала. Но в реальности кубик не имеет какой-либо встроенной «памяти» на предыдущие события. Какие бы числа не выпадали до текущего момента, вероятность нового числа также равна 1/6 (а вот если говорить о вероятности выпадения такой серии «в целом», то она действительно равна 1/(6 * 6 * 6 * 6 * 6 * 6) = 1/46656.

Кстати, такая вероятность это много или мало? Интуитивно кажется что мало, и в принципе оно так и есть. Одному человеку пришлось бы бросать кубик каждые 10 секунд 4 дня, чтобы дождаться выпадения 6 цифр подряд. Однако если рассматривать большие числа, то такие вероятности становятся неожиданно большими. Например, если 6 раз кубик бросят все 5 миллионов жителей Петербурга, то 6 цифр подряд выпадут примерно у 100 человек — довольно-таки значительное количество. Это на самом деле важный момент: даже довольно-таки маловероятные события гарантированно произойдут, если речь идет о большом числе попыток. Это важно при прогнозировании таких событий как ДТП, аварии, катастрофы, и прочие негативные явления, которые в большом городе увы, не редкость. По этой же причине редкие заболевания эффективнее лечить в большом городе — редкая болезнь, встречающаяся 1 раз на 100000 человек, может практически не встречаться в небольшом городе и у врачей не будет опыта борьбы с ней, а в мегаполисе таких больных наберется в несколько раз больше.

 

Парадокс Монти Холла

Этот известный парадокс хорошо описан в Википедии.

Представьте, что вы стали участником игры, в которой вам нужно выбрать одну из трёх дверей. За одной из дверей находится автомобиль, за двумя другими дверями — козы. Вы выбираете одну из дверей, например, номер 1, после этого ведущий, который знает, где находится автомобиль, открывает одну из оставшихся дверей, за которой находится коза. После этого он спрашивает вас, не желаете ли вы изменить свой выбор. Увеличатся ли ваши шансы выиграть автомобиль, если вы примете предложение ведущего и измените свой выбор?

Интуитивно кажется, что если автомобиль спрятан за одной из дверей, то вероятность его найти равна 1/3, и смена двери ничего не даст. Однако это неверно.

Принцип прост: если игрок изначально правильно указал дверь с автомобилем (а вероятность этого действительно ⅓), то замена двери приведет его к проигрышу.

Однако в обеих других случаях изначального выбора неверной двери (а вероятность этого ⅔) смена двери приведет к выигрышу. Таким образом, смена двери приведет к выигрышу с вероятностью ⅔ вместо ⅓.

 

Парадокс дней рождений

Допустим, в организации работает 24 человека. Какова вероятность что хотя бы двое отмечают день рождения в один и тот же день? Интуитивно кажется, что эта вероятность весьма мала и будет равна 24/365, но и в этом случае интуиция ошибается. В реальности, мы должны рассматривать количество пар, которые могут образовать данные люди. Это число довольно-таки велико, например, если обозначить 5 человек как ABCDE, то количество возможных пар будет 10 (AB, AC, AD, AE, BC, BD, BE, CD, CE, DE), а для группы из 24 человек возможно 276 пар.

Для точного расчета воспользуемся принципом произведения вероятностей. Вероятность того, что для 2х людей день рождения не совпадет, равна 364/365. Для 3х человек вероятность что все дни не совпадут, равна произведению 364/365 * 363/365, и так далее. Для n-человек формула приведена в Википедии:

(n! — обозначение факториала, n! = 1 * 2* .. * (n - 1) * n)

Нужная нам вероятность обратного события равна обратной величине:

Вывести все значения несложно с помощью программы на Python:

import math

def C(n):

    return 1000 – 1000 * math.factorial(365) / (math.factorial(365 – n) * 365**n)

for n in range(3, 50):

    print("{} - {}%").format(n, 0.1 * C(n))

365! это очень большое число, поэтому здесь использованы целочисленные вычисления языка Python, уже затем значение было переведено в проценты.

В результате получаем следующую таблицу:

3 0.0082 4 0.0163 5 0.0271
6 0.0404 7 0.0562 8 0.0743
9 0.0946 10 0.1169 11 0.1411
12 0.1670 13 0.1944 14 0.2231
15 0.2529 16 0.2836 17 0.3150
18 0.3469 19 0.3791 20 0.4114
21 0.4436 22 0.4756 23 0.5072
24 0.5383 25 0.5686 26 0.5982
27 0.6268 28 0.6544 29 0.6809
30 0.7063 31 0.7304 32 0.7533
33 0.7749 34 0.7953 35 0.8143
36 0.8321 37 0.8487 38 0.8640
39 0.8782 40 0.8912 41 0.9031
42 0.9140 43 0.9239 44 0.9328
45 0.9409 46 0.9482 47 0.9547
48 0.9605 49 0.9657 50 0.9703

Как видно из таблицы, уже при количестве сотрудников 50 человек, хотя бы 1 день рождения почти гарантированно совпадет (вероятность 97%), а для 24 человек получаем вероятность равную 0.538, т. е. более 50%.