На интуитивном уровне понимание теории вероятности довольно-таки просто. Возьмем кубик с 6 гранями, подбросим и посмотрим какая грань выпала. Интуитивно ясно, что вероятность выпадения 1 грани из 6 будет 1/6. Действительно, вероятностью называют отношение числа равновероятных событий к числу всех возможных вариантов:
Какова вероятность что выпадут 2 цифры подряд? Она равна произведению вероятностей: (1/6) * (1/6) = 1/36.
Вроде все просто, однако несмотря на простоту, есть довольно-таки много задач, где математика не всегда совпадает с бытовым «здравым смыслом». Рассмотрим несколько таких парадоксов.
Дети мистера Смита
Эту задачу описывал Мартин Гарднер. Известно что у мистера Смита двое детей, и один из них мальчик. Какова вероятность, что второй из них тоже мальчик? Интуитивно кажется, что вероятность пола ребенка всегда равна 1/2, но не все так просто.
Рассмотрим возможные варианты семей с двумя детьми:
‐ мальчик-мальчик
‐ мальчик-девочка
‐ девочка-мальчик
‐ девочка-девочка
Исходя из списка вариантов, ответ понятен. Вариант «девочка-девочка» по условию не подходит. Всего остается 3 варианта семей где есть мальчик (М + М, М + Д, Д + М), значит вероятность что второй ребенок окажется мальчиком, равна 1/3.
Бросание кубика
Вернемся к бросанию кубика. Допустим, мы бросили кубик 5 раз, и все разы выпала цифра «3». Какова вероятность, что мы бросим кубик еще раз, и выпадет снова цифра «3»?
Ответ прост. Интуитивно кажется, что вероятность такого события очень мала. Но в реальности кубик не имеет какой-либо встроенной «памяти» на предыдущие события. Какие бы числа не выпадали до текущего момента, вероятность нового числа также равна 1/6 (а вот если говорить о вероятности выпадения такой серии «в целом», то она действительно равна 1/(6 * 6 * 6 * 6 * 6 * 6) = 1/46656.
Кстати, такая вероятность это много или мало? Интуитивно кажется что мало, и в принципе оно так и есть. Одному человеку пришлось бы бросать кубик каждые 10 секунд 4 дня, чтобы дождаться выпадения 6 цифр подряд. Однако если рассматривать большие числа, то такие вероятности становятся неожиданно большими. Например, если 6 раз кубик бросят все 5 миллионов жителей Петербурга, то 6 цифр подряд выпадут примерно у 100 человек — довольно-таки значительное количество. Это на самом деле важный момент: даже довольно-таки маловероятные события гарантированно произойдут, если речь идет о большом числе попыток. Это важно при прогнозировании таких событий как ДТП, аварии, катастрофы, и прочие негативные явления, которые в большом городе увы, не редкость. По этой же причине редкие заболевания эффективнее лечить в большом городе — редкая болезнь, встречающаяся 1 раз на 100000 человек, может практически не встречаться в небольшом городе и у врачей не будет опыта борьбы с ней, а в мегаполисе таких больных наберется в несколько раз больше.
Парадокс Монти Холла
Этот известный парадокс хорошо описан в Википедии.
Представьте, что вы стали участником игры, в которой вам нужно выбрать одну из трёх дверей. За одной из дверей находится автомобиль, за двумя другими дверями — козы. Вы выбираете одну из дверей, например, номер 1, после этого ведущий, который знает, где находится автомобиль, открывает одну из оставшихся дверей, за которой находится коза. После этого он спрашивает вас, не желаете ли вы изменить свой выбор. Увеличатся ли ваши шансы выиграть автомобиль, если вы примете предложение ведущего и измените свой выбор?
Интуитивно кажется, что если автомобиль спрятан за одной из дверей, то вероятность его найти равна 1/3, и смена двери ничего не даст. Однако это неверно.
Принцип прост: если игрок изначально правильно указал дверь с автомобилем (а вероятность этого действительно ⅓), то замена двери приведет его к проигрышу.
Однако в обеих других случаях изначального выбора неверной двери (а вероятность этого ⅔) смена двери приведет к выигрышу. Таким образом, смена двери приведет к выигрышу с вероятностью ⅔ вместо ⅓.
Парадокс дней рождений
Допустим, в организации работает 24 человека. Какова вероятность что хотя бы двое отмечают день рождения в один и тот же день? Интуитивно кажется, что эта вероятность весьма мала и будет равна 24/365, но и в этом случае интуиция ошибается. В реальности, мы должны рассматривать количество пар, которые могут образовать данные люди. Это число довольно-таки велико, например, если обозначить 5 человек как ABCDE, то количество возможных пар будет 10 (AB, AC, AD, AE, BC, BD, BE, CD, CE, DE), а для группы из 24 человек возможно 276 пар.
Для точного расчета воспользуемся принципом произведения вероятностей. Вероятность того, что для 2х людей день рождения не совпадет, равна 364/365. Для 3х человек вероятность что все дни не совпадут, равна произведению 364/365 * 363/365, и так далее. Для n-человек формула приведена в Википедии:
(n! — обозначение факториала, n! = 1 * 2* .. * (n - 1) * n)
Нужная нам вероятность обратного события равна обратной величине:
Вывести все значения несложно с помощью программы на Python:
import math
def C(n):
return 1000 – 1000 * math.factorial(365) / (math.factorial(365 – n) * 365**n)
for n in range(3, 50):
print("{} - {}%").format(n, 0.1 * C(n))
365! это очень большое число, поэтому здесь использованы целочисленные вычисления языка Python, уже затем значение было переведено в проценты.
В результате получаем следующую таблицу:
3 | 0.0082 | 4 | 0.0163 | 5 | 0.0271 |
6 | 0.0404 | 7 | 0.0562 | 8 | 0.0743 |
9 | 0.0946 | 10 | 0.1169 | 11 | 0.1411 |
12 | 0.1670 | 13 | 0.1944 | 14 | 0.2231 |
15 | 0.2529 | 16 | 0.2836 | 17 | 0.3150 |
18 | 0.3469 | 19 | 0.3791 | 20 | 0.4114 |
21 | 0.4436 | 22 | 0.4756 | 23 | 0.5072 |
24 | 0.5383 | 25 | 0.5686 | 26 | 0.5982 |
27 | 0.6268 | 28 | 0.6544 | 29 | 0.6809 |
30 | 0.7063 | 31 | 0.7304 | 32 | 0.7533 |
33 | 0.7749 | 34 | 0.7953 | 35 | 0.8143 |
36 | 0.8321 | 37 | 0.8487 | 38 | 0.8640 |
39 | 0.8782 | 40 | 0.8912 | 41 | 0.9031 |
42 | 0.9140 | 43 | 0.9239 | 44 | 0.9328 |
45 | 0.9409 | 46 | 0.9482 | 47 | 0.9547 |
48 | 0.9605 | 49 | 0.9657 | 50 | 0.9703 |
Как видно из таблицы, уже при количестве сотрудников 50 человек, хотя бы 1 день рождения почти гарантированно совпадет (вероятность 97%), а для 24 человек получаем вероятность равную 0.538, т. е. более 50%.