Укрощение бесконечности. История математики от первых чисел до теории хаоса

Стюарт Иэн

Глава 18. Насколько это вероятно?

 

 

Рациональный подход к случайности

В XX и начале ХХI в. математика развивалась взрывными темпами. За последние 100 лет в ней было сделано больше открытий, чем за всю предыдущую историю человечества. Даже для краткого их перечисления потребуются тысячи страниц, так что придется выбирать лишь некоторые примеры из обилия доступных сведений.

Одна из самых юных областей математики – теория вероятностей, изучающая возможности появления случайных событий. Это математика неопределенности. Первые робкие шаги делались на протяжении долгих веков: это и попытки вычислить с помощью комбинаторики шансы выигрыша в азартных играх, и методы повышения точности астрономических наблюдений, несмотря на ошибки наблюдателей, но только к началу XX в. теория вероятностей приобрела статус самостоятельной науки.

 

Вероятность и статистика

В настоящее время теория вероятностей – обширнейшая область математики, и ее прикладная ветвь, статистика, оказывает важное влияние на повседневную жизнь – возможно, более значительное, чем любой из прочих основных разделов математики. Статистика стала одним из главных аналитических методов даже в медицине. Ни одно лекарственное средство не допускается на рынок и ни один метод лечения не разрешается в больнице, пока клинические испытания не докажут их полную безопасность и эффективность. Здесь безопасность относительна: лечение может быть предложено больным, страдающим от смертельно опасного недуга, когда шансы на успех слишком малы, но не в менее тяжелых случаях.

Также теория вероятностей чаще всех прочих областей математики страдает от неверного толкования и искажений. Но ее точное и разумное применение приносит человечеству неоценимую пользу.

 

Игра случая

Некоторые вопросы из теории вероятностей уходят корнями в Античность. Из Средних веков до нас дошли записи дискуссий о шансе выбросить различные числа на двух игральных костях. Чтобы лучше представить себе, как это работает, начнем с одной кости. Предположим, она не доработана – что очень трудно доказать – и на ней шесть чисел: 1, 2, 3, 4, 5 и 6, которые выпадают одинаково часто в конечном счете при длительной игре. В короткой игре такое равноправие невозможно: первый бросок, например, даст в результате только одно из чисел. Даже после шести бросков вы, скорее всего, не получите по одному разу каждое из чисел. Но в длинных сериях бросков, или попыток, мы вправе ожидать появления каждого числа примерно в каждом шестом броске, т. е. вероятность равна 1/6. Если этого не происходит, то у кости, вероятно, смещен центр тяжести.

Событие с вероятностью 1 достоверно, а с вероятностью 0 – невозможно. Все вероятности лежат между 0 и 1, и вероятность события обозначает долю в числе попыток, с которой происходит данное событие.

Вернемся к вопросу из Средних веков. Предположим, мы одновременно бросаем два кубика (как во многих играх – от костей до «Монополии»). Какова вероятность того, что сумма очков на них равна 5? По результатам вычислений с огромным числом аргументов и даже нескольких экспериментов получено число 1/9. Почему? Предположим, мы взяли две кости, красную и синюю. На каждой из них может независимо выпасть шесть разных чисел, итого получаем 36 возможных пар, и все с одинаковой вероятностью. Сочетания (красная + синяя), дающие 5, – 1 + 4, 2 + 3, 3 + 2, 4 + 1; это отдельные случаи, поскольку синяя кость выдает разные числа при каждом броске, как и красная. Значит, при большом количестве бросков мы ожидаем получить сумму, равную 5, в четырех случаях из 36: вероятность равна 4/36 = 1/9.

Другая давняя практическая проблема – как поделить ставки в азартной игре, если она по какой-то причине прервалась. Алгебраисты Возрождения Пачоли, Кардано и Тарталья оставили записи по этому вопросу. Позже шевалье де Мере задал тот же вопрос Паскалю, и тот обменялся с Ферма несколькими письмами на эту тему.

Из этих ранних работ следовал неявный вывод, какова вероятность и как ее подсчитать. Но всё это выглядело неопределенно и неубедительно.

 

Сочетания

Рабочее определение вероятности некоего события – относительное число случаев, в которых оно происходит. Если речь о кости, у которой может одинаково часто выпасть любая из шести граней, вероятность выпадения каждой грани равна 1/6. Более ранние работы по вероятности основаны на подсчете количества вариантов появления каждого события и делении его на общее число возможностей.

Главной проблемой здесь были сочетания. Скажем, если взять колоду из шести карт, сколько в ней будет разных подмножеств по четыре карты? Один из способов – перечислить все эти подмножества: если у нас карты с достоинством 1–6, получится:

т. е. их всего 15. Но такой метод слишком громоздкий для большего количества карт, и здесь нужно нечто более систематическое.

Представим, что мы выбираем по одному элементу из подмножества. Первый можно выбрать шестью способами, второй только пятью (один использован), третий – четырьмя, четвертый – тремя. Общее число выборов в этом порядке равно 6 × 5 × 4 × 3 = 360. Но каждое подмножество сосчитано здесь 24 раза: начав с 1234, далее мы найдем 1243, 2134 и т. д. и получим 24 способа (4 × 3 × 2) переставить четыре объекта. Значит, точный ответ будет 360/24, т. е. 15. Этот аргумент показывает, что количество способов выбрать m объектов из общего числа n объектов равно:

Это выражение называется биномиальным коэффициентом, потому что появляется и в алгебре. Если мы преобразуем его в таблицу, чтобы n-я строка содержала биномиальные коэффициенты

то результат будет выглядеть так.

В шестой (счет начинается с нуля) строке мы увидим числа 1, 6, 15, 20, 15, 6, 1.

Сравним с формулой

(x + 1)6 = x6 + 6x5 + 15x4 + 20x3 + 15x2 + 6x + 1,

и мы видим, что те же числа появляются как коэффициенты. Это не совпадение.

Треугольник чисел назван треугольником Паскаля, потому что обсуждался Паскалем в 1655 г. Однако известен он был гораздо раньше: первое упоминание в древнеиндийском шастре «Чандас шастра» датируется примерно 950 г. Также его знали персидские математики Аль-Караджи и Омар Хайям (в современном Иране его называют треугольником Хайяма).

Треугольник Паскаля

 

Теория вероятностей

Биномиальные коэффициенты с большим успехом были использованы в первой книге по теории вероятностей – труде под названием «Искусство предположений», написанном Якобом Бернулли в 1713 г. В книге автор поясняет столь необычное название.

Мы определяем искусство предположений, или стохастическое искусство, как искусство точной оценки вероятностей, чтобы в наших суждениях и действиях мы всегда опирались на то, что признано лучшим, наиболее приемлемым, наиболее определенным или рекомендуемым; это единственная основа для мудрости философа и благоразумия государственного мужа.

Возможно, правильнее было бы назвать эту книгу «Искусство догадок».

Бернулли принимал как данность, что чем больше количество испытаний, тем лучше можно будет оценить вероятность.

Предположим, без вашего ведома в урну поместили 3000 белых камней и 2000 черных. Пытаясь определить количество этих камней, вы вынимаете один камень за другим (каждый раз возвращая его обратно) и обращаете внимание, как часто попадаются белый и черный камни. Насколько часто вам придется так делать: 10 раз, или 100 раз, или 1000 раз и т. д., что более вероятно, ‹…› чтобы [в итоге] выбранные белые и черные камни находились в том же соотношении 3:2, что и в урне?

Здесь Бернулли не только задал один из основных вопросов, но и изобрел стандартный иллюстративный пример – камни в урне. Он явно был уверен, что пропорция 3:2 будет разумным результатом, но понимал, что в реальности эксперименты могут лишь приблизиться к ней. Однако он был уверен еще и в том, что при достаточном количестве попыток эта аппроксимация будет всё точнее и точнее.

Тут была своя трудность, надолго затормозившая развитие этой науки. В подобных экспериментах всегда есть определенная возможность, что по чистой случайности все вынутые из урны камни окажутся белыми. Нет достаточно надежной гарантии, что пропорция будет всегда стремиться к 3/2. В лучшем случае мы можем утверждать, что с очень высокой вероятностью числа будут приближаться к этому значению. Но тогда возникает риск круговой логики: мы используем пропорции, полученные в опытах, чтобы оценить вероятности, но также используем вероятности, чтобы получить этот вывод. Как мы видим, что вероятность вытащить только белые камни крайне мала? Если мы добиваемся этого в большем числе испытаний, то должны учесть и возможность того, что результат по какой-то причине окажется ошибочным. Единственным выходом из этого тупика кажется проведение еще большего числа испытаний, чтобы показать, как низка вероятность такого результата. В итоге мы попадаем в состояние, слишком напоминающее бесконечное движение по кругу.

К счастью, первые исследователи теории вероятностей не позволили этому логическому препятствию себя остановить. Как и в случае с исчислением, они знали, чего хотят и как этого добиться. Философские суждения были для них менее важны, чем поиск ответов на вопросы.

Книга Бернулли содержала много важных идей и результатов. Один из них, закон больших чисел, показывает нам, в каком именно смысле долгосрочные наблюдения за пропорциями в испытаниях соответствуют вероятностям. Главным образом он доказывает следующее: вероятность того, что пропорция не будет близка к правильной вероятности, стремится к нулю при неограниченном росте количества испытаний.

ЧТО ТЕОРИЯ ВЕРОЯТНОСТЕЙ ДАЛА ИМ

В 1710 г. Джон Арбетнот представил в Королевское общество Великобритании статью, в которой с помощью теории вероятностей доказывал существование Бога. Он проанализировал ежегодное число крещений младенцев мужского и женского пола в 1629–1710 гг. и обнаружил, что мальчиков было немногим больше, чем девочек. Более того, эта разница оставалась практически неизменной каждый год. Этот факт был уже тогда хорошо известен, но Арбетнот вычислил вероятность того, что пропорция постоянна. Его результат получился очень маленьким: 2 −82 . Он указал, что если такой эффект наблюдается во всех странах, во все времена и у всех народов, то шанс был бы еще меньше. Из чего он сделал вывод, что всё происходит не по случайности, а благодаря божественному провидению.

А в 1872 г. Фрэнсис Гальтон использовал теорию вероятностей для оценки действенности молитв исходя из того, что огромное число людей каждый день возносят молитвы о здоровье королевской семьи. Он собрал данные по «средней продолжительности жизни мужчин из различных сословий, проживших более 30 лет, от 1758 до 1843 г.», добавив, что «исключил смерти от несчастного случая». В его выборку вошли аристократы, королевская семья, духовенство, адвокаты, врачи, дворяне, купцы, офицеры армии и флота, деятели науки, литературы и искусства. Он обнаружил, что «властители буквально самые коротко живущие из всех состоятельных слоев общества. Таким образом, молитвы совершенно бесполезны, если только не прибегнуть к весьма спорной гипотезе, будто условия жизни королевской семьи настолько фатальны, что отчасти, хотя и не полностью, могут нейтрализовать эффект народных молитв».

Другая базовая теорема может быть рассмотрена для случая повторных бросков бракованной (смещенной) монеты с вероятностью p для выпадения орла и q = 1 – p для выпадения решки. Если монету бросить дважды, какова будет вероятность того, что орел выпадет 2, 1 или 0 раз? Ответ Бернулли был p2, 2pq и q2. Таковы результаты при разложении выражения (p + q)2 в p2 + 2pq + q2. А если монету бросить три раза, вероятность того, что орел выпадет 3, 2, 1 или 0 раз, равна последовательности множителей в выражении (p + q)3 = p3 + 3p2q + 3q2p + q3.

В более общем виде, если монету бросить n раз, вероятность выпадения орла m раз будет равна:

т. е. соответствующему члену в разложении (p + q)n.

В 1730–1738 гг. Абрахам де Муавр продолжил опыты Бернулли со смещенной монетой. Когда m и n достаточно велики, трудно точно вычислить биномиальный коэффициент, и де Муавр вывел приблизительную формулу, соответствующую биномиальному распределению Бернулли, которое сейчас мы называем функцией ошибок или нормальным распределением:

Де Муавр заслуженно считается первым математиком, явно показавшим эту связь. Это стало краеугольным камнем в развитии как теории вероятностей, так и статистики.

 

Определение вероятности

Основной проблемой теории вероятностей оставалось определение вероятности. Даже самые простые задачи – на которые все знают ответ – были чреваты логическими затруднениями. Если мы бросаем монету, то в длительном периоде ожидаем равного числа выпадений орлов и решек, и вероятность для каждого варианта равна 1/2.

Естественно, для такой вероятности монета должна быть «честной». Поврежденная может всё время выпадать орлом. Но что значит «честной»? Прежде всего, что орел и решка равновозможны. Но само выражение «равновозможны» подразумевает вероятность. Логика кажется круговой. Чтобы вычислить вероятность, нужно знать, что она собой представляет.

Чтобы выйти из этого тупика, придется вернуться к Евклиду, вдохновившему алгебраистов XIX и XX вв. Аксиомы. Хватит тревожиться о том, что такое вероятность. Запишите свойства, которыми, по вашему мнению, она должна обладать, и представьте их в виде аксиом. А потом выводите из них всё остальное.

Тогда возникает вопрос: что такое правильные аксиомы? Когда вероятность определяется по конечному множеству событий, ответить на него несложно. Однако применение теории вероятностей часто относится к потенциально бесконечному множеству возможностей. Скажем, если вы измерите угол между двумя звездами, то он будет равен некоему действительному числу между 0 и 180°. Но там бесконечно много действительных чисел. Если вы метаете дротик в доску долгое время с равным шансом попасть в любую точку на ней, то вероятность попасть в конкретную область будет равна площади этой области, деленной на общую площадь доски. Но на доске для дротиков имеется бесконечно много точек, а значит, бесконечно много областей.

Эти трудности рождали все виды проблем и парадоксов. И наконец их удалось решить новой идеей анализа – понятием меры.

Специалисты по математическому анализу, работавшие над теорией интегралов, сочли необходимым пойти дальше Ньютона и дать определение еще более сложным понятиям: что представляет собой интегрируемая функция и каков ее интеграл. После ряда попыток многих предшественников Анри Лебегу удалось определить самый общий тип интеграла, сейчас известный как интеграл Лебега, со многими приятными и полезными аналитическими свойствами.

Ключом к его определению стала мера Лебега, которая представляет собой способ применить концепцию длины к весьма сложным подмножествам вещественной прямой. Предположим, множество состоит из непересекающихся интервалов с длинами 1, 1/2, 1/4, 1/8 и т. д. Эти числа образуют сходящийся ряд с суммой 2. Здесь Лебег утверждал, что это множество имеет меру 2. В его идее обнаруживается элемент новизны: она была счетно-аддитивной. Если вы сложите бесконечный набор непересекающихся множеств и если он счетен в канторовском смысле, с кардинальным числом א0, мера всего множества равна сумме бесконечного ряда, образованного мерами отдельных множеств.

Во многих смыслах идея меры оказалась важнее, чем интеграл, к которому она привела. В частности, вероятность и есть та же мера. На данное свойство указал в 1930-х гг. Андрей Колмогоров, составивший аксиомы для вероятностей. Точнее, он определил вероятностное пространство. В него включено множество X, набор B подмножеств X, именуемых случайными событиями, и мера m для B. Аксиомы утверждают, что m – мера и что m(X) = 1 (т. е. вероятность того, что что-то случится, всегда равна 1). Набор B также должен обладать теоретико-множественными свойствами, чтобы поддерживать понятие меры.

В случае с костями множество X состоит из чисел 1−6, а множество B содержит все подмножества X. Мерой любого множества Y в составе B будет количество элементов Y, деленное на 6. Эта мера согласуется с интуитивной идеей, что любая грань кости имеет вероятность выпадения 1/6. Однако использование меры требует от нас учитывать не только число граней, но и сами множества граней. С таким множеством Y связана вероятность того, что выпадет одна из граней множества Y. Интуитивно это будет размер Y, деленный на 6.

Благодаря этой простой идее Колмогоров положил конец спорам, в том числе вековым, и создал строгую теорию вероятностей.

 

Статистические данные

Главным приложением и ответвлением теории вероятностей стала статистика, использующая вероятности для анализа данных реального мира. Она выросла из астрономии XVIII в., когда возникла необходимость учитывать ошибки наблюдений. Эмпирически и теоретически они распределены согласно функции ошибок, или нормальному распределению. Кривая этой функции формой напоминает колокол и часто называется колоколом Гаусса (колоколообразной кривой). Здесь величина ошибки откладывается по горизонтальной оси с нулевым значением посередине, а вершина кривой представляет вероятность ошибки соответствующей величины. Мелкие ошибки гораздо вероятней, серьезные случаются гораздо реже.

Колоколообразная кривая

В 1835 г. Адольф Кетле выступил с предложением использовать колоколообразную кривую для моделирования социальных данных: рождений, смертей, разводов, преступлений и суицидов. Он открыл, что, хотя такие события непредсказуемы для отдельных лиц, они обладают статистическими закономерностями, если рассматривать их по популяции в целом. Он воплотил свою идею, создав «среднестатистического человека», фиктивную личность со средними показателями по всем параметрам. По Кетле, среднестатистический человек вовсе не был отвлеченной математической концепцией: это объект социальной справедливости.

График Кетле для количества людей, имеющих данный вес. Вес откладывается по горизонтальной оси, количество людей – по вертикальной

Начиная с 1880-х общественные науки существенно расширили использование идей статистики, особенно колоколообразной кривой, в качестве замены реальному эксперименту. В 1865 г. Фрэнсис Гальтон занялся исследованием наследственности человека. Как рост ребенка соотносится с ростом его родителей? А как насчет веса или умственных способностей? Он принял колоколообразную кривую Кетле, но воспринимал ее как способ разделения определенных популяций, а не как моральный императив. Если какие-то данные демонстрировали два пика вместо одного на колоколообразной кривой, значит, популяция должна состоять из двух субпопуляций, каждая со своей кривой. К 1877 г. исследования Гальтона подвели его к изобретению регрессионного анализа – способа сравнения одного множества данных с другим для выявления наиболее вероятных взаимоотношений.

Другой заметной фигурой был Исидор Эджуорт. Он не был наделен воображением Гальтона, а был, скорее, технократом и сумел подвести под идеи Гальтона надежную математическую основу. Третьим был Карл Пирсон, внесший значительный вклад в развитие математики. Однако наибольшую пользу своими открытиями Пирсон принес в качестве «продавца идеи»: он убедил весь мир, что статистика – очень полезная наука.

ЧТО ТЕОРИЯ ВЕРОЯТНОСТЕЙ ДАЕТ НАМ

Чрезвычайно важная область приложения теории вероятностей – медицинские испытания новых лекарств. В этих экспериментах проводится сбор данных о воздействии препарата: действительно ли он лечит болезнь и имеет ли какие-то нежелательные побочные эффекты. Что бы ни показывали полученные цифры, главным вопросом остается их статистическая значимость: являются ли они результатом непосредственного воздействия лекарства, или это плод чистой случайности? Проблему помогает решить использование статистического метода под названием проверка гипотезы . Он сравнивает данные исследования со статистической моделью и определяет вероятность того, что результат случаен. Если, например, вероятность меньше 0,01, данные с вероятностью 0,99 не получены случайно. Эффект значим на 99 %. Такие методы позволяют с высокой степенью достоверности определить, какое лекарство самое эффективное, а какое имеет побочные эффекты и не годится для использования.

Ньютон и его последователи показали, что математика может быть очень эффективным способом постижения закономерностей природы. Открытие теории вероятностей и ее прикладной ветви, статистики, имело то же значение для постижения нерегулярности природы. Безусловно, и в случайных событиях можно найти числовые закономерности. Однако они проявляются только в статистических величинах, таких как долгосрочные тренды и средние значения. Они позволяют делать предположения, но лишь о вероятности некоего события. Они не предсказывают, когда событие произойдет. Несмотря на это, теория вероятностей стала одним из самых популярных математических приемов, востребованных и в науке, и в медицине – везде, где необходимо решить, является ли полученный эффект значимым или кажущейся закономерностью, полученной в результате совпадений.