В середине 1960-х гг. во Франции некая девяностолетняя старушка, Жанна Кальмен, сильно нуждаясь в деньгах, заключила договор с сорокасемилетним адвокатом: завещала ему свою квартиру с условием пожизненной выплаты небольших ежемесячных пособий; когда же она освободит помещение, адвокат его займет. Адвокат наверняка знал, что эта Жанна Кальмен уже прожила на десять лет больше среднего срока продолжительности жизни, высчитанного для Франции. Однако он мог не слышать о теории Байеса: важно не то, умрет ли старушка через десять лет или нет, а то, что ее средняя продолжительность жизни, исходя из уже прожитых девяноста лет, увеличивается на шесть лет. Но вряд ли он думал о чем-то подобном, скорее верил: любая женщина, юной девушкой видевшая в отцовской лавке Винсента ван Гога, вскоре последует за этим самым ван Гогом на тот свет. (Любопытно, что художник показался ей человеком «неряшливым, плохо одетым и в целом неприятным».)

Прошло десять лет, и адвокат наверняка подыскал себе другое жилье, потому как старушка отпраздновала столетие в добром здравии. И хотя до собственной средней продолжительности жизни ей к тому моменту оставалось еще два года, она преспокойно дожила на денежки адвоката до ста десяти лет. К тому времени адвокату исполнилось шестьдесят семь. Однако прошло еще десять лет, прежде чем ожиданиям адвоката пришел конец, причем для него довольно неожиданный. В 1995 г. адвокат умер, а Жанна Кальмен продолжала здравствовать. И скончалась лишь 4 августа 1997 г. в возрасте ста двадцати двух лет. Разница между ее возрастом на момент смерти и возрастом адвоката на момент смерти составила сорок пять лет.

У каждого конкретного человека продолжительность жизни, да и сама жизнь, непредсказуемы, однако на основе исследовательских данных можно вывести некие закономерности. Предположим, вы двадцать лет за рулем без единой аварии. И вот одним прекрасным днем вы проводите свой отпуск в Квебеке, рядом с вами жена и ее родители, и вдруг теща кричит вам: «Осторожно, лось!». Вы бешено крутите баранку, врезаясь в придорожный знак, на котором написано ровным счетом то же самое. Вам это происшествие покажется чем-то необычным, прямо из ряда вон выходящим. Но недаром был установлен знак: из всей совокупности тех, кто за рулем, определенный процент водителей наверняка встретится с лосем. В действительности, составляющие статистическую совокупность люди, действующие при этом наугад, часто создают впечатление людей последовательных, с предсказуемым поведением, якобы осознанно преследующих определенные цели. Или же, как в 1784 г. писал Иммануил Кант, «каждый, сообразно своим личным наклонностям, преследует свою цель, зачастую в противовес другим; однако каждый человек и все люди вместе как будто придерживаются некой направляющей линии — идут к естественной, но неведомой каждому в отдельности цели; все приближаются к ней, хотя знай они об этой цели, все равно не придали бы ей большого значения».

К примеру, по данным Федеральной дорожной администрации США, в стране насчитывается около 200 млн. водителей. А по последним данным Национального управления по безопасности дорожного движения, за год эти водители наездили в общей сложности около 2.86 трлн миль. Эго около 23 тыс. км на водителя. А теперь представьте, будто каждый водитель решит: неплохо бы повторить результат в следующем году. Сравним два метода, которыми может быть достигнута эта цель. Метод 1: правительство вводит карточную систему, используя один из сверхмощных компьютерных центров Национального научного фонда для определения дистанции пробега каждому из 200 млн водителей в соответствии с их потребностями, чтобы в итоге получилось в среднем 23 тыс. км. Метод 2: водителям рекомендуют особо не озадачиваться, ездить столько, сколько нужно — больше или меньше, — даже не задумываясь над тем, сколько они наездили в прошлом году. Если дядюшка Билли Боб, который раньше ходил на работу в винный магазинчик пешком, теперь накрутит около 160 тыс. км, продавая дробовики оптом в Западном Техасе — пожалуйста! И если тетушка Джейн из Манхэттена, чей пробег складывался в основном из кругов, которые она описывала в поисках парковочного места в те дни, когда убирались на улицах, вдруг выйдет замуж и переедет в Нью-Джерси, нас это ничуть не обеспокоит. Какой из методов окажется ближе к цели: 23 тыс. км на водителя? Метод 1 невозможно проверить, хотя наш небольшой опыт с карточками на бензин свидетельствует: скорее всего он окажется не особенно удачным. Метод 2 вообще-то и был применен: на следующий год водители ездили столько, сколько хотели, даже не пытаясь ограничивать себя какими-то рамками. И каков результат? Согласно данным Национального управления по безопасности дорожного движения, в тот год водители наездили в общей сложности 2.88 трлн миль, то есть 23 тыс. км на водителя — всего на 160 км больше запланированного. Более того, среди этих самых 200 млн водителей насчитали почти то же (с разницей в 200) число жертв аварий, что и за предыдущий год (42 815 против 42 643).

Мы связываем случайность с отсутствием упорядоченности. И все же, хотя и невозможно спрогнозировать, как повернутся жизни 200 млн водителей, в совокупности их поведение едва ли могло быть более упорядоченным. Те же закономерности можно обнаружить, если исследовать то, каким образом люди голосуют, покупают ценные бумаги, женятся или выходят замуж, пропадают, отправляют письма по не тому адресу или сидят в пробке по пути на встречу, на которую они с самого начала не хотели ехать. Или же если измерять длину ног, размер ступней, ширину ягодиц или пивных животиков. Когда в XIX в. ученые начали разбираться в ставшей доступной социологической информации, куда бы они ни посмотрели, всюду им виделась одна и та же картина: хаос жизни превращался в измеримые и предсказуемые структуры. Но поразили ученых вовсе не одни лишь закономерности. Их поразила природа варьирования. Они обнаружили, что очень часто социологические данные подчиняются принципу нормального распределения.

Тот факт, что вариации черт характера и поведения человека распределяются по типу распределения ошибок лучника, побудило некоторых ученых изучить цели, на которые направлены стрелы человеческого существования. И, что важнее всего, они попытались понять социальные и физические причины, которые иногда смещают цель. Таким образом, математическая статистика, с помощью которой ученые анализировали данные, очень пригодилась в совсем другой области: области изучения природы общества.

#i_001.jpg

История статистического анализа информации, связанной с жизнью человека, началась еще в XI в., когда Вильгельм I Завоеватель учредил то, что по сути явилось первым бюро переписи населения. Править он начал в 1035 г., в возрасте семи лет, унаследовав отцу, норманнскому герцогу Вильгельму. Судя по прозвищу, Вильгельм предпочитал завоевывать; в 1066 г. он вторгся в Англию. К Рождеству Вильгельм сам себе преподнес подарок, провозгласив себя английским королем. Его скорая победа привела к небольшому затруднению: кого же именно он завоевал и, главное, какие налоги собирать с новых вассалов? Чтобы ответить на эти вопросы, Вильгельм отправил в разные части Англии посланцев: те должны были описать размеры каждого клочка земли, учесть все, что на нем производится, а также самого владельца. Чтобы удостовериться в правильности записей, Вильгельм отправил вторую группу посланцев, которым предстояло проделать ту же самую работу. Поскольку при расчете налогов исходили не из численности населения, а из размеров земельных наделов и их использования, посланцы проделали воистину титанический труд, попытавшись сосчитать каждого быка, корову, свинью, однако не слишком старались, когда собирали сведения о тех, кто убирал за всеми этими животными. Даже если население сосчитали бы точно, особой пользы это не принесло бы. В средние века статистические данные о людях — продолжительность их жизни, болезни — считали недостойными внимания в свете традиционных Христианских представлений о смерти. Согласно этим представлениям, не годилось делать смерть предметом размышлений, а в попытках исследовать законы, управляющие ею, усматривали кощунство. Неважно, от чего умер человек: от легочной инфекции, желудочного заболевания или камня, чья сила воздействия превысила прочность черепной коробки — жизнь и смерть подчинялись воле божьей. Спустя столетия подобный фатализм постепенно уступил место противоположному взгляду: изучая закономерности природы и общества, мы не бросаем вызов авторитету Бога, а скорее проникаемся методами его воздействия.

Взгляды сильно поменялись в XVI в., когда мэр Лондона распорядился еженедельно составлять бюллетени смертности с целью учета крещеных и погребенных по приходам. Десятилетиями эти бюллетени составлялись нерегулярно, но в 1603 г., когда чума особенно свирепствовала, городское управление распорядилось вести учет еженедельно. Теоретики на материке отнеслись к практике учета смертности презрительно, усмотрев в ней не имеющую никакой пользы причуду англичан. Но одному из этих чудаковатых англичан, лавочнику по имени Джон Граунт, учетные данные рассказали о многом.

Граунта и его друга Уильяма Петти называют основателями статистики, которую те, кто занимается чистой математикой, иногда считают наукой примитивной. А все из-за того, что статистика интересуется вопросами бытовыми, практическими, и в этом смысле Граунт особенно подходит на роль отца-основателя. Потому как в противоположность некоторым любителям от науки, которые способствовали развитию теории вероятностей — врачу Кардано, юристу Ферма, священнику Байесу — Граунт был всего-навсего торговцем, продавал всякую мелочь вроде пуговиц, ниток, иголок, пригодную в домашнем хозяйстве. Однако Граунт не был заурядным торговцем пуговицами, он преуспевал, благодаря чему располагал свободным временем, которое тратил на занятия, не имевшие ничего общего с приспособлениями для скрепления лоскутов ткани. Также у него нашлось время и для того, чтобы свести знакомство с величайшими интеллектуалами того времени, в число которых входил и Петти.

Вывод, к которому Граунт пришел, изучив бюллетени смертности, связан с числом умерших от голода. В 1665 г. их оказалось 45 человек — примерно в два раза больше, чем тех, кого лишили жизни посредством казни. Для сравнения: 4 808 человек умерли от чахотки, 1 929 — от сыпного тифа и дифтерии, 2 614 — от зубных болезней и глистов и 68 596 — от чумы. Почему же, в то время как Лондон был буквально наводнен попрошайками, так мало людей умирало от недоедания? Граунт решил, что наверняка голодных подкармливают. И предложил, чтобы пищу голодающим давало государство, освобождая тем самым общество от затрат, а Лондон тем временем освободился бы от тех, кто попрошайничал или приставал к прохожим на улице, за плату навязывая свои услуги. Кроме того, Граунт размышлял над двумя основными теориями распространения чумы. Согласно одной теории, болезнь распространялась посредством зараженного воздуха; согласно другой, передавалась от человека к человеку. Граунт наблюдал за еженедельными сводками смертей и сделал вывод: изменения данных слишком существенны, чтобы считать их случайными, как он думал поначалу, считая правильной вторую теорию. С другой стороны, погода от недели к неделе неустойчива, и Граунт предположил, что изменения данных связаны с первой теорией. Впрочем, оказалось, что Лондон еще не был готов к бесплатным столовым для бедных, а лондонцы предпочитали избавляться от крыс, а не дурного воздуха. Однако великие открытия Граунта заключались в ином: статистика может способствовать постижению области знаний посредством изучения ее статистических данных.

Работу Петти иногда рассматривают в качестве предвестника классической экономики. Петти считал, что мощь государства зависит от числа и характера его субъектов, ее и отражающих, поэтому в своем анализе вопросов государственного значения он прибегнул к статистике. К анализу Петти подошел с типичных для тех времен позиций — с точки зрения правящего класса, для которого остальные члены общества представляли собой лишь объекты воздействия. Рассуждая о распространении чумы, Петти указал на следующее: деньги следует выделять на профилактику заболевания. Сохранение людских жизней означает сохранение важного фонда, накопленного обществом: мужчины и женщины, достигшие зрелого возраста, способны дать больше, нежели любой другой самый прибыльный капитал. А вот к ирландцам Петти не был так уж милосерден. Например, он пришел к такому выводу: жизнь англичанина с экономической точки зрения представляет собой большую ценность, чем жизнь ирландца, поэтому принудительное переселение всех ирландцев (за исключением немногочисленных пастухов) будет только способствовать процветанию Британии. Однако оказалось, что своим собственным богатством Петти был обязан все тем же ирландцам: в 1650-х гг. ему, в качестве врача сопровождавшему войска вторгшихся в Ирландию англичан, было поручено описать военные трофеи. Он же, описав добычу, прихватил себе немалую ее долю, что сошло ему с рук.

Если согласиться с Петти, который считал, что численность и рост населения отражают качество управления в стране, то выходит, что отсутствие приемлемого метода оценки численности населения затрудняет и оценку методов управления. Самые известные подсчеты Граунта касались как раз этой области — в частности, населения Лондона. Из бюллетеней смертности Граунт знал и о числе новорожденных. Поскольку он в общих чертах представлял себе коэффициент рождаемости, то смог высчитать число женщин репродуктивного возраста. А исходя из этого, вывел общее число семей и, уже из своих наблюдений за лондонскими семьями, отличавшимися средними размерами, вычислял население города. У него получилось 384.000 человек, хотя до него считалось, что население Лондона равно 2 млн. Удивил Граунт и следующим выводом: рост населения происходит в основном за счет переселения из соседних областей, а вовсе не благодаря естественному воспроизводству, способу более медленному, и что, несмотря на все ужасы чумы, численность населения, снижавшаяся во времена самых страшных эпидемий, потом в течение двух лет неизменно восстанавливалась. Кроме того, Граунту обычно приписывают публикацию первого бюллетеня продолжительности жизни, содержавшего систематически распределенные данные, который в наше время широко используется различными организациями — от страховых компаний до Всемирной организации здравоохранения, — заинтересованными в сведениях о продолжительности жизни населения. Из бюллетеня продолжительности жизни можно узнать о том, сколько человек из ста предположительно доживут до того или иного возраста. К данным Граунта (колонка под названием «Лондон, 1662») я добавил колонки, показывающие те же данные для некоторых стран уже в наши дни.

В 1662 г. Граунт опубликовал результаты своей аналитической работы, издав книгу «Наблюдения естественного и политического характера, основанные на бюллетенях смертности». Год спустя он был избран членом Королевского общества. Затем, в 1666 г., когда случился Великий лондонский пожар, во время которого выгорела большая часть города, Граунт лишился своей лавки. Вдобавок ко всему его обвинили в том, что он якобы способствовал ее разрушению, — распорядился, чтобы остановили подачу воды как раз перед тем, как пламя разгорелось. На самом же деле Граунт обратился к людям, тушившим огонь, уже после пожара. Однако после этого обвинения имя Граунта исчезло из списков членов Королевского общества. Через несколько лет Граунт умер от гепатита.

В 1667 г. французы, беря пример с англичан, пересмотрели свое законодательство, введя обязательное составление бюллетеней смертности; пошли они на это по большей части после изучения работы Граунта. За французами последовали и другие европейские страны. К XIX в. статистики по всей Европе только тем и занимались, что собирали для органов управления данные, к примеру, переписи населения, представлявшие собой «лавину цифр». Граунт имел целью показать: выводы о населении как едином целом можно сделать, основываясь на небольшой выборке данных по этому населению. Однако хотя Граунт и другие предпринимали героические усилия, пытаясь рассматривать информацию с позиций применения простой логики, большая часть тайн была раскрыта только с появлением изобретений Гаусса, Лапласа и других, живших уже в XIX — начале XX вв.

#i_001.jpg

Термин statistics пришел в английский язык из немецкого — слово Statistik было упомянуто в переводе книги 1770 г. «Всеобщее начальное образование по Билфилду»: «наука под названием статистика изучает политическое устройство всех современных государств в известном нам мире». К 1828 г. понятие это развилось, и в «Американском словаре английского языка» Уэбстера статистика получила следующее определение: «собрание фактов, имеющих отношение к состоянию общества, людям в пределах нации или страны, их здоровью, продолжительности жизни, внутренней экономике, искусству, собственности и политике, состоянию страны и т.д». Эта область вобрала в себя и методы Лапласа, пытавшегося расширить сферу применения математического анализа, не ограничиваясь звездами и планетами, а включив еще и вопросы повседневной жизни.

Нормальное распределение описывает то, каким образом многие явления варьируют вокруг центрального значения, которое представляет собой их наиболее вероятный исход; в своем труде «Опыт философии теории вероятностей» Лаплас заявлял: эта новая математическая дисциплина может быть применена при оценке свидетельских показаний, расчете процента браков, начислении страховых взносов. Однако к моменту выхода последнего издания «Опыта» Лапласу было уже больше шестидесяти, поэтому развивал его идеи ученый помоложе. Им был Адольф Кетле, родившийся в Генте, Фландрия, 22 февраля 1796 г.

Кетле занялся исследованиями вовсе не потому, что его живо интересовали законы, по которым существует общество. Диссертация Кетле, за которую он в 1819 г. получил в Гентском университете первую степень доктора, касалась теории конических сечений — темы из геометрии. Далее Кетле заинтересовался астрономией и около 1820 г. активно поддержал движение за основание новой обсерватории в Брюсселе, где и преподавал. Кетле был человеком амбициозным и наверняка рассматривал обсерваторию как ступеньку на пути к основанию научной империи. Шаг был дерзкий, не в последнюю очередь потому, что Кетле плохо знал астрономию и совсем не умел обращаться с обсерваторией. Но, видимо, он сумел настоять на своем, потому что средства выделили не только на обсерваторию, но и на поездку Кетле в Париж, где он в течение нескольких месяцев ликвидировал пробелы в знаниях. Оказалось, что деньги были потрачены не зря: Королевская обсерватория Бельгии существует до сих пор.

В Париже Кетле увлекся темой хаотичности в жизни и резко сменил направление своих интересов. Его роман со статистикой начался с того, что он познакомился с выдающимися французскими математиками, среди которых оказались Лаплас и Фурье, и под руководством последнего начал изучать статистику и вероятность. Под конец у Кетле, хотя он и узнал все тонкости обращения с обсерваторией, появилась другая цель — использование математических методов астрономии применительно к социологическим данным.

Вернувшись в Брюссель, Кетле принялся собирать и анализировать демографические данные и вскоре остановился на отчетности по преступности, которую французское правительство начало публиковать в 1827 г. В двухтомном труде «О человеке и развитии его способностей, или Опыт социальной физики», вышедшем в 1835 г., Кетле напечатал погодовую сводку убийств, совершенных во Франции в период с 1826 по 1831 гг. Он заметил: число убийств из года в год почти не менялось, как и соотношение убийств, совершаемых разными способами: с помощью пистолетов, мечей, ножей, тростей, камней, режущих и колющих инструментов, пинков и ударов, удушения, утопления и поджога. Кроме того, Кетле проанализировал смертность с точки зрения возраста, географического местоположения, времени года, рода деятельности, а также изучил случаи смертей в госпиталях и тюрьмах. Он просмотрел статистические данные по утонувшим, сошедшим с ума и умершим насильственной смертью. И обнаружил статистические закономерности, просматривая случаи самоубийств путем повешения в Париже и количество браков в Бельгии между женщинами за шестьдесят и мужчинами за двадцать.

Подобные исследования проводились и до Кетле, однако Кетле сделал с цифрами нечто большее, чем просто изучил средние значения, — он внимательно присмотрелся к тому, каким образом данные отклоняются от среднего значения. И всюду находил нормальное распределение: в предрасположенности к преступлению, браку и самоубийству, в высоте роста американских индейцев, в размерах грудной клетки шотландских солдат (на данные обмеров 5 738 солдат он наткнулся в старом номере «Эдинбургского журнала по медицине и хирургии»). Что касалось данных по росту 100 тыс. молодых французов призывного возраста, то в отклонениях от нормального распределения он также обнаружил определенные закономерности. Если изобразить данные по числу призывников и данные по их росту в виде графика, то колоколообразная кривая получится искаженной: слишком мало новобранцев, чей рост превышал 158 см, зато тех, чей рост оказался чуть меньше, в качестве компенсации наблюдалось в избытке. Кетле счел, что разница — около 2 200 лишних «коротышек» — получилась в результате мошенничества или, мягко говоря, те, чей рост оказался ниже 158 см, были освобождены от службы.

Десятилетия спустя великий французский математик Пуанкаре воспользовался методом Кетле, чтобы поймать нечистого на руку булочника, который обвешивал покупателей. Пуанкаре, каждый день покупавший буханку свежего хлеба, решил взвесить буханки и заметил: в среднем они весят 950 г, а не обозначенный в прейскуранте 1 кг. Стоило Пуанкаре пожаловаться властям, как ему стали продавать буханки большего веса. Но Пуанкаре все равно не отпускало ощущение, будто хлеб его «не кошерный». И вот он с терпением, какое присуще только ученым великим или же с приличным стажем, принялся взвешивать буханки: каждый день в течение года. Да, теперь по весу буханки в среднем приблизились к 1 кг; однако если булочник в самом деле давал Пуанкаре первую попавшуюся буханку, число буханок большего веса и меньшего веса, которые должны быть у булочника — об этом я говорил в главе 7 — должно сократиться в соответствии с колоколообразной кривой закона ошибок. Вместо этого Пуанкаре обнаружил слишком мало буханок меньшего веса и избыток буханок большего веса. Из чего сделал вывод: булочник продолжал свое дело, просто теперь, стремясь усыпить бдительность Пуанкаре, продавал ему буханки побольше. Полиция вновь навестила булочника-мошенника, который, судя по словам свидетелей, оказался совершенно не готов к такому визиту и, по-видимому, дал слово исправиться.

Кетле наткнулся на полезное открытие: характер распределения случайностей настолько надежен, что в определенных социологических данных его искажение может быть воспринято как свидетельство правонарушения. В наше время подобным образом анализируют данные, слишком обширные для анализа времен Кетле. В последние годы такое «статистическое выслеживание» распространилось, возникло даже новое направление — судебная экономика, — самым известным примером которой является изучение статистической информации с целью выявления компаний, проводящих свои опционные гранты задним числом. Идея проста: компании предоставляют опционные гранты — право покупки акций — позже по цене этих акций на Дату предоставления права — в качестве поощрения менеджеров. Если гранты проводятся задним числом, на дату особенно низкой стоимости акций, менеджеры соответственно получают максимальные доходы. Ловко придумано, однако тайное исполнение этой придумки выливается в нарушение законодательства по ценным бумагам. Кроме того, остаются статистические «отпечатки пальчиков», которые уже привели к раскрытию подобной практики в десятке крупных компаний. В менее известном случае Джастин Вулферс, экономист из бизнес-школы Уортона, обнаружил свидетельства мошенничества в результатах более 70 тыс. баскетбольных игр, сыгранных между колледжами.

Вулферс обнаружил аномальность, сравнивая форы лас-вегасских букмекеров с истинными исходами игр. Когда одна команда является фаворитом, букмекеры предлагают форы, чтобы привлечь примерно одинаковое число ставок на обе команды. Предположим, что баскетбольную команду Калифорнийского технологического посчитали лучше команды Калифорнийского университета в Лос-Анджелесе (что до спортивных фанатов колледжа, то да, так оно и было в 1950-х гг.). Чем заключать пари с неравномерным распределением, букмекеры могли предложить ставки с равными шансами на победу, однако выплачивать только в том случае, если, к примеру, Калифорнийский технологический выигрывал у Калифорнийского университета с перевесом в 13 и более очков.

Хотя форы устанавливаются букмекерами, на самом деле они зависят от тех, кто делает ставки, поскольку букмекеры выстраивают свою «линию» так, чтобы уравновесить спрос. (Букмекеры зарабатывают на марже, которую закладывают в свои прогнозы, поэтому им выгодно, чтобы по каждому участнику соревнования получалась равная сумма ставок — таким образом, они не остаются в накладе при любом исходе игры.) Чтобы определить, насколько умело оценивают обе команды те, кто делает ставки, экономисты используют число, называемое ошибкой прогнозирования — оно представляет собой разницу между преимуществом команды-фаворита и форой букмекера. Может показаться неудивительным, что ошибка прогнозирования, будучи ошибкой определенного типа, распределяется в соответствии с принципом нормального распределения. Вулферс обнаружил, что ее среднее — 0, то есть форы не стремятся ни переоценить, ни недооценить команды, и их среднее отклонение равно 10,9 очкам маржи победы. (При изучении футбольных игр профессиональных команд получился сходный результат: среднее — 0 и среднее отклонение — 13,9 очков.)

Когда Вулферс изучил подмножество игр, которые включали явных фаворитов, он обнаружил нечто поразительное: слишком мало игр, в которых явные фавориты выигрывали со счетом чуть большим, чем фора, и неожиданно много игр, в которых фаворит выигрывал со счетом чуть меньшим. Что снова возвращает к аномальности Кетле. И, как и Кетле с Пуанкаре, Вулферс сделал вывод о мошенничестве. Свой анализ он строил следующим образом: даже сильнейшему игроку трудно преодолеть фору, однако если команда является явным фаворитом, игрок, не ставя под угрозу шансы команды на победу, может снизить темп в достаточной мере, чтобы команда не преодолела фору. Таким образом, если нечистоплотные игроки на тотализаторе задумают жульничество, результатом окажутся те самые искажения, обнаруженные Вулферсом. Доказывает ли работа, проделанная Вулферсом, что в случае определенного процента баскетбольных игр между колледжами игроки брали взятки? Нет, но, как говорит Вулферс, «не должно быть такого, чтобы ситуация на игровом поле отражала ситуацию в игровых заведениях Лас-Вегаса». И вот что еще любопытно: в недавних опросах Национальной студенческой спортивной ассоциации 1,5% игроков признались: они знают товарищей по команде, кто «соглашается брать деньги за плохую игру».

#i_001.jpg

Кетле не ставил перед собой цели найти применение своим идеям в судебных расследованиях. Он метил выше: разобраться с помощью принципа нормального распределения в природе людей и общества. Кетле писал: если сделать 1 тыс. копий статуи, копии окажутся разными из-за ошибок в измерениях и самой работе резчика, и эти отклонения будут подчиняться закону ошибок. Он утверждал: если разнообразие физических признаков у людей подчиняется все тому же закону, напрашивается вывод: мы представляем собой несовершенные копии прообраза. Кетле назвал этот прообраз l'homme moyen, то есть «средний человек». Он подозревал, что и для человеческого поведения существует шаблон. Может, менеджер большого универмага и не определит с уверенностью, прикарманит ли недавно взятая на работу чудаковатая кассирша приглянувшийся ей флакончик элитных духов «Chanel Allure», однако он знает: в розничной торговле потери товаров год от года держатся примерно на уровне 1,6%, причем раз за разом от 45% до 48% от этих потерь приходятся на долю краж со стороны персонала. Кетле писал, что преступления «сродни отчислениям по финансовой смете, которые совершаются с ужасающей регулярностью».

Кетле признавал, что l'homme moyen был бы разным для разных культур и что он менялся бы с изменением социальных условий. Именно эти изменения, а также их причины и стремился изучить Кетле. «Человек рождается, растет и умирает в соответствии с определенными законами, — писал он, — и законы эти до сих пор еще не изучены». Ньютон стал отцом современной физики, сформулировав ряд законов, управляющих вселенной. Видя перед собой пример Ньютона, Кетле жаждал создать новую «социальную физику», которая описывала бы законы поведения человека. По аналогии Кетле выходило: как объект, не будучи потревожен, продолжает двигаться, так и общество при неизменных социальных условиях не меняется. Ньютон описывал, как в результате воздействия физических сил объект отклоняется от движения по прямолинейной траектории; Кетле тоже искал законы поведения человека, описывающие, как социальные силы влияют на общество. Например, Кетле считал, что существенная разница в доходах и большие колебания цен ответственны за преступность и социальные волнения, а вот устойчивый уровень преступности говорит о состоянии равновесия, которое изменяется с изменением основополагающих причин. Недавним примером изменений в социальном равновесии, случившихся после террористического акта 11 сентября 2001 г., может служить следующее: люди стали бояться самолетов, предпочтя передвигаться на машинах. Их страх привел к тому, что смертность на дорогах увеличилась по сравнению с результатами прошлого года на 1 тыс. случаев — что называется, неявные потери теракта.

Однако одно дело верить в существование социальной физики, и совсем другое — описать ее. Кетле понял: в случае с истинной наукой теории можно исследовать экспериментальным путем — помещая людей в различные ситуации и оценивая их поведение. Поскольку это невозможно, Кетле сделал вывод, что социология более походит на астрономию, нежели на физику: социологические исследования строятся на основе пассивных наблюдений. Таким образом, пытаясь раскрыть законы социальной физики, Кетле изучал временные и культурные изменения, происходящие с l'homme moyen.

Идеи Кетле были восприняты другими учеными, особенно во Франции и Великобритании. Один физиолог даже зашел так далеко, что собрал из писсуара в мужском туалете при железнодорожной станции образцы мочи людей разных национальностей с тем, чтобы выделить свойства «среднеевропейской мочи». В Британии у Кетле был ученик, уверовавший в его идеи с особенным энтузиазмом — Генри Томас Бокль, состоятельный человек, шахматист и историк, более известный своим многотомным трудом «История цивилизации в Англии», отличавшимся смелостью замысла. К несчастью, в 1861 г., остановившись во время путешествия в Дамаске, сорокалетний Бокль заболел тифом. Ему советовали местного врача, однако он, узнав, что врач — француз, отказался, в результате чего умер. Бокль не закончил свой труд. Однако успел написать два тома; в первом история представлялась с точки зрения статистики и была основана на работе Кетле. Труд Бокля тут же получил признание. Он распространился по всей Европе, вышли переводы на французский, немецкий, русский. Дарвин читал труд Бокля, и Альфред Рассел Уоллес читал, а Достоевский — даже дважды.

Несмотря на популярность произведения Бокля, вердикт истории был таков: в математических изысканиях Кетле оказалось больше смысла, нежели в изысканиях социальной физики. Во-первых, не все то, что происходит в обществе, особенно в мире финансов, соответствует нормальному распределению. Например, если бы доходы от показа фильма распределялись нормально, большинство фильмов приносили бы некий средний доход, а две трети доходов от всех фильмов оставались бы в пределах среднего отклонения. Однако в кинематографическом бизнесе 20% фильмов приносят 80% доходов. Такие сферы деятельности, которые развиваются за счет хитов, хотя и совершенно непредсказуемы, повинуются совсем иному распределению, такому, для которого понятия «среднее» и «среднее отклонение» ничего не значат ввиду отсутствия «типичного» производства, а мегахитовые выбросы, которые в обычной сфере деятельности бывают раз в несколько сот лет, тут происходят неизмеримо чаще.

Да, Кетле обошел своим вниманием распределения другой вероятности, однако обиднее то, что ему не удалось осуществить свое намерение — значительно продвинуться в попытках раскрыть законы и силы, которым он отдал столько сил и времени. Поэтому в конце концов непосредственное влияние Кетле на социальные науки оказалось весьма скромным, однако его наследие невозможно переоценить, оно имело далеко идущие последствия. И не для социальных наук, а для наук естественных, где его подход к толкованию порядка в большом количестве случайных событий вдохновил многих ученых и послужил толчком к созданию революционного труда, трансформировавшего способ мышления и в биологии, и в физике.

#i_001.jpg

Именно двоюродный брат Чарльза Дарвина применил статистический анализ в биологии. В 1840 г. Фрэнсис Гальтон, человек, располагавший временем, поступил в кембриджский Тринити-Колледж. Поначалу он изучал медицину, но затем по совету Дарвина занялся математикой. Ему было двадцать два, когда отец умер, в результате чего Фрэнсис унаследовал немалое состояние. Гальтону никогда не приходилось зарабатывать себе на жизнь, и он, оставаясь любителем, занялся наукой. Особенно его интересовали измерения. Он измерял человеческие головы, носы, руки и ноги, количество суетливых движений, которые слушатели совершали во время лекций, степень привлекательности девушек на улице (лондонские девушки получили самые высокие баллы, самые низкие оказались у девушек из шотландского Абердина). Он измерял характерные особенности отпечатков пальцев — потом, в 1901 г., эту практику распознавания по отпечаткам пальцев взяли на вооружение в Скотленд-Ярде. Он даже высчитал продолжительность жизни правителей и священников, которая оказалась такой же, как и у людей другого положения и рода деятельности, из чего Гальтон заключил: молитва в этом отношении не дает никаких преимуществ.

В своей книге 1869 г. под названием «Наследственность таланта. Законы и последствия» Гальтон написал: часть людей, выстроенных по росту, должна со временем сохранить практически то же соотношение, а принципу нормального распределения подчиняется не только рост, но и прочие физические признаки: окружность головы, размер мозга, вес серого вещества, количество мозговых нитей и так далее. Однако на этом Гальтон не остановился. Он верил, что и характер человека также задается наследственностью и, как и физические черты, подчиняется принципу нормального распределения. Согласно Гальтону, мужчины не «равны как ячейки общества, [не] каждый из них имеет право голоса и прочее». Гальтон утверждал: около 250 мужчин из каждого миллиона наследуют исключительные способности к тому или иному занятию и в результате добиваются в своей области значительных успехов. (Поскольку во времена Гальтона женщины не работали, для них он такой анализ не проводил.) Основываясь на этих идеях, Гальтон основал новую науку и назвал ее евгеникой: от греческих eu (хороший) и genos (рождение). Спустя годы принципами евгеники воспользовались совершенно разные люди в совершенно разных целях. Термин и некоторые концепции Гальтона переняли нацисты, однако нет никаких свидетельств тому, что сам Гальтон одобрил бы их кровавые замыслы. Он стремился найти способ, с помощью которого можно было бы улучшить человеческую породу посредством селекционного отбора.

Большая часть главы 9 посвящена выяснению причин, по которым простое причинно-следственное толкование Гальтоном успеха казалось таким привлекательным. Однако в главе 10 мы увидим, что из-за великого множества предсказуемых и случайных препятствий, которые нужно преодолеть, чтобы справиться с задачей любой сложности, связь между способностями и исполнением вовсе не такая прямая, чтобы идеи Гальтона ее объясняли. В последние годы психологи обнаружили: в плане достижения успеха способность преодолеть трудности не менее важна, чем наличие таланта. Вот почему эксперты часто говорят о «правиле десяти лет», подразумевая, что для большинства занятий требуется как минимум десять лет напряженного труда, чтобы добиться значительных результатов. При мысли о том, что огромное значение имеет не только наличие врожденных способностей, но и прилагаемые усилия, в конце концов, удача, кто-то может и приуныть. Однако я смотрю на это совсем иначе: пусть наше генетическое «лицо» и не поддается контролю, мы можем прилагать усилия ровно в той степени, в какой считаем нужным. Да и с удачей все не так безнадежно: путем большого числа повторений мы можем повысить свои шансы на успех.

Какими бы ни были плюсы и минусы евгеники, исследования Гальтона в области наследственности привели к открытию двух математических понятий, которые являются центральными в современной статистике. Первое открытие Гальтон совершил в 1875 г., после того, как раздал семи друзьям пакетики со стручками душистого горошка. Каждый друг получил семена одинакового размера и веса, а вернул Гальтону семена уже следующих урожаев. Гальтон измерил семена: в среднем диаметр семян, уродившихся от мелких горошин, был больше, чем диаметр родителей. Позднее, подключив данные из лаборатории, основанной им в Лондоне, Гальтон заметил то же самое и в отношении роста уже людей: родителей и детей. Этот феномен — когда группа крайних результатов сопровождается результатами, которые в среднем менее экстремальны, — Гальтон назвал регрессией к среднему.

Вскоре Гальтону стало ясно: процессы, не подпадающие под определение регрессии к среднему, в конце концов выходят из-под контроля. Например, предположим, что сыновья высоких отцов в среднем будут такими же высокими, как и их отцы. Поскольку рост каждого разнится, некоторые сыновья окажутся выше. А теперь представим следующее поколение, и предположим, что сыновья более высоких сыновей, внуки, тоже в среднем такие же высокие, как и их отцы. Некоторые из них также будут выделяться ростом по сравнению с отцами. Таким образом, из поколения в поколение самые высокие будут становиться все выше и выше. Однако благодаря регрессии к среднему этого не происходит. То же самое можно сказать и о врожденных умственных способностях, художественном таланте или способности ловко бить по мячу в гольфе. Очень высоким родителям не следует ожидать таких же высоких детей, очень умным родителям не стоит ожидать, что их отпрыски будут семи пядей во лбу, а многочисленные Пикассо и Тайгеры Вудсы зря понадеются на то, что их прямые потомки сравняются с ними своим гением. С одной стороны, у очень приземистых родителей могут родиться высокие дети, так что те из нас, кто не может похвастать блестящим умом или не умеет рисовать, вполне могут надеяться на исправление этих недостатков в следующих поколениях.

Через объявления Гальтон привлекал испытуемых в свою лабораторию, где проводил измерения: роста, веса, даже некоторых костей. Его целью было найти определенный метод, позволявший вычислять данные детей, основываясь на данных их родителей. На одном из графиков Гальтона были показаны данные по росту родителей и детей. Если, скажем, рост всегда был одним и тем же, получалась аккуратная прямая, поднимавшаяся под углом в 45 градусов. Если же это соотношение в целом сохранялось, однако индивидуальные данные отличались, возникал пунктир выше и ниже прямой. Таким образом, график Гальтона демонстрировал наглядно не только общее отношение между ростом родителей и детей, но и то, до какой степени это отношение сохранялось. Что является вторым важным открытием и вкладом в статистику: определение математического показателя, описывающего это отношение. Гальтон назвал этот показатель коэффициентом корреляции.

Коэффициент корреляции — это число между -1 и 1; если оно приближается к ± 1, две переменные связаны между собой линейно; 0 же означает отсутствие связи. Например, данные показывают: наедаясь в «Макдоналдсе» на 1 тыс. калорий раз в неделю, человек поправляется на 4,5 кг в год, а съедая 1 тыс. калорий Дважды в неделю, на 9 кг. И так далее. Коэффициент корреляции в таком случае равен 1. Если по какой-то причине каждый, наоборот, терял бы этот вес, коэффициент корреляции был бы равен — 1. А если бы данные о прибавке в весе и его потере были бы разбросаны по всему графику и не зависели от потребления еды, коэффициент равнялся бы 0. В наше время понятие «коэффициент корреляции» — одно из самых широко употребимых в статистике. К примеру, оно используется для того, чтобы проследить связь между количеством выкуренных сигарет и раковых заболеваний, расстоянием звезд от Земли и скоростью, с которой они удаляются от нашей планеты, баллами, получаемыми студентами по унифицированным тестам, и доходом в семьях этих студентов.

Труд Гальтона имел значение не только благодаря своей непосредственной важности, но еще и потому, что подвиг на дальнейшие исследования в области статистики, в результате чего наука быстро развивалась и крепла. Важную роль тут сыграл Карл Пирсон, ученик Гальтона. Ранее в этой главе я упоминал множество различных типов данных, которые распределяются в соответствии с принципом нормального распределения. Однако когда мы имеем дело с ограниченным количеством данных, кривая нормального распределения совершенной формы никогда не получится. В период становления статистики ученые, чтобы определить, действительно ли данные распределяются в соответствии с принципом нормального распределения, поступали очень просто: строили график и смотрели, какой получается кривая. Однако каким образом можно выразить количественно точность соответствия? Пирсон изобрел метод, называемый проверкой по критерию хи-квадрат, с помощью которого можно определить верность своего предположения относительно действительного соответствия набора данных распределению. В июле 1892 г. Пирсон провел в Монте-Карло эксперименты, заключавшиеся в точном повторении действий Джаггера. В одном эксперименте у Пирсона, как и у Джаггера, выпадавшие числа не соответствовали распределению, какому должны были соответствовать, выдавай рулеточное колесо действительно случайные результаты. В другом эксперименте Пирсон выяснял, сколько пятерок и шестерок выпадает за 26 306 подбрасываний двенадцати костей. И обнаружил, что распределение не такое, какое было бы в вероятностном эксперименте с идеальной костью — то есть в таком эксперименте, в котором вероятность пятерки или шестерки при одном броске была бы равна 1 из 3, или 0,3333. Однако соответствие наблюдалось, если вероятность пятерки или шестерки была 0,3377 — то есть, если кость не была идеальной. В случае с рулеткой игра могла быть сфальсифицированной, однако у костей отклонения могли быть обусловлены неточностями при изготовлении, каковые, как настаивал мой друг Моше, всегда присутствуют.

В наше время проверка по критерию хи-квадрат применяется во многих случаях. Предположим, что вместо испытаний с привлечением костей вы решите провести испытания с тремя пачками из-под хлопьев на предмет их привлекательности для потребителя. Если у потребителей нет предпочтений, можно ожидать, что около 1 из 3 выскажутся за каждую из пачек. Как мы убедились, на практике результаты редко когда распределяются с такой равномерностью. Проведя проверку по критерию хи-квадрат, вы определите, насколько вероятно, что пачка-победитель получит больше голосов в результате потребительских предпочтений, нежели простой случайности. Так же предположим, что исследователи одной фармацевтической компании проводят эксперимент: испытывают два способа лечения, используемые для предупреждения резкого отторжения трансплантанта. Они могут прибегнуть к проверке по критерию хи-квадрат, чтобы определить, существует ли статистически значимая разница между результатами. Или же предположим, что перед открытием нового автосалона руководитель финансовой службы компании по прокату автомобилей ожидает, что 25% клиентов потребуются автомобили среднего класса, 50% — малолитражки и 12,5% — автомобили средней категории и «других». Когда начинают поступать данные о продажах, проверка по критерию хи-квадрат может помочь руководителю быстро проверить: правильны ли его предположения или же новый салон нетипичен и стоит переориентироваться в соответствии со спросом.

Через Гальтона работа Кетле проникла в биологию. Однако внесла она оживление и в физику: Джеймс Максвелл и Людвиг Больцман, двое из основателей статистической физики, черпали свое вдохновение из теорий Кетле. (Как и Дарвин с Достоевским, о теориях они прочитали в книге Бокля.) В конце концов, если грудные клетки 5 738 шотландских солдат идеально распределяются в виде кривой нормального распределения, а среднегодовой пробег 200 млн водителей из года в год варьирует в пределах каких-то 160 км, не нужно быть Эйнштейном, чтобы догадаться: 10 септиллионов или около того молекул в литре газа могут продемонстрировать некоторые любопытные закономерности. Хотя, по правде говоря, все-таки нужно быть Эйнштейном, чтобы наконец убедить научное сообщество в необходимости нового подхода к физике. Альберт Эйнштейн сделал это в 1905 г., том самом, когда опубликовал свою первую работу по относительности. И хотя этот труд Эйнштейна мало известен массам, в статистической физике он произвел революцию. И в научной литературе на эту работу Эйнштейна потом ссылались чаще, чем на любую другую его работу.

#i_001.jpg

Работа Эйнштейна 1905 г. по статистической физике имела своей целью объяснение феномена, называемого броуновским движением. Феномен получил свое название по имени Роберта Броуна, ботаника, специалиста мирового класса по микроскопии и человека, который, как считается, первым внятно описал клеточное ядро. Броун неуклонно преследовал цель: с помощью наблюдений открыть источник жизненной силы, этот загадочный фактор, благодаря которому, как считалось в то время, объект наделялся свойствами живого существа. Искания Броуна были обречены на неудачу, но однажды, в июне 1827 г., ему показалось, что он достиг цели.

Наблюдая в лупу за цветочной пыльцой, Браун обратил внимание: гранулы пыльцы как будто двигаются. Хотя пыльца и является источником жизни, сама по себе она не живой организм. Однако сколько Броун ни смотрел, движение не прекращалось — гранулами как будто двигала некая таинственная энергия. Это движение не было намеренным, наоборот, оно походило на случайное. Взволнованный Броун поначалу решил было, что он наконец-то у цели — чем еще могла быть эта энергия как не энергией, порождающей саму жизнь?

В процессе экспериментов, которые Броун со всем тщанием ставил последующие несколько месяцев, он заметил: тот же самый тип движения наблюдается и среди самых разных частичек органической природы, помещенных в виде взвеси в воде и иногда в джине: разлагающихся волокон телятины, паутины, «черной от лондонской пыли», даже собственной мокроты. А затем последовал смертельный удар, сведший на нет столь желанную интерпретацию открытия, — Броун распознал движение, в котором участвовали и неорганические частички: асбест, медь, висмут, сурьма, марганец. Ему стало ясно, что наблюдаемое им движение не связано с понятием об источнике жизни. Истинная причина броуновского движения, как выяснится, — та же сила, которой подчиняются закономерности человеческого поведения, подмеченные Кетле, — сила не физическая, а очевидно, обусловленная принципом случайности. К сожалению, Броун не дожил до тех времен, когда феномену дали объяснение.

Основа для понимания броуновского движения была заложена в последующие десятилетия после работы Броуна — Больцманом, Максвеллом и другими. Вооруженные теориями Кетле, они создали новую область — статистическую физику, прибегнув к математически подкрепленной вероятности и статистике, — чтобы объяснить, каким образом свойства жидкостей происходят из движения (тогда гипотетического) атомов, их составляющих. Еще несколько десятилетий идеи ученых не находили отклика. У некоторых коллег были возражения по части математических выкладок. Другие возражали, поскольку в то время никому еще не удавалось увидеть атом, и ни у кого не было уверенности, что это когда-либо произойдет. Однако физики в большинстве своем практики, поэтому самым большим препятствием на пути к приятию объяснения было следующее: хотя теория и воспроизводила некоторые уже известные законы, ничего нового она не давала. Так продолжалось до 1905 г. — уже и Максвелла давно не было в живых, и Больцман, находясь в состоянии уныния, вскоре покончил самоубийством, — когда Эйнштейн воспользовался новорожденной теорией, чтобы с невероятной подробностью объяснить точный механизм броуновского движения. Необходимость статистического подхода к физике никогда больше не подвергнется сомнению, а идея о том, что вещество состоит из атомов и молекул, окажется той самой базой, на которой возникнут современнейшие технологии, а также одной из важнейших во всей истории физики.

Как мы узнаем из главы 10, случайное блуждание молекул в жидкости можно рассматривать в качестве своеобразной метафоры наших жизненных путей, поэтому стоит уделить работе Эйнштейна еще немного времени. На атомарном уровне движение молекул воды выглядит хаотичным. Молекулы перемещаются то туда, то сюда, движутся по прямой лишь до столкновения с другой молекулой. Как я уже писал в прологе, такой тип движения, при котором в различных точках направление произвольно меняется, часто называют «походкой пьяного» — вполне очевидное название для каждого, кому случалось перебрать мартини (математики и вообще ученые из числа трезвенников называют это движение «случайным блужданием»). Согласно атомарной теории, частички, плавающие в жидкости, постоянно бомбардируются молекулами жидкости; если это так, то можно ожидать, что они будут смещаться в разных направлениях. Однако в связи с картиной броуновского движения возникают два затруднения. Первое: молекулы слишком легки, чтобы сдвинуть с места видимые плавающие частички. Второе: молекулярные столкновения случаются гораздо чаще, нежели наблюдаемые смещения от якобы столкновений. Гениальность Эйнштейна объясняется уже тем, что он догадался: эти два вопроса взаимоисключающи; хотя столкновения происходят очень часто, из-за того, что молекулы очень легкие, отдельные столкновения невидны. Лишь по чистой случайности — тут приходит на ум сравнение с рекордным годом бейсболиста Роджера Мариса — наблюдаются видимые смещения. Когда Эйнштейн произвел математические подсчеты, он обнаружил: несмотря на хаотичность на уровне наблюдений в микроскоп, существует предсказуемая связь между такими факторами, как размер, число, скорость молекул, и наблюдаемой частотой и амплитудой смещений. Поначалу Эйнштейн связал новые, измеримые результаты со статистической физикой. Возможно, это покажется исключительно техническим достижением, но на самом деле это огромная победа: большая часть того упорядоченного, что мы наблюдаем в природе, скрывает под собой невидимую беспорядочность и, следовательно, может быть понята лишь с помощью правил случайности. Как написал Эйнштейн: «Возникает невероятное ощущение, когда осознаешь единство совокупности феноменов, которые кажутся совершенно далекими от истинности при прямом на них взгляде».

В математическом анализе Эйнштейна нормальное распределение опять же играет ключевую роль, восходя еще на одну ступеньку славы в истории развития науки. Случайное блуждание тоже стало одним из основополагающих, а вскоре и одним из самых изучаемых процессов в природе. По мере того, как ученые разных областей знаний начали признавать статистический подход к изучению совершенно оправданным, они увидели следы случайного блуждания практически везде: в полетах москитов, рыскающих в поисках пищи на просторах вырубленных африканских джунглей, в химических реакциях при производстве нейлона, в образовании пластмасс, в движении свободных квантовых частиц, а также цен на акции, даже в эволюции разума на протяжении миллиардов лет. В главе 10 мы рассмотрим влияние случайности на наш собственный жизненный путь. Однако, как мы вскоре убедимся, хотя в случайных изменениях и присутствуют упорядоченные структуры, они не всегда наполнены смыслом. Важно разглядеть смысл там, где он есть, но и не менее важно не пытаться выудить его оттуда, где его нет. Непросто избавиться от иллюзии наличия смысла в случайных структурах. Об этом речь в следующей главе.