2. Длинный хвост закона. «Красота в квадрате Как цифры отражают жизнь и жизнь отражает цифры»

В 1085 году Вильгельм Завоеватель приказал провести в Англии перепись. Он хотел знать, сколько людей живет на его землях, кто эти люди, какое у них имущество, какой доход они получают и, что самое главное, какие налоги должны платить. Он разослал своих представителей по всему королевству, и его приказ был выполнен настолько тщательно, что в летописи Anglo-Saxon Chronicle («Англосаксонские хроники») появилась запись: «Ни одного быка, ни одной коровы и ни одной свиньи не осталось неучтенной».

Книга с результатами этой переписи известна под названием Doomsday Book («Книга Судного дня»). Это самый ранний источник сведений о населении Англии, первый в западном мире крупный сборник статистических данных и настоящая находка для историков, специалистов по генеалогии и лексикографов. Движимый желанием узнать, скрыты ли в этой книге математические тайны, я приступил к изучению первого раздела, посвященного графству Кент.

В самом начале говорилось о том, что город Дувр заплатил 18 фунтов налога, из которых две части ушло королю Эдуарду, а третья — графу Гудвину. Жители Дувра дали королю 20 кораблей на 15 дней с экипажем в количестве 21 человека на каждом судне.

Поскольку меня интересовали исключительно числа, я выделил из этого абзаца следующий список: 18, 2, 20, 15 и 21 — и мне сразу же кое-что бросилось в глаза. Посмотрите на первую цифру каждого числа: 1, 2, 2, 1 и 2. Только единицы и двойки, самые маленькие цифры. Любопытно, не правда ли? По всей вероятности, да. Но все же выборка была слишком мала, чтобы делать какие-то выводы. Я прочитал книгу до конца, отмечая первые цифры каждого числа, которое мне встречалось. Преобладание единиц и двоек наблюдалось по всей книге. Да, тройки, четверки и другие цифры тоже присутствовали, но гораздо реже. Я был просто поражен тем, насколько чаще числа начинаются с маленьких цифр, чем с больших.

Я насчитал уже 182 числа, когда мне впервые попалась на глаза девятка. Она обозначала количество крестьян, подчинявшихся Вульфстану, сыну Вульфвина из Шепердсуэлла. К тому времени я насчитал 53 числа, начинающихся с цифры 1, 22 — с цифры 2, 18 — с цифры 3 и 15 — с цифры 4. Посмотрите на эти числа еще раз: в них тоже прослеживается четкая закономерность. Числа с цифрой 1 в начале встречаются чаще, чем с цифрой 2, последняя, в свою очередь, чаще, чем с цифрой 3, и т. д., вплоть до чисел с цифрой 9 в начале, которых меньше всего.

Мне было понятно, почему единица попадалась так часто. Королевские посланцы, проводившие перепись, переходили от одного жилища к другому, пересчитывая людей, домашний скот и инвентарь. В хозяйствах, которые вспахивали свои земли, было, как правило, по одному плугу — отсюда и такая высокая повторяемость единицы. Однако это не объясняло невероятно устойчивого снижения частотности чисел по мере увеличения их первых цифр, особенно когда этими числами обозначались самые разные объекты в самых разных количествах — например, 40 000 сельдей, подаренных монахам в Кентербери, или 27 соляных приисков в Милтон-Реджисе.

Возможно, это свойственно только тем давним временам. Я закрыл «Книгу Судного дня» и перенес свои исследования на 800 лет вперед, оказавшись в Лондоне викторианской эпохи.

Двенадцатого марта 1881 года на первой странице газеты The Times были опубликованы такие объявления: владелец 25-тонной шхуны ищет джентльмена, который согласится отправиться вместе с ним в южные моря; временный приют для бездомных собак в Баттерси приглашает людей, желающих купить домашнее животное, посмотреть 500–700 своих обитателей; Сэмюел Брэндрем сообщает, что его шекспировские чтения состоятся в четверг, в 3 часа дня, по адресу Старая Бонд-стрит, 33 — забронировать места можно за 5 шиллингов.

Я подсчитал частотность первых цифр (также именуемых ведущими цифрами) во всех числах, которые нашел на первой полосе The Times. Числа с цифрой 1 в начале и на сей раз встречались чаще всего, в отличие от цифры 9, занимавшей в этом рейтинге последнюю позицию. Хотя жизнь в XIX столетии существенно отличалась от жизни в XI веке, первые цифры чисел, отражавших социальную статистику, вели себя практически одинаково.

Такую же закономерность можно найти на страницах любой современной прессы. Попробуйте сделать это сами! Этот простой трюк можно показывать на вечеринке; его также любят демонстрировать фокусники в пабах. Посчитайте первые цифры — и увидите, что их частотность неизменно снижается: числа, начинающиеся с цифры 1, встречаются чаще всего; затем следуют числа, первая цифра которых 2, потом 3 — и т. д. до цифры 9, которая используется в начале чисел реже всего.

Это действительно невероятно. Большинство людей просто не поверят вам, пока вы не подсчитаете цифры. На интуитивном уровне нам кажется, что числа, указанные в газетах, не могут вести себя столь упорядоченно, особенно учитывая тот факт, что они произвольно взяты из огромного количества самых разных источников. Тем не менее, о каких бы числах ни шла речь — о результатах спортивных соревнований, ценах акций или количестве погибших, — уверяю вас: цифра 1 в начале чисел будет встречаться чаще, а цифра 9 — реже всего.

Этот вывод представляется нам несколько неожиданным, так как мы интуитивно предполагаем, что все числа имеют равные шансы на появление. Безусловно, если поместить в ящик 999 шариков для пинг-понга, пронумерованных от 1 до 999, и извлекать их в произвольном порядке, то вероятность выбора любого числа с определенной цифрой в начале составляет одну девятую, или 11 процентов. Другими словами, у всех цифр в этом случае одинаковые перспективы. Однако очевидно и то, что в газетах первые цифры чисел ведут себя абсолютно иначе: они распределены по явно выраженному асимметричному закону.

Тенденцию к преобладанию чисел, начинающихся с единицы, впервые заметил американский астроном канадского происхождения Саймон Ньюком. В 1881 году он опубликовал в журнале American Journal of Mathematics краткую заметку, в которой объяснял, что выявил данную особенность благодаря книгам с логарифмическими таблицами. Первые страницы с таблицами логарифмов для чисел, начинающихся с цифры 1, всегда были более истрепаны, чем страницы с таблицами для чисел, начинающихся с цифры 9. Подобный феномен уж точно не объяснишь тем, что исследователи якобы внимательно читали первые страницы книги, а затем теряли к ней интерес из-за отсутствия захватывающего сюжета. Здесь причина в другом: они чаще сталкивались в работе с числами, начинающимися с единицы. Ньюком предположил, что частотность первых цифр чисел, выраженная в процентах, примерно такова.

Частота наличия цифры 1 в начале чисел составляет 30,1 процента, цифры 2 — 17,6 процента, цифры 3 — 12,5 процента, причем этот показатель стремительно падает по мере увеличения цифры: шанс встретить цифру 1 в начале чисел в семь раз превышает подобную вероятность по отношению к цифре 9.

Ньюком рассчитал эти показатели с помощью логарифмов. Он утверждал, что вероятность появления цифры d в начале числа определяется по формуле: log(d + 1) – log d. (В Приложении 1 я объясню ее суть.) Однако он не смог четко обосновать ее, поэтому привел вместо этого неформальный аргумент, просто представив его как некую любопытную тенденцию.

Более чем полвека спустя, в 1938 году, физик из General Electric Фрэнк Бенфорд заново открыл феномен первой цифры, тоже обратив внимание на потрепанность страниц в книгах с таблицами логарифмов (по всей вероятности, он не знал о статье Ньюкома). Однако Бенфорд проанализировал эту закономерность не только на основании книг с логарифмами. Он изучил распределение первых цифр исходя из таких данных, как население городов США, адреса первых нескольких сотен людей из биографического справочника американских ученых American Men of Science, атомный вес химических элементов, площадь бассейна рек и статистика бейсбольных матчей. В большинстве случаев результаты были близки к ожидаемому распределению. Наверное, было очень интересно наблюдать за тем, как одна и та же последовательность возникает в самых разных ситуациях. Разумеется, полученные показатели не были в точности такими, как представленные выше проценты (в реальном мире подобной точности нет). Тем не менее в целом они почти полностью совпадали с прогнозируемыми значениями, отклоняясь от них не более чем на несколько десятых процента. В настоящее время закон Бенфорда нашел свое подтверждение в самых разных областях, в том числе в естествознании, финансах, экономике и вычислительной технике. Этот закон гласит: в любом множестве данных о естественных произвольных процессах, включающем в себя величины нескольких порядков, частота появления цифры 1 в качестве первой значащей цифры составляет около 30 процентов, цифры 2 — около 18 процентов и т. д. Бенфорд считал, что этот феномен отражает универсальный закон, который он обозначил термином «закон аномальных чисел». Но термин не прижился, и открытие получило известность под названием «закон Бенфорда».

Закону Бенфорда подчиняется большинство множеств данных, взятых из реальной жизни, например численность населения в 3221 округе США и совокупный квартальный доход 30 525 открытых акционерных компаний за период с 1961 по 2011 год.

Закон Бенфорда — одна из самых замечательных числовых закономерностей, существующих в мире. Чуть ниже я остановлюсь на некоторых других, но, прежде чем перейти к ним, мы должны провести одно расследование.

Даррелл Доррелл напоминал мне медведя. Эта ассоциация отчасти объяснялась тем, что мы с ним встретились в Портленде, столице штата Орегон, в котором водится много медведей, и частично тем, что Даррелл был мужчиной коренастого телосложения, с торчащими усами и низким голосом, смахивающим на тихое рычание. Кроме того, ассоциация была связана с его работой финансового следователя. Даррелл вынюхивает искаженные данные с хищническим инстинктом гризли, добывающего себе пищу. Вам лучше не допускать его к своим бухгалтерским книгам, если в них есть хотя бы малейший намек на злоупотребления. ЦРУ, Министерство юстиции и Комиссия по ценным бумагам и биржам регулярно пользовались его услугами в области судебно-бухгалтерской экспертизы (этим отраслевым термином обозначается расследование финансовых махинаций). У Даррелла есть лицензия на ношение оружия. «Все двери здесь закрываются изнутри, — объяснял он. — Мы вызываем у многих людей недовольство».

Когда в начале тысячелетия Даррелл впервые услышал о законе Бенфорда, он испытал примерно те же эмоции, что и люди, пережившие большую утрату: удивление, отрицание, гнев и принятие. «Сначала у меня возникла мысль: “Почему я не слышал об этом раньше?” Затем я подумал: “Этого просто не может быть!” А когда в конце концов понял суть этого закона, на меня снизошло озарение: “Вот это да! Ведь это еще один инструмент, который можно использовать”». Теперь в ходе расследования финансовых махинаций Даррелл прежде всего проверяет первые цифры номеров банковских счетов и данных в бухгалтерских книгах компаний. Финансовые данные, включающие в себя величины нескольких порядков (другими словами, которые отражают количество, измеряемое в единицах продукции или в десятках, сотнях и тысячах долларов), должны подчиняться закону Бенфорда. Если этого не происходит, значит, либо существует обоснованное объяснение (например, регулярная закупка товаров стоимостью, скажем, 40 долларов за единицу, которая влечет за собой повышение вероятности появления цифры 4), либо имеют место преступные действия. Отклонение от закона Бенфорда — это признак того, что соответствующие финансовые данные требуют более тщательного анализа.

Даррелл показал на висевшую на стене рамку, в которую была помещена первая страница газеты со статьей о вынесении приговора Уэсли Родсу — местному финансовому консультанту, укравшему у инвесторов миллионы долларов, чтобы покупать на эти деньги классические модели автомобилей. «Закон Бенфорда помог нам привлечь его к ответственности», — сообщил Даррелл. Отчеты, которые Родс отправлял инвесторам, не прошли проверку на соответствие закону первой цифры, а это означало, что что-то с ними не так. Проанализировав отчеты более внимательно, Даррелл обнаружил, что Родс сфальсифицировал данные. Теперь Даррелл характеризует закон Бенфорда так: «Это ДНК количественного исследования, исходное предположение о том, как работают цифры. И, как я уже неоднократно объяснял в суде, хорошо то, что здесь речь идет о науке. Открытие Бенфорда — не теория. Это закон».

Метод анализа чисел на предмет их соответствия закону Бенфорда все чаще используется для выявления манипуляций с данными, причем не только в контексте финансовых махинаций, но и во всех тех случаях, к которым этот закон применим. В 2006 году Скотт де Марчи и Джеймс Гамильтон из Университета Дьюка написали, что предоставленные промышленными предприятиями сведения об уровне выброса свинца и азотной кислоты не удовлетворяют закону Бенфорда, а это говорит о вероятности искажения информации. На основании закона Бенфорда политолог Мичиганского университета Уолтер Мибейн заявил о возможной фальсификации результатов президентских выборов в Иране. Мибейн проанализировал все протоколы голосования и обнаружил существенные расхождения в количестве голосов за Махмуда Ахмадинежада с законом Бенфорда, тогда как в результатах его соперника, сторонника реформ Мир-Хосейна Мусави, никаких отклонений от этого закона не наблюдалось. «Самое простое объяснение, — писал Мибейн, — состоит в том, что в результаты Ахмадинежада были искусственным образом включены дополнительные голоса, тогда как результаты Мусави остались нетронутыми». Ученые используют закон Бенфорда и в качестве инструмента диагностики. Так, во время землетрясений верхние и нижние значения показаний сейсмографа подчиняются данному закону. Малколм Сэмбридж из Австралийского национального университета проанализировал две разные сейсмограммы, на которых было зафиксировано землетрясение в Индонезии в 2004 году, — одна была записана в Перу, а другая в Австралии. Данные, отображенные на первой сейсмограмме, полностью соответствовали закону Бенфорда, тогда как на второй имели место небольшие отклонения. Сэмбридж объяснил это тем, что в районе Канберры могло произойти незначительное сейсмическое возмущение. Так проверка данных на соответствие закону первой цифры позволила выявить землетрясение, которое осталось незамеченным.

Цифра 1 встречается чаще цифры 2 не только на первой, но и на второй, третьей, четвертой и фактически любой позиции в записи числа. На представленном ниже рисунке продемонстрирована частотность вторых цифр в процентном выражении (среди которых есть теперь и цифра 0). Различия между этими показателями не столь ощутимы, как в случае первых цифр, но их все же можно использовать в целях диагностики, скажем в процессе анализа финансовых данных и результатов выборов. По мере продвижения к следующим позициям данные о частоте появления цифр стремятся к одному значению. Следовательно, закон Бенфорда касается не только первых цифр. В мире действительно гораздо больше единиц!

В суде Доррелла часто просят обосновать закон Бенфорда. В таких случаях Даррелл становится перед лекционной доской и начинает считать от единицы и далее, записывая названные цифры. При этом он чувствует себя школьным учителем, проводящим урок математики. «Это просто выводит из себя судью и адвоката», — иронизирует он.

Мы можем сделать то же самое. Вот числа от 1 до 20:

1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20

Больше половины этих чисел начинаются с цифры 1, поскольку от 11 до 19 все числа начинаются с единицы. Продолжаем считать. Где бы мы ни остановились, чисел с первой цифрой 1 будет не меньше, чем чисел с первой цифрой 2, поскольку для того, чтобы добраться до второго десятка, второй сотни или второй тысячи, необходимо назвать все числа первого десятка, первой сотни и первой тысячи. Точно так же чисел с первой цифрой 2 будет не меньше, чем чисел с первой цифрой 3 и т. д., вплоть до чисел с первой цифрой 9. Такое обоснование помогает понять закон Бенфорда на интуитивном уровне, и его вполне достаточно для суда как государственного органа, а вот для суда математики требуется более строгое доказательство.

Одно из самых поразительных свойств закона Бенфорда — что последовательность цифр не зависит от единицы измерения. Когда массив финансовых данных подчиняется закону Бенфорда в случае, если они выражены в фунтах, он будет подчиняться этому закону и после их конвертации в доллары. Если массив географических данных соответствует закону Бенфорда в километрах, он будет соответствовать ему и в случае их представления в милях. Это свойство, обозначаемое термином «масштабная инвариантность», верно всегда, поскольку числа, взятые из газет, банковских счетов и атласов мира показывают одно и то же распределение первых цифр независимо от используемых систем измерения и валюты.

Для перевода расстояния из миль в километры необходимо умножить его на 1,6; для конвертации денежной суммы из фунтов в доллары ее тоже следует умножить на фиксированное число, соответствующее текущему обменному курсу. Простейший способ понять масштабную инвариантность закона Бенфорда сводится к анализу поведения чисел в случае их умножения на два. Если число, начинающееся с цифры 1, умножить на 2, результат будет начинаться с цифры 2 или 3. (Например, 12 × 2 = 24; 166 × 2 = 332.) Если число, начинающееся с цифры 2, умножить на 2, первой цифрой произведения будет 4 или 5. (Например, 2,1 × 2 = 4,2; 25 × 2 = 50.) Первые две строки представленной ниже таблицы показывают, что происходит с первой цифрой числа в случае его умножения на два.

Первая цифра числа n/Первая цифра числа 2n/Процент чисел в распределении Бенфорда

1/2 или 3/30,1

2/4 или 5/17,6

3/6 или 7/12,5

4/8 или 9/9,7

5/1/7,9

6/1/6,7

7/1/5,8

8/1/5,1

9/1/4,6

Предположим, S — это массив данных, подчиняющихся закону Бенфорда. Давайте умножим на два каждое число, входящее в массив S, и обозначим новый массив чисел буквой T. Согласно таблице, числа из массива S, начинающиеся с цифры 5, составляют 7,9 процента от общего количества чисел в массиве; числа, первая цифра которых 6, — 6,7 процента, 7, 8 и 9 — 5,8; 5,1 и 4,6 процента соответственно. Следовательно, в массиве S доля чисел, начинающихся с 5, 6, 7, 8 или 9, равна 7,9 + 6,7 + 5,8 + 5,1 + 4,6 = 30,1 процента. Если числа, первая цифра которых 5, 6, 7, 8 или 9, умножить на два, произведение всегда будет начинаться с цифры 1, как показано в таблице. Другими словами, 30,1 процента чисел в массиве T начинается с цифры 1, что соответствует закону Бенфорда!

Данная закономерность имеет место и в случае других цифр. Умножение на 2 сначала нарушает, а затем восстанавливает действие закона Бенфорда, но распределение первых цифр при этом сохраняется. Я выбрал умножение на 2, поскольку это самый простой множитель, но с таким же успехом можно было бы взять в качестве множителя 3, или 1,6, или число π, или какое-либо еще — закон Бенфорда действовал бы, так или иначе. Под любое изменение масштаба распределение Бенфорда перенастраивается, как будто это делает рука самого Бога.

В течение нескольких десятилетий после открытия закона Бенфорда он считался не более чем аномалией, трюком из шоу иллюзионистов, нумерологией, но никак не математикой. Однако в 90-х годах ХХ столетия профессор Технологического института штата Джорджия Тед Хилл решил найти теоретическое обоснование распространенности этого закона. Сейчас ученый живет в городе Лос-Осос; это чуть дальше вдоль побережья Тихого океана от того места, где обосновался Даррелл Доррелл. Тед — бывший солдат, высокий, широкоплечий стройный мужчина с бритой головой и седыми усами, сохранивший армейскую выправку. Когда я приехал к нему, он повел меня в небольшой деревянный домик в конце сада, из окон которого открывался вид на океан и два национальных парка. В камине потрескивали дрова. Тед назвал этот домик «математической дачей». Это глобальный центр исследования закона Бенфорда.

Первый серьезный результат, полученный Тедом Хиллом, — это доказательство того, что при существовании некой универсальной закономерности распределения первых цифр оно подчиняется исключительно закону Бенфорда. То есть распределение первых цифр по Бенфорду — единственное, которое не меняется в случае изменения масштаба. Этот вывод позволил Теду изобрести игру, в которую мы с ним сыграли.

«Каждый из нас выбирает число, — объяснил мне Тед. — Затем мы их перемножаем. Если произведение начинается с цифры 1, 2 или 3, значит, выигрываю я; если с цифры 4, 5, 6, 7, 8 или 9 — то вы».

На первый взгляд может показаться, что в этой игре явный перевес в мою пользу, поскольку в моем распоряжении шесть цифр, тогда как у Теда — всего три. Тем не менее в большинстве случаев Тед будет выигрывать, выбирая числа в соответствии с распределением Бенфорда, другими словами — если на протяжении нескольких игр он будет выбирать числа, начинающиеся с цифры 1, — то в 30,1 процента случаев, цифру 2 — в 17,6 процента случаев и т. д. Если Тед будет действовать таким образом, от выбранного мной числа не зависит, какая цифра окажется первой: в 30,1 процента случаев это будет цифра 1, в 17,6 процента случаев — цифра 2, в 12,5 процента случаев — цифра 3. Сумма этих трех показателей составляет 60,2 процента; следовательно, Тед выиграет в 60,2 процента случаев. В эту игру хорошо играть на деньги: даже если в вашем распоряжении только 1, 2 и 3 в качестве целевых цифр, ваши шансы на победу гораздо выше, чем в случае цифр 4, 5, 6, 7, 8 и 9, хотя поначалу кажется, что это не так.

Эта игра помогает объяснить, почему многие массивы данных, формирующиеся естественным образом, подчиняются закону Бенфорда. Предположим, мы с Тедом сыграли в эту игру сто раз; у него были числа (a1, a2, a3 … a100), а у меня — числа (b1, b2, b3 … b100). Мы знаем, что если числа Теда удовлетворяют закону Бенфорда, то результат умножения его чисел на мои (a1 × b1, a2 × b2, a3 × b3 … a100 × b100) также подчиняется этому закону. Следовательно, если мы умножим эти числа на еще один набор случайно выбранных чисел (c1, c2, c3 … c100), для того чтобы получить еще один массив чисел (a1 × b1 × c1, a2 × b2 × c2, a3 × b3 × c3 … a100 × b100 × c100), этот массив тоже будет соответствовать закону Бенфорда. Дело в том, что, сколько бы массивов данных мы ни умножали друг на друга, достаточно, чтобы хотя бы один из них удовлетворял закону Бенфорда, для того чтобы этому закону подчинялся и массив результатов умножения. Другими словами, закон Бенфорда настолько заразителен, что наличие в мультипликативной цепочке единственного массива данных, удовлетворяющего ему, влияет на общий результат. Поскольку многие явления (такие как цены акций, численность населения, длина рек и т. д.) формируются под воздействием повышения или снижения различных показателей, обусловленного множеством независимых случайных факторов, это объясняет широкую распространенность неравномерного распределения первых цифр.

Самая известная теорема Теда Хилла гласит:

Если взять случайные выборки из случайным образом выбранных массивов данных, то чем больше количество массивов и выборок, тем ближе к закону Бенфорда будет распределение первых цифр в смешанной выборке.

Эта теорема позволяет определить, когда может иметь место закон Бенфорда. «Если предположение о том, что несмещенные случайные выборки взяты из случайных распределений верно, тогда эти данные должны полностью подчиняться закону Бенфорда», — утверждает Тед. Этот вывод объясняет, почему газеты так хорошо иллюстрируют действие закона первой цифры. Числа, которые появляются в новостях, — это, по сути, произвольные выборки, взятые из случайных массивов данных, таких как цены акций, температура воздуха, распределение голосов во время выборов или результаты лотереи. Хотя многие из этих массивов данных могут не удовлетворять закону Бенфорда, чем больше массивов мы проанализируем и чем больше выборок включим в анализ, тем ближе к распределению Бенфорда будет смешанная выборка. Если продолжать процесс до бесконечности, смешанные выборки будут подчиняться закону Бенфорда с точностью до 100 процентов.

Я спросил Теда, есть ли у его теоремы простое интуитивное объяснение. В ответ он покачал головой. Тед доказал эту теорему, применив эргодическую теорию — передовую область науки, которая представляет собой сочетание теории вероятности и статистической физики и изучается только в аспирантуре. Несмотря на достаточно понятную формулировку, у теоремы нет простого доказательства. «Во всяком случае, такое доказательство не обнаружено», — поясняет Тед.

Тем не менее работа Теда Хилла дает математическое обоснование для использования закона Бенфорда при рассмотрении судебных дел. Впоследствии к Теду начали обращаться за советом ученые, которые хотели знать, соответствуют ли их данные закону первой цифры. По словам Хилла, самая необычная просьба поступила от одной христианской организации. В ней обнаружили, что процентное содержание различных минералов в морской воде и земной коре подчиняется закону Бенфорда. Это открытие так поразило и удивило ее членов, что, по их словам, это мог быть только продукт разумного замысла. Так не согласится ли Тед выступить в рамках их кампании за преподавание учения о сотворении мира в техасских школах?

Теду нравилось выискивать примеры действия закона Бенфорда в чистой математике.

Последовательность, каждый член которой в два раза больше предыдущего:

1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024…

Последовательность, каждый член которой в три раза больше предыдущего:

1, 3, 9, 27, 81, 243, 729, 2187, 6561, 19 683…

Последовательность, каждый член которой поочередно умножается на два и на три:

1, 2, 6, 12, 36, 72, 216, 432, 1296, 2592, 7776, 15 552…

Все эти последовательности подчиняются закону Бенфорда.

То же самое можно сказать и о последовательности чисел Фибоначчи, в которой каждое следующее число представляет собой сумму двух предыдущих:

1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144…

Чем больше членов последовательности вы анализируете, тем ближе распределение первых цифр чисел, входящих в нее, к распределению Бенфорда.

Тед также доказал, что любая последовательность, которая начинается со случайного числа и формируется по принципу «удвоить и прибавить 1», соответствует закону Бенфорда. То же самое касается и любой последовательности, начинающейся с произвольного числа и формирующейся по принципу «возвести в квадрат». Но, когда Тед приступил к анализу последовательности чисел, построенной по принципу «возвести в квадрат и прибавить 1», он обнаружил нечто неожиданное.

«С какого бы числа ни начиналась такая последовательность, она почти всегда подчиняется закону Бенфорда. Однако при некоторых исходных числах этого не происходит, причем найти эти числа довольно трудно. Сперва мне казалось, что их нет. Я думал: “Этого не может быть! Это просто невозможно!” Но мы все же нашли одно число, обладающее поразительным свойством: когда оно является первым членом последовательности, в которой каждый следующий член на единицу больше квадрата предыдущего, то каждое число такой последовательности начинается с цифры 9. Это просто невероятно. Это сбой в системе».

Вот это число: 9,94962308959395941218332124109326…

На самом деле для последовательности чисел, сформированной по принципу «возвести в квадрат и прибавить 1», существует бесконечное множество таких исходных чисел, но они размещены на цифровой оси настолько редко, что вероятность выбрать какое-то из них случайным образом равна нулю. По словам Теда, у закона Бенфорда масса секретов, которые еще предстоит открыть.

Закон Бенфорда — один из самых ярких примеров того, как процесс, в котором фигурирует большое количество неизвестных случайных факторов, может образовать очень простую числовую закономерность. Точная последовательность событий, приводящих к росту или падению курса акций или увеличению численности населения города, может оказаться слишком сложной для понимания, но результат этих событий хорошо упорядочен и довольно прост. Не исключено, что у нас не получится составить прогноз в отношении курса конкретных акций или численности населения определенного города, но мы можем быть уверены в одном: в целом эти показатели всегда подчиняются закону Бенфорда.

В книгах тоже часто встречаются простые числовые закономерности. Возьмем в качестве примера книгу Джеймса Джойса Ulysses («Улисс»). В 40-х годах ХХ столетия исследователи Висконсинского университета на протяжении четырнадцати месяцев составляли список слов, которые использовались в этой книге. Они напечатали ее на гуммированной бумаге, вырезали отдельные слова и наклеили их на тысячах отдельных листков. Затем упорядочили эти слова по убыванию частоты их встречаемости в тексте. Полученные данные представляли интерес не только для студентов, изучающих лингвистику, но и для психологов, работающих с лексическими ассоциациями, а также для таких нестандартно мыслящих ученых, как профессор Гарвардского университета Джордж Кингсли Ципф, который выявил потрясающую закономерность.

Слово/Ранг (порядковый номер)/Частота

I («я»)/10/2653

Say («сказать»)/100/265

Bag («сумка»)/1000/26

Orangefiery («оранжево-пламенный»)/10 000/2

Оказалось, что десятое по частоте употребления слово встречается в тексте почти в десять раз чаще, чем сотое, почти в сто раз чаще, чем тысячное, и почти в тысячу раз чаще, чем десятитысячное. Джеймс Джойс не выбирал слова с такой арифметической точностью специально; тем не менее закономерность, которой подчиняется их встречаемость в его книге, очевидна.

Если говорить языком математики, частота встречаемости слов в романе «Улисс» приближенно подчиняется следующему закону:

частота × ранг = 26 500

Эту формулу можно привести к такому виду:

В общем виде данное уравнение выглядит так:

Следовательно, частотность употребления того или иного слова обратно пропорциональна его рангу (порядковому номеру) в списке, упорядоченном по убыванию частоты. Другими словами, если ранг слова в n раз больше, то частота его использования в n раз меньше.

Изучив другие тексты, Ципф пришел к выводу, что во всех книгах на всех языках частота встречаемости слов и их порядковый номер в частотном списке находятся в обратной зависимости, но с небольшим уточнением:

Это уравнение известно как закон Ципфа. (Когда два числа записаны в форме xy , мы говорим «x в степени y», и это значит, что число x умножается само на себя y раз. Как мы знаем со школьных лет, 42 = 4 × 4, а 23 = 2 × 2 × 2. Однако число y может быть не только целым числом. Следовательно, 21,5 означает, что число 2 умножается само на себя 1,5 раза, а это равно 2,83. Чем ближе значение числа y к 1, тем ближе xy к числу x.)

Ципф обнаружил, что значение константы a всегда стремится к 1 независимо от того, кто автор книги и каково ее содержание. То есть зависимость между частотой встречаемости слов и их рангом всегда очень близка к обратно пропорциональной зависимости. В случае романа «Улисс» значение a равно 1.

Я считаю закон Ципфа чрезвычайно увлекательным. Он раскрывает заманчиво простую математическую закономерность, определяющую выбор слов. Я решил выяснить, соблюдается ли этот закон в книге, которую вы сейчас читаете. Для подсчета частотности слов я воспользовался компьютерной программой, а не гуммированной бумагой и ножницами. Просматривая частотную таблицу, я увидел, что частота встречаемости слов действительно обратно пропорциональна их порядковому номеру в таблице. Самое распространенное слово, употребляемое мною в книге («the»), встречается в десять раз чаще, чем десятое по частоте слово «was», примерно в сто раз чаще, чем сотое по частоте слово «who», и в тысячу раз чаще, чем тысячное слово «spirals».

Когда я составил на основе данных о частоте и ранге слов график (первый график, представленный ниже), оказалось, что соответствующие точки лежат близко к координатным осям. График, отображающий обратно пропорциональную зависимость, всегда представляет собой L-образную кривую. Сначала кривая резко снижается, а затем быстро выравнивается и переходит в своего рода «длинный хвост». Это говорит о том, что одни слова встречаются в тексте в огромном количестве, а другие почти не используются. (На самом деле во всех текстах, независимо от их объема, около 50 процентов слов употребляются только один раз. В данной книге таких слов 51 процент.)

Распределение частотности слов в книге «Алекс в Зазеркалье»

На нижнем графике отображены те же данные, но изменен масштаб. Расстояние от 1 до 10, от 10 до 100 и от 100 до 1000 теперь одинаковое на обеих осях, другими словами, мы имеем двойной логарифмический масштаб. График, напоминающий провисший кабель, как по волшебству превратился в туго натянутую струну. Появился некий математический порядок: точки графика образуют почти идеальную прямую.

Прямая линия на графике, построенном в двойном логарифмическом масштабе, — доказательство того, что эти данные подчиняются закону Ципфа (в Приложении 2 я объясню почему). С математической точки зрения прямая линия более полезна, чем кривая с длинным хвостом, поскольку ее свойства легче анализировать. В частности, у прямой есть постоянный градиент. Мы вернемся к понятию градиента немного позже, а пока вам нужно знать только то, что градиент — это степень наклона: отношение расстояния, покрытого прямой по вертикали, к расстоянию по горизонтали. Если нарисовать линию наилучшего соответствия и определить ее градиент, он и будет представлять собой константу a в уравнении закона Ципфа. Я рассчитал градиент линии на расположенном выше графике. Он чуть больше единицы, а это значит, что по сравнению с Джеймсом Джойсом я чаще использую самые распространенные слова и реже — наименее распространенные.

При более близком рассмотрении не все точки на графике попадают на прямую линию. Некоторые отклоняются от нее, особенно примерно двадцать слов, встречающихся в тексте чаще всего. Однако в большинстве случаев точки находятся очень близко к этой линии. Поразительно то, что порядковый номер подавляющего количества слов в этой книге позволяет достаточно точно определить частоту их использования, и наоборот.

Профессор Ципф обнаружил такую же обратно пропорциональную зависимость еще в одной книге — книге переписи населения США 1940 года. Однако в этот раз он подсчитывал не частотность слов, а численность населения крупных американских городов.

Муниципальный район/Ранг/Население

Нью-Йорк / северо-восток Нью-Джерси/1/12 миллионов

Кливленд/10/1,2 миллиона

Гамильтон/Мидлтаун/100/0,11 миллиона

В это трудно поверить, но и здесь прослеживается та же закономерность. В Нью-Йорке (самом крупном городе США) численность населения в десять раз больше, чем в Кливленде (десятом по величине городе), и в сто раз больше, чем в Гамильтоне (сотом по величине городе). Никто не предлагал американцам расселяться с такой точностью. Тем не менее их выбор подчинялся строгой закономерности. Это происходит и сейчас. На самом деле все мы поступаем именно так. На представленных ниже графиках в двойном логарифмическом масштабе отображены данные о численности населения американских городов и их ранге (порядковом номере), взятые из отчетов о переписи населения США 2000 года, а также данные о численности населения крупнейших городов мира.

Распределение численности населения крупнейших городов США в 2000 году (график сверху) и крупнейших городов мира в 2013 году (график снизу)

Все точки стремятся к прямой линии, как послушные муравьи. Это означает, что здесь, как и прежде, применимо все то же общее уравнение:

На этот раз Ципф тоже пришел к выводу, что для городов и стран значение константы a почти или равно 1. В случае американских городов это значение составляет 0,947, для крупнейших городов мира — 1,156, а в случае переписи населения США 1940 года равно 1.

Безусловно, имеются и отклонения, особенно в наиболее крупных странах и городах. Например, в действительности в Индии (второй самой густонаселенной стране мира) жителей больше, чем можно было бы ожидать, опираясь на закон Ципфа. Однако волатильность (изменчивость значений) в начале упорядоченного списка неизбежна, поскольку там намного меньше данных. Можно предположить, что города и страны обходят друг друга в рейтинге по мере изменения численности населения под влиянием экономических, социальных и экологических факторов. Когда подобные изменения происходят в странах, занимающих самые высокие места в списке, отклонение от прямой линии становится гораздо заметнее. Тем не менее такой разброс данных в верхней части графика не должен приуменьшать важности точного расположения точек далее вниз по линии. Из этого следует, что частота встречаемости слов, а также численность населения городов и стран подчиняются универсальному закону.

Для Ципфа обнаружение одной и той же элементарной математической закономерности в разных контекстах было равносильно духовному пробуждению. «В явлениях повседневной жизни мы находим единство, упорядоченность и равновесие, внушающие нам веру в высшую разумность всего сущего, целостность которого пребывает за пределами наших полномочий и понимания», — писал Ципф. Он предложил принцип наименьших усилий в качестве теоретической базы для своих эмпирических наблюдений. Мы часто используем ограниченное количество слов, потому что нашему мозгу так легче; мы живем в больших городах, потому что нам так удобнее. Однако Ципф так и не смог предоставить убедительное математическое обоснование закона, как, впрочем, и никто сто лет спустя. Многие пытались это сделать, и хотя некоторые даже добились определенных успехов в данном направлении, причина, почему закон действует, по-прежнему остается загадкой. Математические модели часто подвергают критике за то, что они слишком упрощают сложные закономерности. В случае закона Ципфа верно обратное утверждение: математические модели невероятно сложны, а закономерность настолько проста, что ее может понять даже ребенок.

В начале ХХ века итальянский экономист Вильфредо Парето заявил, что распределение богатства среди населения подчиняется следующему закону:

Очевидно, что с математической точки зрения закон Парето эквивалентен закону Ципфа. Если составить список всех граждан страны в порядке уменьшения их богатства, график распределения последнего будет выглядеть точно так же, как представленный выше график частоты использования слов в этой книге. В целом самый богатый человек страны существенно богаче второго наиболее состоятельного человека, а тот, в свою очередь, намного богаче (хотя и чуть меньше, чем в предыдущем случае) третьего наиболее состоятельного человека, который гораздо богаче (хотя и чуть меньше, чем в предыдущем случае) четвертого наиболее состоятельного человека и т. д. В общем, к категории богачей относится крохотное меньшинство населения, тогда как его подавляющее большинство живет в бедности. Парето вывел этот закон на основании данных из многих стран и череды столетий. И он по-прежнему актуален.

Обратно пропорциональная зависимость описывает ситуации, в которых имеет место предельное, вопиющее неравенство. В случае закона Ципфа крохотный процент слов выполняет почти всю работу. В случае закона Парето в руках крохотного процента населения сосредоточена основная часть капитала. В 1906 году Парето написал, что в Италии около 20 процентов людей владеют 80 процентами земли. Это меткое замечание вошло в массовую культуру как «принцип Парето», или закон 80/20, согласно которому 20 процентов причин порождает 80 процентов следствий — фраза, отражающая несправедливость жизни. По мнению Ричарда Коха, автора книги о законе Парето, 20 процентов сотрудников обеспечивают 80 процентов результата; 20 процентов покупателей приносят 80 процентов прибыли; 80 процентов счастья мы испытываем за 20 процентов времени. Ричард Кох пишет, что закон 80/20 — это ключ к управлению своей жизнью, поскольку мы можем преодолеть трудности современного мира только одним способом: сосредоточившись на 20 процентах самых важных вещей. Закон Парето хорошо запоминается благодаря своей арифметической точности: 80 + 20 = 100. Однако такая точность не всегда применима к математической модели, описываемой этим законом, так как обратно пропорциональная зависимость во многих случаях носит приближенный характер.

Как закон Парето, так и закон Ципфа гласят, что одна величина обратно пропорциональна определенной степени другой величины.

Если переменные величины — x и y, то общая формула этой математической зависимости выглядит так:

Уравнения данного типа обозначаются термином «степенной закон». Имена Ципфа и Парето носят два самых известных закона подобного рода, но за последние годы действие степенных законов проявилось в очень большом количестве самых разных ситуаций. Например, по результатам проведенного в Швеции опроса по поводу сексуальных привычек была установлена такая закономерность:

процент мужчин, имевших минимум n половых партнеров на протяжении прошлого года

Символ ≈ говорит не о том, что шведские женщины предпочитают мужчин с волнистыми усами. Он означает «приблизительно равно» и используется здесь потому, что данное уравнение обеспечивает наилучшее приближение. Примерно один из тысячи шведских мужчин имеет в течение года двадцать половых партнеров, в то время как большинство — только одного. Если продолжить линию максимального приближения, то получится, что где-то один из десяти тысяч мужчин имеет около шестидесяти половых партнеров в год.

В любви — как на войне. Исследователи, изучавшие случаи насилия в зонах военных конфликтов, выявили следующую закономерность:

процент инцидентов во время гражданской войны в Колумбии, в которых произошло не менее n смертей и ранений

Массовая гибель людей в результате военных действий наблюдается гораздо реже по сравнению с числом единичных случаев. Подобные выводы были сделаны в ходе анализа и сравнения данных о разных войнах. В мире велось всего несколько войн, повлекших за собой гибель миллионов людей; сотни тысяч людей лишились жизни в чуть большем количестве войн; еще больше войн унесло жизни десятков тысяч людей и т. д.

Чарльз Дарвин написал за свою жизнь тысячи писем, многие из которых представляли собой ответ на полученные письма. На большинство из них он отвечал в первый же день, а чтобы ответить на другие, ему понадобились годы:

вероятность того, что Чарльз Дарвин ответит на письмо за n дней

Мы отвечаем на электронные письма по такой же схеме: на большинство даем ответ немедленно, тогда как некоторые лежат в папке «Входящие» целую вечность.

Японские ученые, оценив объем продаж книг за период с 2005 по 2006 год, пришли к следующему выводу:

процент от общего объема продаж книги с порядковым номером n в Японии в 2005–2006 годах

Иными словами, несколько книг становятся лидерами продаж, тогда как другие так и остаются непроданными. В киноиндустрии в основе модели ведения бизнеса лежит та же закономерность: незначительное количество фильмов становятся блокбастерами, тогда как большинство терпят крах в прокате. В обоих случаях переход от успеха к неудаче математически предсказуем.

Мы получили четыре представленных выше уравнения, отобразив фактические данные на графике, выполненном в двойном логарифмическом масштабе (эти графики размещены чуть ниже), и измерили градиент линий наилучшего соответствия. (Снижение линии на последнем участке данных, полученных в Японии, объясняется нехваткой места на полках: книжные магазины не могут вместить все книги, которые теоретически могли бы быть у них в наличии.) Прямая линия на графике с логарифмическим масштабом по обеим осям означает, что здесь имеет место степенной закон, а градиент этой линии — константа a в уравнении степенного закона. Я не указывал значения константы k в каждом из уравнений, поскольку она зависит от размера выборки и не влияет на форму кривой, поэтому не представляет для нас интереса. Не забывайте о том, что, если бы в каждом из этих случаев данные были отображены на графике в нормальном масштабе, мы получили бы L-образную кривую с резким снижением в начале и длинным хвостом.

Данные о поведении шведских мужчин, колумбийских боевиков, Чарльза Дарвина и японских покупателей книг подчиняются степенному закону

Я привожу так много примеров для того, чтобы вы увидели мир таким, каким его видели Джордж Ципф, Вильфредо Парето и Ричард Кох. Если мы возьмем, к примеру, распределение роста в произвольной группе людей, мы сможем вычислить его среднее значение, поскольку вокруг него группируется больше всего чисел. Например, средний рост британских мужчин составляет 175 сантиметров. Но что касается частоты употребления слов, богатства, количества половых партнеров, войн, времени для ответа на письма, книг и фильмов, то тут мы не можем говорить о среднем значении. Понятие средней величины неприменимо к употреблению слов, распределению богатства, продаже книг или кассовым сборам от проката фильмов. Когда речь идет о поведении человека, мы живем в мире, смещенном в сторону экстремальных значений.

Степенные законы широко распространены не только в гуманитарных, но и в естественных науках. Магнитуда землетрясения обратно пропорциональна количеству землетрясений данной магнитуды; размер лунного кратера обратно пропорционален числу кратеров данного размера; если разбить замерзшую картофелину о стену, размер каждого фрагмента будет обратно пропорционален количеству фрагментов этого размера. Распространенность степенных законов в физике объясняет, почему многие ученые, исследующие эти законы в социальных системах, начинали свою карьеру в качестве физиков. Один из таких ученых — Альберт-Ласло Барабаши, авторитетный профессор Северо-Восточного университета в Бостоне.

В настоящее время Барабаши занимается изучением сетей. В определенных сетях, таких как интернет, принята математическая теория, которая объясняет причины появления степенных законов. Например, популярность сайтов в целом подчиняется степенному закону, так же как и рейтинг пользователей «Твиттера» по количеству подписчиков. «Тот факт, что степенные законы столь типичны, универсальны и легко узнаваемы, приводит в недоумение, — говорит Барабаши. — Казалось бы, в мире должно быть больше разнообразия!»

Предположим, на рисунке слева изображена модель сети, состоящей из трех узлов и двух связей. В качестве узлов могут выступать люди или сайты, а в качестве связей — любой тип соединения между ними. Барабаши утверждает, что степенной закон имеет место в случае роста сети по принципу предпочтительного присоединения. Это означает, что, когда в сети появляется новый узел, вероятность его связи с любым другим узлом, уже включенным в сеть, пропорциональна количеству связей, имеющихся у этого узла. Другими словами, узлы с большим числом связей получают еще больше связей. Богатые становятся богаче. Известные еще известнее. У узла с наибольшим количеством связей самые высокие шансы на получение новых связей, и чем больше связей у него появляется, тем привлекательнее он становится.

Если маленькая сеть начнет расти по принципу предпочтительного присоединения, то со временем она будет напоминать крупную сеть

Если бы сеть, расположенная сверху, расширялась по принципу предпочтительного присоединения, после включения в нее пары сотен новых узлов она выглядела бы так же, как сеть снизу. У большинства узлов этой сети есть только одна связь, и всего несколько узлов (называемых хабами) имеют несколько связей. Если упорядочить узлы по числу связей и построить график, получится уже знакомая вам кривая с длинным хвостом. «Степенной закон вступает в игру каждый раз, когда вы принимаете решение [о том, с кем устанавливать связь]», — утверждает Барабаши. Если включить в сеть несколько миллионов узлов по принципу предпочтительного присоединения, то она будет выглядеть точно так же, как карта связей между пользователями «Твиттера» или модель интернет-пространства.

Одна из причин столь широкой распространенности сетей со степенным распределением узлов по количеству связей кроется в их особой устойчивости. Если в такой сети вы удаляете узел случайным образом, это, скорее всего, будет второстепенный узел (поскольку таких узлов гораздо больше), а не хаб, поэтому в целом на всей сети это особо не скажется. И наоборот, степенные сети становятся очень уязвимыми, если происходит атака на хаб. Иными словами, если выйдет из строя мой сайт, этого никто не заметит, кроме меня самого. Однако, если хотя бы на пять минут отключится сайт Google, наступит глобальный хаос.

Интерес к степенным законам объясняется тем, что они позволяют выстроить на удивление простую математическую модель для целого ряда сложных явлений. Кроме того, их очень легко обнаружить. Как мы уже видели, две переменные подчиняются степенному закону, если точки на графике в двойном логарифмическом масштабе образуют прямую линию.

Однако в последнее время все чаще высказываются предположения о том, что ученые слишком спешат с выводами о присутствии степенного закона в полученных ими данных, поскольку в ряде случаев точки данных образуют на графике кривые линии, и их необходимо описывать другими уравнениями. Безусловно, это важная тема для обсуждения, но она выходит за рамки данной книги. Тем не менее у степенных законов есть один аспект, который отрицать невозможно: они обладают одним удивительным математическим свойством.

Рассмотрим уравнение степенного закона: . Построив график этого уравнения для значений x от 2 до 10, мы получим первую кривую, изображенную ниже; график уравнения для значений x от 20 до 100 даст нам вторую кривую, изображенную ниже.

Кривая на графике в двух масштабах

Вы заметили разницу? Кривые абсолютно одинаковы. На самом деле, если построить кривую от n до 5n для любого значения n, она будет выглядеть точно так же, как на рисунке выше. Кривые для значений x от a до b всегда одинаковы, если отношение a/b представляет собой постоянную величину. Степенные законы раскрывают одну и ту же закономерность в любом масштабе, как бы далеко по хвосту вы ни продвинулись.

Если говорить о длинных хвостах, то такой был у Годзиллы.

Рост этого японского монстра (мутировавшего динозавра) — около 100 метров, что примерно в 50 раз больше роста высокого взрослого человека. А теперь представьте себе человека в 50 раз выше обычного роста, но с телом такой же формы. Этот увеличенный человек был бы в 50 раз шире и в 50 раз толще, а значит, в 50 × 50 × 50 = 125 000 раз тяжелее, чем раньше. Однако его кости в поперечном сечении увечились бы только в 50 × 50 = 2500 раз, стало быть, каждый квадратный дюйм его костей должен был бы поддерживать в 50 раз больше веса. Кости гигантского человека сломались бы при первой же попытке сделать шаг. Годзиллу постигла бы та же участь.

Согласен, нет ничего утомительнее, чем ворчание умника, утверждающего, что в реальном мире такой монстр просто не выжил бы. Тем не менее этот аргумент объясняет, почему животные разных размеров имеют разную форму. Чем крупнее животное, тем толще должны быть его кости относительно роста. К такому выводу впервые пришел Галилей в 1638 году. У слона кости пропорционально толще, чем у человека, кости которого, в свою очередь, пропорционально толще костей собаки. Галилей понял, что у более крупных животных кости толще, потому что им приходится выдерживать больше веса в расчете на размер поперечного сечения кости.

Наблюдение Галилея можно представить в виде уравнения, в котором фигурируют площадь и объем. Утверждение о том, что площадь объекта в поперечном сечении находится в прямо пропорциональной зависимости от квадрата высоты, тогда как объем — в прямо пропорциональной зависимости от куба высоты, можно выразить двумя уравнениями:

площадь = l (высота)2;

объем = m (высота)3,

где l и m — константы.

Исключив переменную «высота», получим следующее уравнение:

Его можно преобразовать так:

А это уравнение можно отнести к следующему типу:

y = kxa ,

где x и y — переменные, а k и a — константы.

Уравнение данного типа также называется степенным законом. Когда степенной закон выражен в такой форме, говорят, что переменная y находится в прямой пропорциональной зависимости от xa , а когда он представлен в виде уравнения , о котором шла речь выше, переменная y находится в обратной пропорциональной зависимости от xa .

График уравнения степенного закона y = x⅔ размещен ниже. На первом графике в нормальном масштабе кривая по мере повышения выравнивается. Если y — это площадь, а x — объем, то это показывает, что по мере увеличения объема площадь тоже увеличивается, но не так быстро. На графике в двойном логарифмическом масштабе (второй график) степенной закон, отражающий прямо пропорциональную зависимость, дает прямую линию с наклоном вправо.

Кривая y = x⅔ на графике в простом и двойном логарифмическом масштабе

Уравнение степенной зависимости между объемом и площадью обозначается также термином «закон масштабирования», поскольку оно демонстрирует, что происходит с измеримой величиной объекта (в данном случае площадью поперечного сечения) в результате увеличения общего размера.

В 30-х годах ХХ столетия швейцарский зоолог Макс Клайбер измерил вес нескольких видов млекопитающих и их уровень метаболизма (минимальное количество энергии, вырабатываемое животными в состоянии покоя). Когда ученый отобразил полученные данные на графике в двойном логарифмическом масштабе, получилась прямая линия, на основании которой он вывел следующий степенной закон:

скорость обмена веществ ≈ 70 (масса)¾

Этот закон известен как закон Клайбера. Впоследствии биологи расширили его действие на всех теплокровных животных, как показано на представленном ниже рисунке. Скорость обмена веществ растет не так быстро, как масса, а это говорит о том, что чем крупнее животные, тем эффективнее они вырабатывают энергию. Было также выявлено, что жизнь животных подчиняется и многим другим законам масштабирования. Например, продолжительность жизни животных прямо пропорциональна массе в степени ¼, а частота сердечных сокращений обратно пропорциональна массе в степени ¼. Поскольку коэффициент степенного закона — это в большинстве случаев величина, кратная ¼, биологические степенные законы называют законами четвертного степенного масштабирования. Учитывая разнообразие животного мира (размер млекопитающих колеблется от этрусской мыши весом около одного грамма до голубого кита, который в 100 миллионов раз тяжелее), действительно замечательно, что информация о размере животного позволяет так много сказать о нем.

Закон Клайбера

Физик Джеффри Уэст из Института Санта-Фе и биологи Джеймс Браун и Брайан Энквист из Университета Нью-Мексико разработали математическую теорию, которая объясняет эффект четвертного степенного масштабирования Если в общих чертах, то они утверждают, что при рассмотрении любого организма как транспортной системы (кровь поступает в аорту, разветвляющуюся на артерии, которые, в свою очередь, разветвляются на более узкие кровеносные сосуды) ее оптимизация под имеющееся пространство порождает степенной закон. Подробное объяснение данного феномена выходит за рамки материала этой книги, но представляет интерес в данном контексте в связи с другой работой Уэста — изучением организма иного типа: города.

Уэст и его коллеги обнаружили, что масштабирование по степенному закону весьма характерно для маленьких и больших городов. Проанализировав огромное количество экономических и социальных данных и отобразив полученные результаты на графиках в двойном логарифмическом масштабе, они установили, что в США имеют место следующие закономерности:

количество изобретателей = k (численность населения)1,25

совокупная заработная плата = k (численность населения)1,12

количество случаев заболевания СПИДом = k (численность населения)1,23

количество тяжких преступлений = k (численность населения)1,16

В этих уравнениях показатель степени (экспонента) больше 1, а это значит, что чем крупнее город, тем в нем больше изобретателей, совокупной заработной платы, случаев заболеваний СПИДом и тяжких преступлений на душу населения. Здесь налицо пропорциональная зависимость. По всем этим городским индикаторам значение показателей степени составляет примерно 1,2, и такая сосредоточенность вокруг одного значения интересна сама по себе. Исходя из этого, получается, что при увеличении размера города вдвое можно ожидать роста количества изобретателей, совокупной заработной платы, случаев заболеваний СПИДом и тяжких преступлений на душу населения на 15 процентов.

В случае ряда других городских индикаторов показатель степени меньше 1, а это значит, что рост города может привести к сокращению следующих показателей на душу населения:

количество автозаправочных станций = k (численность населения)0,77

длина электрических кабелей = k (численность населения)0,83

При увеличении размера города в два раза количество автозаправочных станций и длина электрических кабелей на душу населения могут сократиться на 15 процентов. Другими словами, в городах имеет место математически прогнозируемая экономия от масштаба — и это происходит во всем мире. «Японские города развивались абсолютно независимо от европейских и американских городов, тем не менее закон масштабирования действует [в каждой стране], — говорит Уэст. — Это наводит на мысль о существовании некой универсальной движущей силы». Уэст убежден, что степенные законы действуют в городах по той же причине, что и в мире животных. Город — это и транспортная сеть. Подобно тому как кровеносная система обеспечивает перемещение крови по толстым, а затем по все более тонким сосудам, города тоже распределяют ресурсы по сети разветвляющихся дорог, кабелей и труб.

Мы сами решаем, где нам жить, на что тратить деньги и как расходовать свое время. Тем не менее, если взглянуть на наше коллективное поведение сквозь призму чисел, становится очевидным, что оно вполне предсказуемо и подчиняется простым, взаимно совместимым математическим законам. Мы так распределены по земному шару, что в 30 процентах больших и малых городов численность населения начинается с единицы, размер городов в целом обратно пропорционален их номеру в упорядоченном по численности населения списке и все города являются версиями друг друга, образованными по принципу степенного масштабирования. Возможно, в чем-то этот мир сложен. Но в чем-то — достаточно прост.

Числа — незаменимый инструмент, помогающий нам понять мир, в котором мы живем. То же самое можно сказать о фигурах. Именно изучение одной из фигур дало начало развитию западной математики.

Название книги

Красота в квадрате Как цифры отражают жизнь и жизнь отражает цифры

Беллос Алекс

2. Длинный хвост закона