В этой главе нас интересует одна очень простая интерпретация «вероятности». Мы должны прежде всего показать, что она удовлетворяет аксиомам главы SI, и затем рассмотреть в порядке предварительного разбора, насколько ее можно сделать соответствующей обычному употреблению слова «вероятность». Я буду называть эту интерпретацию «теорией конечной частоты», чтобы отличить ее от другой формы теории частоты, которой мы займемся ниже.

Теория конечной частоты исходит из следующего определения.

Пусть В будет любой конечный класс, а A — любой другой класс. Мы хотим определить шанс, что член класса В, выбранный наудачу, будет членом класса А, например, что первый человек, которого вы встретите на улице, будет иметь фамилию Смит. Мы определяем эту вероятность как число членов класса В, являющихся также членами класса А, деленное на полное число членов класса В. Мы обозначаем это знаком А/В.

Ясно, что вероятность, определяемая таким образом, должна быть или рациональной дробью, или 0, или 1.

Несколько примеров сделают ясным смысл этого определения. Каков шанс, что какое-либо целое число меньше 10, выбранное наудачу, будет простым числом? Существует 9 целых чисел меньше 10, и 5 из них являются простыми; следовательно, этот шанс равен 5/9. Каков шанс, что в прошлом году в Кембридже в день моего рождения шел дождь, в предположении, что вы не знаете, когда бывает день моего рождения? Если m есть число дней, когда шел дождь, то шанс равен m/365. Каков шанс, что человек, фамилия которого содержится в лондонской телефонной книге, носит фамилию Смит? Для решения этой задачи вы должны сначала сосчитать все записи в этой книге с фамилией «Смит», а затем сосчитать вообще все записи и разделить первое число на второе. Каков шанс, что карта, вытащенная наудачу из колоды, окажется пиковой масти? Ясно, что этот шанс равен 13/52, то есть 1/4. Если вы вытянули карту пиковой масти, то каков шанс, что следующая карта, которую вы вытащите, будет тоже пика? Ответ: 12/51. Каков шанс, что в бросании двух костей выпадет сумма 8? Имеется 36 комбинаций выпадения костей, и в 5 из них сумма будет равна 8, так что шанс выпадения суммы 8 равен 5/36.

Ясно, что в иных элементарных случаях вышеприведенное определение дает результаты, согласующиеся с обычным употреблением. Теперь исследуем, удовлетворяет ли таким образом определяемая вероятность аксиомам.

Буквы p, q и h, употребленные в аксиомах, должны теперь пониматься как обозначающие не предложения, а классы или пропозициональные функции. Вместо выражения «h предполагает p» мы будем иметь выражение «h содержится в p», выражение «p и q " будет обозначать общую часть двух классов p и q, тогда как «p и q» будет классом всех членов, которые принадлежат к каждому или к обоим из двух классов p и q.

Наши аксиомы были следующие:

1. Есть только одно значение p/h. Оно будет истинным, если только h не является нулем, в каковом случае p/h = 0/0. Мы поэтому исходим из того, что h не есть нуль.

2. Возможными значениями p/h являются все реальные числа от 0 до 1. В нашей интерпретации они будут только рациональными числами, если только мы не сможем найти способ распространения нашего определения на бесконечные классы. Этого нельзя сделать просто, поскольку деление не дает единого результата, когда дело касается бесконечных чисел.

3. Если h содержится в p, тогда p/n=1. В этом случае общая часть h и p есть h, следовательно, вышеупомянутое следует из нашего определения.

4. Если h содержится в не-p, тогда p/h = 0. Это ясно по определению, ибо в этом случае общая часть h и p равна нулю.

5. Конъюнктивная аксиома. Согласно нашей интерпретации, она утверждает, что отношение членов h, являющихся членами как p, так и q, есть отношение членов h, являющихся членами p, помноженное на отношение членов p и b, являющихся членами q. Допустим, что число членов h есть а, что число членов, общих для p и h, есть b и что число членов, общих для p, q и h, есть с. Тогда отношение членов h, являющихся членами p и q, есть с/a, отношение членов h, являющихся членами p, есть h/a и отношение членов p и h, являющихся членами q, есть с/b. Таким образом, наша аксиома подтверждается, поскольку с/а = b/a x с/b.

6. Дизъюнктивная аксиома. Согласно нашей настоящей интерпретации, эта аксиома говорит, сохраняя вышеприведенные значения а, b и с и добавляя, что d есть число членов h, являющихся членами или p, или q, или обоих из них, тогда как е есть число членов h, являющихся членами q, что

То есть d = b + e — c, что опять-таки совершенно очевидно.

Таким образом, наши аксиомы удовлетворяются, если h есть конечный класс, не являющийся нулем, за исключением того, что возможные значения вероятности нужно ограничивать рациональными дробями.

Из этого следует, что математическая теория вероятности оказывается действенной при вышеприведенной интерпретации.

Мы должны, однако, исследовать вопрос о сфере применения таким способом определяемой вероятности, которая с первого взгляда кажется чересчур узкой для того употребления, которое мы хотим сделать из вероятности.

Прежде всего мы хотим, чтобы можно было говорить о шансе, что некоторое определенное событие будет иметь некоторые черты, а не только о шансе, что какой-либо рядовой член класса будет иметь их. Например, вы уже осуществили бросание с двумя костями, но я еще не видел результата этого бросания. Какова для меня вероятность, что выпали две шестерки? Мы хотели бы сказать, что эта вероятность равна 1/36, а если наше определение не позволяет нам сказать этого, то оно неадекватно. В таком случае мы сказали бы, что мы рассматриваем событие просто как представителя определенного класса; мы сказали бы, что если А рассматривается просто как член класса В, то шанс, что он принадлежит к классу А, равен А/В. Но здесь не совсем ясно, что значит «рассматривание определенного события просто как члена определенного класса». В таком случае предполагается следующее: нам дается некая характеристика какого-либо события, которая для более полного познания, чем наше, является достаточной, чтобы определить его однозначно; что же касается нашего познания, то мы не имеем способа узнать, принадлежит ли оно к классу А, хотя мы и знаем, что оно принадлежит к классу В. Бросив кости, вы знаете, принадлежит или не принадлежит ваше бросание к классу двойной шестерки, но я этого не знаю. Я знаю только то, что это бросание с двойной шестеркой есть одно из 36 возможных бросаний. Рассмотрим следующий вопрос: каков шанс, что самый высокий человек в Соединенных Штатах живет в штате Айова? Возможно, что кто-нибудь знает этого человека; во всяком случае, существует известный метод, с помощью которого можно узнать, кто этот человек. Если бы этот метод был успешно применен, то имелся бы определенный, не предполагающий вероятности ответ, именно или что он живет в штате Айова, или что он там не живет. Но я не знаю этого. Я ногу только утверждать, что население штата Айова равно числу m, население Соединенных Штатов равно числу n, и сказать, что в отношении этих данных вероятность, что он живет в штате Айова, равна m/n. Таким образом, когда мы говорим о вероятности определенного события, имеющего какую-то характеристику, мы всегда должны специфицировать те данные, по отношению к которым должна быть степень вероятности.

Мы можем обобщить: если дан любой объект о и дано, что а есть член класса В, то мы говорим, что в отношении к этому данному вероятность, что о есть член класса А, равна А/В в ранее определенном смысле. Эта концепция полезна, потому что часто о каком-либо объекте мы знаем достаточно много, чтобы определить его однозначно, не имея при этом достаточных знаний, чтобы определить, имеет ли он то или это свойство. «Самый высокий человек в Соединенных Штатах» есть определенное описание, применимое к одному и только одному человеку, но я не знаю, к какому человеку, к поэтому для меня является открытым вопрос, живет ли он в штате Айова. «Карта, которую я собираюсь вытащить», есть определенное описание, и через момент я буду знать, будет ли это описание относиться к красной или к черной карте, но к какой, я еще пока не знаю. Именно это очень обычное состояние частичного незнания в отношении определенных объектов делает полезным применение вероятности и к определенным объектам, а не только к полностью неопределенным членам классов.

Хотя частичное незнание есть то, что делает вышеприведенную форму вероятности полезной, незнание все-таки не включено в понятие вероятности, которое по-прежнему имело бы тот же смысл для всеведущего существа, как и для нас. Всеведущее существо знало бы, относится ли a к классу A, но все-таки могло бы сказать: по отношению к данному, что а есть B, вероятность того, что а есть A равна A/B.

При применении нашего определения к конкретным примерам в некоторых случаях возможна неясность. Чтобы сделать это понятным, мы лучше воспользуемся языком свойств, чем классов. Пусть класс А определяется свойством f, а класс B свойством y. Тогда мы скажем:

Вероятность того, что о имеет свойство f при том, что оно имеет свойство y, определяется как отношение вещей, имеющих как свойство f, так и свойство y, к вещам имеющим свойство y. Мы обозначаем выражение «a имеет свойство f» знаком «fa». Но если о встречается в «fa» больше одного раза, то возникнет неясность. Например, допустим, что 'fa» обозначает «о совершает самоубийство», то есть «a убивает a». Это есть значение выражения «x убивает x», которое является классом самоубийств; оно также есть значение выражения «о убивает х», которое является классом людей, которых убивает а;, оно также есть значение выражения «x убивает a», которое есть класс людей, которые убивают о. Таким образом, определяя вероятность fa, если «a» встречается в «fa» больше одного раза, мы должны указать, какие из его наступлений должны и какие не должны рассматриваться как значения переменной.

Окажется, что мы может интерпретировать все элементарные теоремы в согласии с вышеприведенным определением. Возьмем, например, предполагаемое Лапласом оправдание индукции. Имеется N+1 сумок, каждая из которых содержит N шаров. Из этих сумок r+1-я содержит г белых шаров и N — r черных шаров. Мы вытащили из одной сумки n шаров, причем все они оказались белыми.

Каков шанс

(a) что мы выбрали сумку с одними лишь белыми шарами?

(b) что следующий шар окажется тоже белым?

Лаплас говорит, что (a) есть (n+1)/(/V+1) и (b) есть (n +1)/(n+2). Иллюстрируем это несколькими числовыми примерами. Во-первых, допустим, что всего имеется 8 шаров, из которых вытащено 4, все белые. Каковы шансы (a), что мы выбрали сумку, содержащую только белые шары, и (b) что следующий вытащенный шар тоже окажется белым?

Пусть Pr представляет собой гипотезу, что мы выбрали сумку с r белыми шарами. Эти данные исключают р0, р1, р2, р3. Если мы имеем p4, то имеется только один случай, когда мы могли вытащить 4 белых, и остается 4 случая вытащить черный и ни одного — белый. Если мы имеем р5, то есть 5 случаев, когда мы могли бы вытащить 4 белых, и для каждого из них был 1 случай вытащить следующий белый и 3 — вытащить черный; таким образом, из р5 мы получаем 5 случаев, где следующий шар будет белым, и 15 случаев, где он будет черным. Если мы имеем P6, то есть 15 случаев выбора 4 белых, а когда они вытащены, остается 2 случая выбрать один белый и 2 случая выбрать черный; таким образом, из P6 мы имеем 30 случаев получения следующего белого и 30 случаев, когда следующий будет черным. Если мы имеем p7, то есть 35 случаев вытащить 4 белых, а после того, как они будут вытащены, останется 3 случая вытащить белый и один — вытащить черный; таким образом, мы получаем 105 случаев вытащить следующий белый и 35 — вытащить черный. Если мы имеем P8, то есть 70 случаев вытащить 4 белых, а когда они будут вытащены, то есть 4 случая вытащить следующий белый и ни одного — вытащить черный; таким образом, из P8 мы получаем 280 случаев вынуть пятый белый и ни одного — вынуть черный. Суммируя, мы имеем 5+30+105+280, то есть 420 случаев, когда пятый шар является белым, и 4+15+30+35, то есть 84 случая, когда пятый шар является черным. Следовательно, разница в пользу белого составляет отношение 420 к 84, то есть 5 к 1; это значит, что шанс, что пятый шар окажется белым, равен 5/6.

Шанс, что мы выбрали сумку, в которой все шары белые, есть отношение числа случаев получения 4 белых шаров из этой сумки ко всему числу случаев получения 4 белых шаров. Первых, как мы видели, 70; вторых 1+5+15+35+70, то есть 126. Следовательно, шанс равен 70/126, то есть 5/9.

Оба эти результата согласуются с формулой Лапласа. Возьмем еще один числовой пример: допустим, что имеется 10 шаров, из которых 5 было вынуто, причем они оказались белыми. Каков шанс р10, то есть того, что мы выбрали сумку с одними белыми шарами? И каков шанс, что следующий шар будет белым?

P5 возможно в 1 случае; если р5, то ни одного случая следующего белого, 5 случаев следующего черного;

P6 возможно в 6 случаях; если р6, то 1 случай следующего белого, 4 случая черного;

P7 возможно в 21 случае; если р7, то 2 случая следующего белого, 3 случая черного;

P8 возможно в 56 случаях; если P8, то 3 случая следующего белого, 2 случая черного;

P9 возможно в 126 случаях; если P9, то 4 случая следующего белого, 1 случай черного;

P10 возможно в 252 случаях; если P10, то 5 случаев следующего белого, 0 случаев черного.

Таким образом, шанс р10 равен 252/(1+6+21+56+126+252), то есть 252/462, то есть 6/11.

Случаи, когда следующий шар может быть белым, составляют 6+21 * 2+56 * 3+126 * 4+252 * 5, то есть 1980, а случаи, когда он может быть черным, составляют 5+4 * 6+3 * 21+2 * 56+126, то есть 330.

Следовательно, разница в пользу белого составляет отношение 1980 к 330, то есть 6 к 1, так что шанс получения следующего белого равен 6/7. Это тоже находится в согласии с формулой Лапласа.

Возьмем теперь закон больших чисел Бернулли. Мы можем иллюстрировать его следующим образом. Допустим, что мы бросаем монету n раз и пишем 1 всякий раз, кода выпадает ее лицевая сторона, и 2 — всякий раз, когда она выпадает оборотной стороной, образуя, таким образом число из n-го количества однозначных чисел. Предположим, что каждая возможная последовательность выпадает только один раз. Таким образом, если n = 2, то мы получим четыре числа: 11, 12, 21, 22; если n =3, то мы получим 8 чисел: 111, 112, 121, 122, 211, 212, 221, 222; если n=4, мы получим 16 чисел: 1111, 1112, 1121, 1122, 1212, 1221, 1222, 2111, 2112, 2121, 2122, 2211, 2221, 2222 и так далее

Беря последнее из вышеприведенного перечня, мы находим: 1 число со всеми единицами, 4 числа с тремя единицами и одной двойкой, 6 чисел с двумя единицами и двумя двойками, 4 числа с одной единицей и тремя двойками, t число со всеми двойками.

Эти числа — 1, 4, 6, 4, 1 — являются коэффициентами в разложении бинома (а + b)4. Легко доказать, что для n однозначных чисел соответствующие числа являются коэффициентами в разложении бинома (о + b)n. Теорема Бернулли сводится к тому, что если n является большим, то сумма коэффициентов около середины будет почти равна сумме всех коэффициентов (которая равна 2n), Таким образом, если мы возьмем все возможные последовательности выпадения лицевой и оборотной сторон в большом числе бросаний, то огромное большинство их будет иметь почти одинаковое число у обеих (то есть у лицевой и оборотной сторон); это большинство и приближение к полному равенству будет, кроме того, неопределенно увеличиваться по мере того, как будет увеличиваться число бросаний.

Хотя теорема Бернулли и является более общей и более точной, чем вышеприведенные положения с равно вероятными альтернативами, на все-таки должна интерпретироваться, согласно нашему настоящему определению «вероятности», способом, аналогичным вышеприведенному. Является фактом, что если мы составим все числа, которые состоят из 100 знаков, каждый из которых есть или 1, или 2, то около четверти из них будут иметь 49, или 50, или 51 знак, равный 1, почти половина будет иметь 48, или 49, или 50, или 51, или-52 знака, равных 1, более половины будет иметь от 47 до 53 знаков, равных 1, и около трех четвертей будет иметь от 46 до 54 знаков. По мере того как число знаков будет увеличиваться, будет возрастать и преобладание случаев, в которых единицы и двойки будут почти полностью уравновешиваться.

Вопрос, почему этот чисто логический факт должен рассматриваться как дающий нам хорошее основание ожидать, что, если мы бросим монету очень много раз, мы действительно получим приблизительно равное число выпадений ее лицевой и оборотной сторон, является совершенно другим вопросом, включающим в себя в дополнение к логическим законам законы природы. Я упоминаю об этом только для того, чтобы подчеркнуть тот факт, что я сейчас не рассматриваю этого.

Я хочу подчеркнуть то, что в вышеприведенной интерпретации нет ничего касающегося возможности и ничего, что по существу дела предполагает незнание. Здесь дается только исчисление членов класса В и определение того, какая их пропорция принадлежит также и к классу А.

Иногда утверждают, что мы нуждаемся в аксиоме равновероятности, например, в аксиоме, что выпадение лицевой и оборотной сторон монеты равновероятно. Если это значит, что в действительности они выпадают с приблизительно равной частотой, то это предположение не является необходимым для математической теории, которая как таковая не имеет дела с действительными событиями.

Рассмотрим теперь возможные применения определения конечной частоты к случаям вероятности, которые могут казаться стоящими вне ее.

Во-первых, при каких условиях можно распространить это определение на бесконечные совокупности? Поскольку мы определили вероятность как дробь, а дроби не имеют смысла, когда числитель и знаменатель бесконечны, постольку наше определение можно расширить только в том случае, когда имеются какие-то средства перейти к пределу. Это требует, чтобы все о, в отношении которых мы должны установить вероятность того, что они суть b, представляли бы собой последовательность, являющуюся на деле рядом (progression), так чтобы они были даны как а1, a2, a3, … an, где для каждого конечного целого числа n существовало бы соответствующее an, и наоборот. Мы можем тогда обозначить через «Pn» пропорцию всех а до an, включительно, которые принадлежат b. Если, по мере того, как n увеличивается, pn стремится к пределу, то мы можем определить этот предел как вероятность того, что а будет b. Этот предел зависит от порядка следования всех о и поэтому является пределом их как последовательности, а не как класса. Мы должны, однако, отличать случай, в котором значение Pn как бы колеблется около своего предела, от случая, в котором оно стремится к пределу только с одной стороны. Если мы многократно бросаем монету, то число выпадений лицевой стороны будет иногда больше половины всех бросаний, а иногда меньше; таким образом, pn как бы колеблется около предела 1/2. Но если мы возьмем пропорцию простых чисел до n (среди всех чисел меньших), то она стремится к пределу нуль только с одной стороны: для любого конечного n величина pn есть определенная положительная дробь, которая для больших значений n приблизительно равна 1/1п n. Однако 1/1n n стремится к нулю по мере того, как n бесконечно возрастает. Таким образом, пропорция простых чисел стремится к нулю, но мы не можем сказать, что «ни одно целое число не является простым»; мы можем сказать, что шанс того, что целое число будет простым числом, является бесконечно малым, но не нулем. Ясно, что шанс того, что целое число будет простым, будет больше, чем шанс того, что оно будет, скажем, и четным и нечетным, хотя этот шанс меньше, чем любая конечная дробь, как бы мала она ни была. Я сказал бы, что когда шанс, что некое о есть b, равняется нулю, мы можем сделать вывод, что «ни одно а не есть b», но когда этот шанс бесконечно мал, мы не можем сделать такого вывода.

Следует заметить, что если мы только не делаем какого-либо предположения о ходе вещей в природе, мы не можем использовать этот метод стремления к пределу, когда имеем дело с последовательностью, которая определена эмпирически. Например, если мы многократно бросаем данную монету и обнаруживаем, что число выпадении лицевой стороны — по мере того как мы продолжаем бросание — непрерывно стремится к пределу 1/2, то это не уполномочивает нас делать предположение, что таковым действительно стал бы этот предел, если бы мы смогли сделать нашу последовательность бросаний бесконечной. Может, например, быть, что если n есть число бросаний, то пропорция выпадении лицевой стороны приближается не строго к 1/2, а к где N есть число гораздо большее, чем то, которого мы можем достичь в действительном эксперименте. В этом случае наши индукции становились бы эмпирически фальсифицированными как раз тогда, когда мы думали бы, что они прочно установлены. Или опять-таки с любой эмпирической последовательностью могло бы случиться, что через некоторое время она перестала бы подчиняться закону и перестала бы в каком бы то ни было смысл стремиться к пределу. Если в таком случае вышеприведенное распространение нашего определения на бесконечные последовательности нужно применить к эмпирическим последовательностям, то мы должны будем ввести какую-то индуктивную аксиому. Без этого нет основания ожидать, что более поздние части такой последовательности будут продолжать подчиняться тому закону, которому подчиняются более ранние ее части.

В обычных эмпирических суждениях вероятности, таких, например, которые содержатся в прогнозах погоды, имеется смесь различных элементов, которые важно отделить друг от друга. Самым простым предположением — чрезмерно упрощенным здесь для целей иллюстрации — является предположение на основе наблюдения какого-либо симптома, который, скажем, в девяноста процентах случаев, в которых он прежде наблюдался, сопровождался дождем. В этом случае, если бы индуктивные аргументы были столь же бесспорны, как и дедуктивные, мы сказали бы, что «имеется девяностопроцентная вероятность дождя». Это значит, что настоящий момент относится к определенному классу (классу моментов, когда вышеупомянутый симптом налицо), девяносто процентов членов которого являются моментами, предшествующими дождю. Это вероятность в уже разобранном нами математическом смысле. Но не только это делает нас неуверенными в отношении наступления дождя. Мы не уверены также и в отношении бесспорности самого вывода; мы не чувствуем уверенности в том, что за этим симптомом будет в будущем следовать дождь в девяти случаях из десяти. И это сомнение может быть двух видов — научным и философским. Сохраняя в общем полное доверие к методам науки, мы можем чувствовать, что в этом случае слишком мало данных, чтобы обеспечить индукцию, или что не проявлено достаточной заботы для элиминирования других обстоятельств, которые также могут быть налицо и могут быть более неизменными предшественниками дождя. Кроме того, записи могут быть сомнительными: они могли быть испорчены дождем и стать недоступными, для расшифровки или могли быть сделаны человеком, о котором вскоре после этого стало известно, что он ненормален. Такие сомнения относятся к научным методам, но существуют также сомнения, выдвинутые Юмом: является ли индуктивный метод действительным или только удобной для нас привычкой? Все или любое из этик оснований могут заставить нас колебаться в отношении девяностопроцентного шанса дождя, в который наши свидетельства склоняют нас верить.

В случаях такого рода мы имеем иерархию вероятностей. Первая ступень: вероятно, будет дождь. Вторая ступень: вероятно, симптомы, которые я заметил, являются признаками вероятного дождя. Третья ступень: вероятно, определенного рода события делают определенные будущие события вероятными. Из этих трех ступеней первая характеризует обыденный здравый смысл, вторая есть уровень науки и третья — философии.

На первой ступени мы наблюдали, что до сего времени в девяти случаях из десяти за А следовало В; в прошлом, следовательно, А делало В вероятным в смысле конечной частоты. На этой стадии мы без размышления предполагаем, что мы можем ожидать это же самое и в будущем.

На второй ступени, не ставя под вопрос общую возможность выведения будущего из настоящего, мы сознаем, что такие выводы должны подчиняться определенным гарантиям, таким, например, как гарантии четырех методов Милля. Мы сознаем, также, что индукции, даже когда они осуществляются в соответствии с наилучшими правилами, не всегда подтверждаются. Но я думаю, что наши действия все же могут быть включены в сферу теории конечной частоты. Мы осуществили в прошлом какое-то количество индукций, одних более, других менее тщательно. Из осуществленных в соответствии с определенной процедурой пропорция P до сих пор подтверждалась; следовательно, эта процедура до сего времени сообщала вероятность p тем индукциям, которые ома санкционировала. Научный метод в значительной мере состоит из правил, посредством которых p (испытанное прошлыми результатами прошлых индукций) может быть больше приближено к 1. Все это находится все еще в пределах теории конечной частоты, но теперь уже только индукции являются единственными членами в нашей оценке частоты.

Это значит, что мы имеет два класса A и B, из которых A состоит из индукций, которые были осуществлены в соответствии с определенными правилами, а В состоит из индукций, которые до сего времени подтверждались опытом. Если n есть число членов A, а m есть число членов, общих для A и B, тогда m/n есть шанс, что индукция, осуществленная в соответствии с вышеупомянутыми правилами, приведет в настоящее время к результатам, которые оказались бы истинными, если бы могли быть проверены.

Говоря это, мы не пользуемся индукцией; мы просто описываем черты естественного порядка вещей, поскольку его наблюдали. Мы, однако, нашли критерий высокого качества (до сего времени) всякого предлагаемого правила научной процедуры и нашли его в пределах конечной частоты. Единственно новое есть то, что наши единицы теперь являются не единичными событиями, а индукциями. Индукции трактуются как события, и только те из них, которые действительно имели место, должны рассматриваться, как члены нашего класса.

Но как только мы начинаем доказывать или то, что какая-либо отдельная индукция, которая к настоящему времени подтвердилась, будет или вероятно будет подтверждена в будущем, или то, что правила процедуры, дававшие до сих пор большую пропорцию индукций, которые к настоящему времени были подтверждены, способны давать большую пропорцию подтвержденных индукций в будущем, мы выходим за пределы теории конечной частоты, поскольку мы здесь имеем дело с классами, члены которых неизвестны. Математическая теория вероятности, как и вся чистая математика, хотя и дает знание, не даст (по крайней мере в одном весьма важном смысле) чего-либо нового; индукция же, напротив, определенно дает что-то новое, и сомнение касается только того, является ли то, что она дает, знанием.

Я пока не хочу исследовать индукцию критически, я хочу только выяснить, что она не может быть введена в сферу теории конечной частоты, даже если мы будем рассматривать отдельную индукцию как одну из класса индукций, поскольку проверенные индукции могут давать только индуктивное свидетельство в пользу еще не проверенной индукции. Если затем мы скажем, что принцип, оправдывающий индукцию, является «вероятным», то мы должны употреблять слово «вероятный» в ином смысле, чем оно употребляется в теории конечной частоты; этот смысл должен — как я сказал бы — быть тем, что мы называли «степенью правдоподобия».

Я склонен думать, что если признать индукцию или любой другой постулат, который мы решим поставить вместо нее, то все точные и измеримые вероятности могут быть интерпретированы как конечные частоты. Допустим, что я, например, говорю, что «имеется высокая степень вероятности, что Зороастр существовал». Чтобы обосновать это утверждение, я должен буду рассмотреть сначала, каковы относящиеся к этому вопросу свидетельства, а затем поискать подобные свидетельства, о которых известно, что они правдивы или неверны. Класс, от которого зависит вероятность, не является классом пророков существующих и несуществующих, ибо, включая несуществующих, мы делаем этот класс до некоторой степени неопределенным; не может этот класс быть также классом только существующих пророков, поскольку исходным вопросом как раз и является вопрос, принадлежит ли Зороастр к этому классу. Мы должны будем рассуждать следующим образом: в случае вопроса о Зороастре имеется свидетельство, принадлежащее к определенному классу А; мы находим что из всех свидетельств, которые принадлежат к этому классу и которые могут быть проверены, отношение p оказывается правдивым свидетельством; мы, следовательно, может сделать индуктивный вывод, что есть вероятность p в пользу подобных свидетельств в случае Зороастра. Таким образом, частота плюс индукция оказываются достаточными для этого использования вероятности.

Или допустим, что, подобно епископу Батлеру, мы говорим: «Вероятно, что вселенная является результатом замысла Создателя» Здесь мы начинаем с таких вспомогательных аргументов, как аргумент, что создание часов предполагает часового мастера. Имеется множество образцов часов, о которых известно, что они сделаны часовыми мастерами, и нет ни одних часов, о которых было бы известно, что они сделаны не часовым мастером. В Китае существует вид мрамора, который иногда чисто случайно производит впечатление картины, созданной художником; я видел поразительные примеры этого.

Но это бывает так редко, что, когда мы видим картину, мы бываем правы (допуская индукцию), делая с очень высокой степенью вероятности вывод о создавшем ее художнике. Епископу-логику остается — как он и подчеркивает это заглавием своей книги — доказать эту аналогию. Это может считаться сомнительным делом, но, конечно, не может быть подведено под математическую вероятность.

Пока, следовательно, может казаться, что сомнительность и математическая вероятность — последняя в смысле конечной частоты — являются единственными понятиями, необходимыми в добавление к законам природы и правилам логики. Это заключение, однако, является только предварительным. Нельзя сказать ничего окончательного, пока мы не рассмотрим некоторые другие предложенные определения «вероятности».