Надежность оценки – это постоянство, с которым она оценивает именно то, что нужно оценить. Если бы вы для измерения длины своего стола пользовались резиновой линейкой, которая может растягиваться или сжиматься, то при каждом измерении вы, вероятно, получали бы разные результаты. Конечно же, мы хотим, чтобы наши измерения были надежными.

Ученые, занимающиеся общественными и естественными науками, уделяют большое внимание проблеме надежности измерений. Например, тест интеллекта считается надежным тогда, когда один и тот же человек получает результаты, которые лежат в одном и том же диапазоне при каждом тестировании. Когда мы выступаем в роли «интуитивного ученого», мы редко учитываем надежность. Приходя к выводу о необъективности преподавателя или студента, мы часто полагаемся на один или два примера поведения без учета надежности нашей оценки этого человека.

Предположим, вы узнали, что ваш друг Рикардо провалился на экзамене, который все остальные легко сдали. Можете ли вы заключить, что его преподаватель с предубеждением относится к латиноамериканцам? Для этого необходимо собрать много других наблюдений за преподавателем и выяснить, насколько часто латиноамериканцы проваливаются у него на экзаменах. Если процент таких провалов в его классе необычно высок по сравнению с другими классами, то у вас есть веские основания заключить, что преподаватель с предубеждением относится к латиноамериканцам. Без тщательных измерений и, в данном случае, без выборки большего размера вы не можете сделать вывода о необъективности преподавателя.

Обдумывание ошибок

Для ученого теория – это нечто, требующее проверки. Он стремится не к защите своих убеждений, а к их усовершенствованию. Кроме всего прочего, он еще и специалист по «изменению своих мнений».

Уэнделл Джонсон

Когда мы пытаемся понять взаимосвязи путем выдвижения и проверки гипотез, мы иногда ошибаемся. Эта мысль обсуждается подробнее в главе 7, которая касается понятия вероятности. Пока давайте рассмотрим такую ситуацию: предположим, что вы каждый день ездите на работу с приятелем. Каждое утро вы останавливаетесь у окна кафе для автомобилистов и покупаете кофе. Вы решили, что, вместо того чтобы каждое утро спорить, кто будет платить («Я заплачу» – «Нет, нет позволь мне»), друг будет бросать монету. Если выпадет орел, заплатит он; если выпадет решка – заплатите вы. Звучит довольно странно, но за последние 10 дней монета 9 раз выпала решкой вверх. Как вы думаете, не жульничает ли ваш приятель?

Истина заключается в том, что он либо жульничает, либо нет. К сожалению, вы не знаете, какой из двух вариантов ответа – правда. Тем не менее вам надо принять решение. Вы либо решите, что ваш приятель жульничает, либо решите, что он не жульничает. Таким образом, существуют четыре возможности: а) он жульничает, и вы правильно решите, что он жульничает; б) он не жульничает, и вы правильно решите, что он не жульничает; в) он жульничает, и вы неправильно решите, что он не жульничает; г) он не жульничает, и вы неправильно решите, что он жульничает. Из этих четырех возможностей в двух случаях вы можете оказаться правы и в двух случаях вы можете ошибиться. Эти четыре комбинации представлены в табл. 6.1. Как видно из табл. 6.1, в любой ситуации при проверке гипотезы мы можем совершать ошибки двух типов. Эти два типа не являются одинаково «плохими». Гораздо хуже решить, что ваш друг жульничает, если на самом деле он этого не делает (особенно если вы обвините его в мошенничестве), чем решить, что он не жульничает, когда он именно этим и занимается. По этой причине вам необходимы более веские свидетельства для подтверждения факта его жульничества, чем для подтверждения его честности. Другими словами, при проверке гипотезы вам необходимо учитывать степень «вредности» различных ошибок.

Если вы будете изучать статистику или экспериментальное проектирование, то обнаружите, что эти науки справляются с проблемой различной «вредности» ошибок, требуя для различных решений различные уровни уверенности. Необходимость рассмотрения ошибок различных типов возникает во многих контекстах. Согласно основному принципу нашего законодательства, для того чтобы можно было обвинить человека в совершении преступления, необходима сильная уверенность в этом (отсутствие обоснованных сомнений). И наоборот, нам не нужно отсутствия обоснованных сомнений в невиновности подозреваемого, поскольку ошибочное решение о невиновности считается менее серьезной ошибкой, чем ошибочное решение о виновности. Точно также при неформальной проверке гипотез вам необходимо помнить о степени серьезности ошибок различных типов. Перед тем как решить, например, что, сколько ни старайся, вы все равно не осилите какой-либо предмет или что лекарство, которое вы принимаете, вам помогает или не помогает, необходимо рассмотреть последствия правильного и неправильного решений. Для некоторых решений необходима большая степень уверенности в своей правоте, чем для других.

Таблица 6.1. Четыре возможных исхода в примере «Кто покупает кофе»

Примечание. Ошибочное решение, что он жульничает, гораздо более серьезная ошибка, чем ошибочное решение, что он не жульничает. В связи с этой неравноценностью степени серьезности ошибок вам нужно иметь большую уверенность, когда вы решаете, что он жульничает, чем когда вы решаете, что он не жульничает.