Когда ученые хотят убедительно доказать существование причинной связи, они используют трехступенчатую схему эксперимента (Kimble, 1978). Схема эксперимента – это план, по которому проводятся наблюдения.
1. На первом этапе необходимо создать различные группы, которые будут исследоваться. В примере с влиянием оценок типа «зачет-незачет» на объем знаний это группа студентов, получающих численные оценки, и группа студентов, которые получают «зачет» или «незачет».
Важно, чтобы эти группы не имели между собой других значимых различий. Нельзя, чтобы все студенты из первой группы посещали лекции профессора Занудного, а все студенты из второй группы занимались у профессора Бормотухина. Один из профессоров может преподавать лучше, и из-за этой дополнительной переменной студенты из одной группы узнают больше, чем студенты из другой группы. Один из способов избежать смешанного влияния переменных – это оценивать половину студентов каждой группы по одной из систем, причем разделение на половины произвести случайным образом. Для того чтобы причинная связь было строго обоснованной, в начале эксперимента группы должны быть поставлены в равные условия. Случайное распределение испытуемых по группам является принципиальным требованием при определении причинной связи.
2. Вторым этапом является «применение экспериментального воздействия». Если бы мы исследовали влияние лекарства, то одна группа получала бы лекарство, а вторая – нет. Обычно, группа, которая не получает лекарство, получает плацебо, т.е. вещество, которое имеет такой же внешний вид и вкус, как лекарство, но химически нейтрально. Плацебо дают для того, чтобы избежать влияния психологических факторов – веры испытуемых в эффективность лекарства и связанных с этим ожиданий. Тема ожиданий и их роли в тенденциозной интерпретации результатов будет обсуждаться ниже в этой главе. Как мы уже знаем, когда подобные методы были использованы для проверки эффективности лаэтрила, оказалось, что он не помогает от рака. В эксперименте с оценками термин «воздействие» означает обучение в условиях применения одной из двух систем – бинарной или численной.
3. Последним этапом является оценка полученных результатов. Проводятся измерения, и две (или более) группы сравниваются по определенному итоговому показателю. Если бы исследование касалось нового лекарства от головной боли, то сравнивалась бы частота и сила головных болей у испытуемых из разных групп. В примере с оценками результаты итогового экзамена у студентов из группы с численными оценками сравнивались бы с результатами студентов из группы «зачет-незачет». Если результаты у одной из групп окажутся значительно выше, чем у другой, то мы получим сильное подтверждение гипотезы о том, что одна из систем оценок вызывает повышение старательности студентов и приводит к увеличению объема их знаний.
Конечно, не всегда имеется возможность в начале опыта поставить группы в равные условия и распределить испытуемых по группам случайным образом, но когда это возможно, результаты могут быть использованы для подтверждения более сильных причинных связей, чем в условиях менее строгого контроля.
Рассмотрим следующий гипотетический пример:
Исследователи из Университета Умников изучали причины разводов. Они обнаружили, что 33% недавно разведенных супружеских пар говорят, что в течение двухлетнего периода, предшествовавшего разводу, у них были серьезные разногласия по поводу денег. Ученые сделали вывод, что материальные разногласия являются главной причиной разводов. В качестве способа снижения уровня разводов они предлагают супружеским парам научиться справляться с этими разногласиями.
Правилен ли «ход рассуждений»? А если есть ошибки – в чем они? Их здесь очень много. Во-первых, у нас нет сравнительных данных о группе пар, которые не развелись (т. е. нет контрольной группы). Может быть, в 33% всех семей возникают разногласия по поводу денег; может быть, процент этих разногласий еще выше среди семей, которые не развелись. Во-вторых, нет основания считать, что материальные разногласия вызвали развод или даже ему способствовали. Может быть, в распадающихся семьях возникает больше разногласий по любому поводу. В-третьих, возникает проблема, связанная с ретроспективными исследованиями, которую мы подробнее обсудим в следующем разделе. Исследования, подобные этому, встречаются на каждом шагу: в ток-шоу на радио, в выпусках новостей, научных журналах или в собственных объяснениях причин тех или иных жизненных событий, которые дают люди. Если при интерпретации комментариев такого рода вы будете опираться на принципы проверки гипотез, то у вас меньше шансов быть обманутыми.