Вообще говоря, в социально — психологических исследованиях по изучению социального влияния используются либо корреляционные, либо экспериментальные методы, причем последние применяются чаще. В этом приложении мы сосредоточимся в основном на рассмотрении экспериментальных методов, но сначала вкратце опишем корреляционные методы.
Корреляционные методы в полевых исследованиях
Все психологические исследования включают в себя наблюдения за поведением. В ходе исследований, которые называются полевыми, производятся наблюдения за явлениями или воздействием переменных в естественной обстановке. Это означает, что исследователь, наблюдая вещи «как они есть», пытается получить систематичные, сравнительно объективные и неискаженные данные. Исследователь не вмешивается в ход событий и не пытается изменять или контролировать ни одну из переменных. Его задача состоит в том, чтобы установить, существует ли между двумя или несколькими переменными корреляционная связь, и если существует, то насколько сильная. Например, в одном полевом исследовании было показано, что политические и социальные установки студенток Беннигтонского колледжа в штате Вермонт за время обучения с первого по последний курс становятся все более либеральными (Newcomb, 1961). В другом исследовании было продемонстрировано, что десегрегация школ связана со снижением количества предрассудков у тех учащихся начальной школы, чьи родители неавторитарны и не применяют наказаний при воспитании детей; однако для тех школьников, чьи родители были авторитарными и наказывали своих детей, такой связи выявлено не было (Stephan and Rosenfield, 1978).
Полевые исследования, подобные этим, и другие, с использованием анкетирования и опросов, являются ценным инструментом, позволяющим обнаружить и проанализировать закономерности поведения, а также предположить, какие переменные могут играть первостепенную роль в этих закономерностях. Поскольку наблюдения проводятся в обычной жизни, с минимальным вмешательством в ее течение, то область применимости полученных результатов в повседневной жизни часто бывает шире, чем область применимости наблюдений, сделанных в более искусственной обстановке в стенах лаборатории. Однако большинство полевых исследований являются корреляционными. Переменные не контролируют и не изменяют — за ними просто наблюдают. Может оказаться, что два события или поступка (А и Б) сильно связаны между собой, или коррелируют; тем не менее, основываясь только на простом наблюдении, нельзя с уверенностью сказать, какая именно из возможных ситуаций имеет место: А является причиной Б, Б является причиной А, связь обусловлена случайным совпадением, одно из событий (один из поступков) является косвенной причиной другого, воздействующей через промежуточную (неизвестную нам) переменную, или существует третья переменная, которая является общей причиной А и Б.
Например, исследования брачных отношений иногда показывают, что счастливые супруги чаще имеют половые сношения, чем несчастливые супружеские пары.
Является ли секс причиной семейного счастья? Или семейное счастье стимулирует сексуальные отношения? Возможно, на самом деле имеют место обе причинно — следственные связи, но мы не можем быть в этом уверены исходя из одних лишь наблюдений, которые показывают, что секс и семейная гармония сопутствуют друг другу. Мы также не можем с полной определенностью решить, не вызвана ли эта связь какой — либо третьей переменной. Возможно, некоторые супруги большую часть времени проводят порознь, потому что очень заняты на работе. Из — за этого они могут быть менее счастливыми, и эта же причина явно препятствует половой жизни.
Если варьировать время измерения переменных, то иногда корреляционные исследования позволяют глубоко проникнуть в суть причинно — следственной связи (но все — таки не могут дать окончательных выводов). Если наблюдения показывают, что изменения переменной А в момент времени 1 коррелируют с изменениями переменной Б в момент времени 2, но изменения переменной Б в момент времени 1 не связаны с изменениями переменной А в момент 2, то отсюда следует, что переменная А оказывает каузативное влияние на переменную Б. Для проверки предположений о наличии причинной связи можно также использовать определенные статистические процедуры.
Эксперимент является источником информации
о причинной обусловленности
Для того чтобы достоверно установить наличие причинно — следственной связи, необходим эксперимент. Большинство социально — психологических исследований, фактически, являются экспериментальными. Ключевым фактором любого эксперимента служит контроль. Экспериментатор контролирует ту переменную, которая по его предположению является каузативной, — т. е. независимую переменную. Экспериментатор манипулирует этой переменной, задавая для воздействия на испытуемых из одной экспериментальной группы один уровень, величину или тип переменной, а для воздействия на испытуемых из второй экспериментальной группы — другой уровень, величину или тип и так далее. В то же самое время экспериментатор пытается поддерживать постоянство всех остальных переменных, не имеющих отношения к проверке данной гипотезы, но способных вызывать реакции испытуемых.
Кроме того, экспериментатор контролирует некоторые переменные с помощью случайного распределения испытуемых по экспериментальным группам, в которых они подвергаются воздействию при различных условиях. При этом для выбора группы (т. е. условий), в которую попадет данный испытуемый, используется какой — либо случайный метод (например, бросание монеты или таблица случайных чисел, выданных компьютером). Поскольку распределение по группам имеет совершенно случайный характер, маловероятно, что до того, как на испытуемых воздействует независимая переменная, между испытуемыми, подвергаемыми воздействию независимой переменной при различных ее уровнях, будут существовать какие — либо систематические различия. С помощью случайного распределения испытуемых по группам обычно обеспечивается равномерное распределение любого из множества факторов, благодаря которым люди отличаются друг от друга.
После введения каузативного фактора — независимой переменной — производятся наблюдения за тем поведением испытуемых, которое предположительно является следствием, т. е. за зависимой переменной. Если в интересующем нас поведении (зависимой переменной) испытуемых, которые были подвергнуты воздействию независимой переменной при различных ее уровнях, наблюдаются различия, то логика эксперимента диктует, что независимая переменная должна быть причиной поведения. Все прочие переменные оставались постоянными, а манипуляции независимой переменной проводились до того, как измерялись значения зависимой переменной.
Таким образом, вы видите, что экспериментатор не ждет, пока поведение можно будет наблюдать в естественных условиях, — он создает условия, которые, как он предполагает, вызовут это поведение. В этом смысле экспериментатор создает искусственную среду или вмешивается в естественный процесс. Это делается для того, чтобы 1) событие произошло при известных условиях, которые можно независимо воспроизвести в дальнейшем; 2) оно произошло тогда, когда экспериментатор готов к проведению точных наблюдений (за зависимыми переменными); 3) сделать возможным определение направления и силы воздействия, которое оказывает независимая переменная на зависимую; 4) исключить возможность того, что связь между независимой и зависимой переменными обусловлена не прямой каузальной зависимостью, а чем — то другим (например, фактор В является общей причиной переменных А и Б).
Перед началом эксперимента необходимо принять три основных решения. Из бесконечного множества стимулов, которые могут восприниматься самыми различными испытуемыми и вызывать многоуровневые реакции самого разнообразного характера, экспериментатор выбирает конкретный стимул, организм (или испытуемого) и тип реакции. Любой эксперимент можно представить графически в виде набора трех пересекающихся кругов, каждый из которых изображает совокупность всех 1) стимулов (независимых переменных), 2) испытуемых и 3) реакций (зависимых переменных), релевантных исследуемой проблеме. Предмет исследования отображается очень небольшой областью или точкой пересечения этих кругов. Например, при исследовании влияния удобопонятности убеждающего сообщения на изменение установок в качестве независимой переменной может быть выбран уровень звуковых помех в магнитофонной записи убеждающего сообщения: можно задать четыре различных уровня помех, от слабого шума, который не мешает пониманию, до крайне сильных помех, из — за которых большую часть сообщения очень трудно понять. В роли испытуемых могут выступать 60 студентов, посещающих лекции по вводному курсу психологии в определенном колледже. А зависимой переменной может быть оценка степени согласия испытуемого с выводом, следующим из сообщения. Испытуемые сами выставляют оценки по десятибалльной шкале, обводя кружком соответствующее число.
Совокупность всех стимулов подразделяется на категории в соответствии с существующими между стимулами различиями, которые могут иметь значение с теоретической точки зрения. Например, в Йельской программе исследования коммуникаций (Yale Communication Research Project) в области убеждения, которая осуществлялась в 1950–е и 1960–е годы (см. главу 4), совокупность всевозможных коммуникаций была разбита на категории в зависимости от того, были ли эти коммуникации двусторонними или односторонними, вызывали ли они страх, были ли выводы сформулированы четко или нечетко и так далее. Проводя подобную классификацию стимулов, экспериментатор осознанно пренебрегает некоторыми свойствами стимулов и уделяет особое внимание другим свойствам. Например, длина предложений, из которых состоит убеждающее сообщение, или даже тема сообщения могут не иметь отношения к исследуемой проблеме. Это означает, что экспериментатор будет выбирать из обширной категории односторонних вызывающих страх коммуникаций, в которых содержатся четко сформулированные выводы. В конкретной выбранной им коммуникации предложения, состоящие из 25 слов, могут встречаться чаще или реже, чем в других коммуникациях, а ее темой может быть введение ограничений на частное владение огнестрельным оружием, а не регулирование рождаемости. Экспериментатор надеется, что все эти нерелевантные характеристики не повлияют на результаты (т. е. содержание, длина предложений, синтаксис и тому подобные факторы не изменяют изучаемой зависимости).
При выборе типов испытуемых и реакций экспериментатор может руководствоваться аналогичными рассуждениями. Исследователи, изучающие студентов колледжа (или, к примеру, фабричных рабочих), чтобы сделать выводы «о людях в целом», нередко предполагают, что многочисленные различия между отдельными группами не влияют на главные каузальные связи, наличие которых устанавливается в данном исследовании. Многие исследования в области конформности (см. главу 2), например, проводятся с привлечением в качестве испытуемых студентов колледжа. Хотя возможно, что студенты колледжа в среднем мыслят либо более, либо менее самостоятельно, чем другие взрослые представители населения, это не должно иметь значения, если интерес исследователя сосредоточен на влиянии численности единодушного большинства (например, один, два или три человека) на то, насколько часто другие испытуемые соглашаются с мнением большинства. Связь между численностью большинства и степенью конформности должна оставаться одинаковой, независимо от общего уровня конформности конкретной группы испытуемых. Точно так же не важно, в какой именно форме выражается реакция конформности — нажимают ли испытуемые на кнопку или кивают головой, чтобы заявить о своем согласии.
Конечно, в том случае, если есть основания полагать, что основные зависимости неодинаковы для людей с различными образовательными уровнями, социальными статусами, принадлежащих к разным возрастным группам, людей разного пола или отличающихся по каким — нибудь другим показателям, то можно провести дополнительные сравнительные исследования различных категорий людей.
Если экспериментатор может выбирать из большого количества конкретных примеров, имея в своем распоряжении широкие классы переменных и испытуемых, то, принимая решение, он обычно исходит из соображений удобства, простоты и точности измерений, а также наличия максимальной возможности осуществлять контроль. При этом возникают два вполне естественных вопроса: 1) можно ли провести количественные оценки переменных выбранного примера таким образом, чтобы результат не зависел от того, кто проводит измерения или когда они проводятся и 2) является ли выбранный пример точным изображением интересующего исследователя процесса, или концептуальной переменной? Первый вопрос касается надежности эксперимента, а второй — его валидности.
Надежность можно отождествить с последовательностью или устойчивостью результатов. Дадут ли количественные оценки выбранной реакции ту же величину при повторных испытаниях, если все прочие условия останутся постоянными? Можно ли получить те же самые результаты при сходных обстоятельствах тестирования?
Понятие валидности труднее проиллюстрировать, и этот термин имеет несколько значений, только два из которых будут здесь упомянуты. Концептуальная ва — лидность означает, что воздействия, наблюдения и измерения, которые проводит экспериментатор, представляют собой адекватный конкретный пример, относящийся к более широкому абстрактному классу объектов, о которых экспериментатор на самом деле хочет что — либо узнать. Исследователя установок интересуют установки, а не «галочка», поставленная около числа на десятибалльной шкале вопросника. В идеале желательно получить конкретный набор операций, которые связывают абстрактное понятие с событиями реального мира и в то же время являются как можно более безупречным примером данного понятия.
К валидности измерений можно подойти с другой точки зрения, и тогда речь пойдет о содержательной валидности. Любое изменение величины зависимой переменной состоит из двух компонентов: истинного изменения и составляющей ошибки. Чем ближе полученный результат к (гипотетическому) истинному значению, тем валиднее оценка. Если на результат влияют не только изменения релевантной реакции, которую изучает исследователь, но также и посторонние источники ошибок, то он теряет свой статус валидной характеристики истинной системы реакций. Систематические погрешности искажают результат в определенном направлении, в то время как из — за случайных ошибок результат может отклоняться от своего истинного значения в любую сторону.
Систематические погрешности могут возникать, например, из — за того, что экспериментатор непреднамеренно подсказывает испытуемым, какой реакции он от них ожидает, или из — за того, что экспериментатор знает, какой испытуемый подвергался определенному воздействию (такому, как прием лекарственного препарата), и субъективно оценивает поведение этого испытуемого. Причинами случайных ошибок бывают внешние возмущения или методологические недочеты. При любом испытании какое — нибудь случайное событие может изменить реакцию испытуемого на стимул, которым манипулирует экспериментатор (например, если во время процедуры формирования условных реакций неожиданно возникает шум). Кроме того, результат может возрастать или снижаться непредсказуемым образом, если экспериментатор по — разному предъявляет стимул испытуемым из одной и той же экспериментальной группы. Систематические ошибки можно свести к минимуму путем использования контролируемых процедур, объективных методов измерений, рандомизации и контрольных групп. Случайные ошибки устраняются в основном с помощью использования стандартной методологии и создания среды, в которой маловероятны случайные изменения характеристик, способных повлиять на реакции испытуемого.
Если переформулировать задачу исследования в свете данного обсуждения, то можно сказать, что эксперимент — это набор объективных процедур, позволяющих изолировать сигнал от фонового шума. Истинный результат, или сигнал, должен быть концептуально чистым, чтобы его можно было отличить от других сходных сигналов. Процедуры воздействия предназначены для усиления этого сигнала, в то время как процедуры измерений должны обеспечивать возможность детектирования даже слабого сигнала. Все это осуществимо только при условии адекватного контроля над другими сигналами и фоновым шумом, либо путем их минимизации, либо путем точной оценки вклада, который они вносят в наблюдаемую величину основного сигнала.
А что можно сказать о возможности генерализации результатов эксперимента? Мало кого из ученых могут удовлетворить выводы, которые сводятся лишь к тому, что при воздействии конкретных стимулов и операций на единственную выборку испытуемых получена определенная реакция. Нам хочется, чтобы полученные выводы имели более высокую степень общности. Мы уже видели, что при изучении важнейших психологических процессов исследователи часто предполагают, что полученные результаты будут справедливы и для более широкой популяции. Обоснованность такого предположения зависит от ряда факторов, которые необходимо учитывать в ходе экспериментального исследования. Мы проанализируем эти факторы в следующих разделах.
Обобщение результатов экспериментов: статистические выводы
Делая выводы из исследования, мы всегда рискуем допустить ошибку, даже если это хорошо спланированное и тщательно проведенное исследование. Тем не менее степень этого риска можно рассчитать с помощью объективных статистических процедур, разработанных для оценки вероятности того, что данный вывод из конкретной серии наблюдений может оказаться ложным. Допустим, мы хотим выяснить, повлияло ли участие в групповой дискуссии на установки, касающиеся употребления наркотиков. Мы можем оценить мнения участников до начала дискуссии и после ее окончания. Оценки по шкале мнений, полученные испытуемыми из нашей выборки, будут сначала просуммированы удобным и эффективным способом, чтобы преобразовать их в форму определенных статистических данных. Вычислив средние значения, медианы или моды, можно ответить на вопрос «Чему равна типичная или средняя оценка до дискуссии и после нее?» Рассчитав вариабельность реакции (диапазон ее изменения или среднее квадратическое отклонение), можно сказать, насколько реакции индивидуальных испытуемых отклоняются от этого характеристического показателя.
Однако чтобы определить, действительно ли именно групповая дискуссия привела к изменению установок в желательном направлении, необходимо сравнить полученные статистические данные с оценочным значением изменений, которые произошли бы просто за счет повторной оценки мнений, в отсутствие дискуссии. Сравнение полученного распределения оценок с теоретическими распределениями различных типов позволяет оценить вероятность того, что данные не имеют случайного характера, а отражают определенную статистическую закономерность. Вероятность того, что дифференцированное поведение — различное для испытуемых, поведение которых первоначально было сходным, — в ответ на воздействие переменной отражает «истинные» различия, находится в прямой зависимости от трех факторов: количества наблюдений, величины различий и вариабельности реакции. Вероятность статистической значимости полученных различий возрастает с ростом количества (N) наблюдений, с увеличением различий в поведении (представленных в форме каких — либо статистических данных) между группами и с уменьшением отклонений внутри каждой отдельной группы.
Понятие значимости результатов в психологии определяется как соответствие минимальному критерию, по которому устанавливают, что данный результат обусловлен влиянием экспериментального воздействия, а не случайными флуктуациями (дисперсией ошибки) в наблюдениях. В качестве такого минимального стандартного уровня задается уровень вероятности р<0,05 (р меньше, чем 0,05, или 5 %). Это означает, что обнаруженные изменения могут быть обусловлены чистой случайностью в пяти случаях из ста. Поэтому мы можем считать, что наш случай — это один из тех 95 случаев, когда различия нельзя приписать случайности. При определенных обстоятельствах исследователь может задать более строгий вероятностный критерий отвержения, например р<0,01 или даже р<0,001 (т. е. только в одном случае из тысячи экспериментатор сделает ложный вывод, приняв обнаруженные им различия за истинный результат экспериментального воздействия).
Хотя риск ошибки, сопряженный с получением выводов, снижается, если формулировать заключение с использованием вероятностных, а не абсолютных понятий, остается еще значительный риск, связанный с распространением выводов, касающихся данной выборки или поведения, в двух направлениях. Можно распространить выводы на более абстрактный, концептуальный уровень объяснения или перенести их на более конкретный, специфический пример. В первом случае можно совершить ошибку при экстраполировании выводов на более широкую область, поскольку предполагаемая общая закономерность, или теоретический процесс, может не проявляться в частных результатах. Во втором случае возникает необходимость предположить, что по общим закономерностям можно прогнозировать поведение конкретного человека.
В каждом из этих случаев возможны ошибки, относящиеся к двум типам. Если уровень значимости обнаруженных различий р<0,05, то экспериментатор, заключивший, что он обнаружил истинный эффект, ошибется в пяти случаях из ста. Это объясняется тем, что одни только случайные факторы могут порождать различия такой же величины и данный эксперимент может быть как раз одним из этих пяти возможных случаев. Такие ошибки называются ошибками первого рода (или типа альфа): сделан вывод о существовании зависимости, хотя на самом деле она отсутствует. Теперь давайте иначе посмотрим на весь наш вероятностный процесс принятия решений и предположим, что различия не признаны значимыми, потому что они находятся на уровне p<0,06 (т. е. не соответствуют обычному критерию научной обоснованности выводов). Тогда в 94 случаях из 100 исследователь заключит, что зависимость не существует, в то время как в действительности дело обстоит как раз наоборот. Это ошибка второго рода (или типа бета).
Чем руководствуется психолог, принимая решение о том, стоит ли ему рисковать (ошибка первого рода) или следует проявить консерватизм (ошибка второго рода)? Ясно, что при выборе стратегии подобного решения необходимо учитывать практические последствия, вытекающие из экспериментальных выводов, относительную величину потерь или опасности, которые возникнут из — за ошибок каждого типа, и наконец, характер влияния этих ошибок на развитие науки — приведут ли они к стимуляции творческого мышления или будут ему препятствовать. Например, при обобщениях с целью получения концептуальных теоретических утверждений о физических или психологических явлениях прогрессу науки сильнее мешают ошибки второго рода (из — за которых могут преждевременно быть прекращены исследования в какой — либо области), чем ошибки первого рода (которые легко могут обнаружить другие исследователи, проведя независимые репликации экспериментов). Однако если репликации проводятся редко, то ошибка первого рода может так и остаться неисправленной, в результате чего много сил будет потрачено зря на проверку следствий исходной необоснованной гипотезы.
Применение результатов лабораторных исследований на практике
Перед экспериментатором всегда стоит дилемма: обретение контроля сопряжено с потерей возможностей. В лабораторной обстановке невозможно воспроизвести весь диапазон психологических переменных и полную интенсивность их воздействия. Дело в том, что в ходе эксперимента испытуемые лишь на короткое время подвергаются воздействию независимой переменной. Нередко задача испытуемого слабо связана с другими его жизненными переживаниями и оказывает минимальное влияние на его дальнейшее функционирование. Кроме того, существуют правовые, этические и моральные соображения, которые накладывают ограничения на характер и интенсивность экспериментальных манипуляций. Но, несмотря на то что силу влияния переменных часто лучше всего можно продемонстрировать в неконтролируемой естественной обстановке, при изучении явлений на этом уровне возможно возникновение целого ряда опасностей, таких как недопонимание протекающих при этом процессов, недостаточно точная спецификация каузальности и неспособность проанализировать сложную систему факторов и выделить релевантные составляющие ее переменные. С другой стороны, преимущества, которые дает полный контроль над экспериментом, могут быть сведены на нет из — за тривиальности его содержания. В результате очищения, стандартизации, контроля и отбора определенных стимулов и параметров реакций может оказаться, что экспериментатор создал отдаленное и бледное подобие явлений или процессов, которые он намеревается изучать. При таких условиях результаты исследования могут почти не иметь практического значения.
При планировании любого конкретного эксперимента имеется возможность обойти некоторые из этих ограничений путем применения комплексных стратегий исследования и проведения нескольких различных экспериментов, посвященных одной теме. Предположим, к примеру, что экспериментатор обеспокоен тем, что использование денежного вознаграждения для варьирования степени «оправданности» в эксперименте по изучению вынужденного согласия и диссонанса (см. главу 3), возможно, не то же самое, что варьирование степени «оправданности» путем предоставления испытуемым социальных причин согласия. Экспериментатор может оценить такую возможность, включив в эксперимент концептуальные репликации «оправданности» или проведя несколько различных экспериментов, в которых производится систематичное воспроизведение изучаемых концептуальных переменных.
Экспериментальный и жизненный реализм. Чтобы устранить несоответствие между лабораторными и реальными жизненными условиями, исследователи обычно стремятся сделать свои эксперименты реалистичными. Наиболее важным видом реализма является экспериментальный реализм, который, в сущности, означает «включение эксперимента в жизнь» (Aronson and Carlsmith, 1968; Aronson et al., 1990). Следует позаботиться о том, чтобы процедура эксперимента была увлекательной и интересной, а независимые переменные должны привлекать и удерживать на себе внимание испытуемых. События, происходящие в лаборатории, должны «захватывать» испытуемых, чтобы они реагировали (естественно) на эти события, а не изнывали от скуки, думая (а может быть, и тревожась) о себе как об объектах внимательного наблюдения или пытаясь понять, в чем состоит гипотеза экспериментатора. Если в эксперименте отсутствует экспериментальный реализм, то возникает опасение, что наблюдаемые каузальные зависимости распространяются только на ситуации, когда люди знают, что они участвуют в эксперименте. Поэтому в случае отсутствия экспериментального реализма мы можем почти ничего не узнать о более общих психологических процессах.
В некоторых случаях экспериментатор также стремится к жизненному реализму, наличие которого означает, что манипулирование переменными и их измерение производится таким же образом, как в повседневной жизни (Aronson and Carlsmith, 1968). Если исследователя интересует, как стиль заданных свидетелям вопросов влияет на их воспоминания о связанных с преступлением событиях (см. главу 8), то он может устроить так, чтобы испытуемые стали свидетелями инсценированного преступления, а затем сообщили свои воспоминания о нем при различных условиях допроса. При такой организации эксперимента в нем будет больше жизненного реализма, чем если показать испытуемым серию слайдов, а затем допросить их. Жизненный реализм особенно важен тогда, когда предполагается перенос результатов на специфическую ситуацию или психологический процесс из повседневной жизни, а не на более широкий класс ситуаций или процессов.
Экспериментальная валидность. Мы уже видели, что зависимые переменные должны быть валидными. Концепция валидности также применима к эксперименту в целом, и в этой концепции сведены воедино все основные проблемы, которые мы поднимали при обсуждении методологии проведения экспериментов. Выводы, которые мы получаем из экспериментов, могут быть невалидными — а значит, и непригодными для генерализации — по двум различным причинам. Мы можем ошибочно заключить, что между конкретными манипуляциями и конкретными оценками, которые мы используем, существует каузальная связь, в то время как на самом деле наблюдаемая связь возникла за счет какого — то другого фактора, артефакта или побочной переменной. В этом случае мы сделаем неправильный вывод из — за нарушения внутренней валидности эксперимента. Кроме того, можно также прийти к ошибочному заключению о том, что специфическая каузальная зависимость существует для всех прочих ситуаций с участием концептуальных переменных — ситуаций, которые не оценивались в данном исследовании; т. е. эта зависимость переносится на других людей, другие ситуации, оценки и концептуально эквивалентные манипуляции. В этом случае речь идет об отсутствии внешней валидности эксперимента. Чтобы избежать нарушения внутренней и внешней валидности выводов, нужно учитывать наиболее распространенные причины нарушения валидности, которые возникают при экспериментальных исследованиях, а затем анализировать различные способы планирования экспериментов, позволяющие избежать ошибок того и другого типа.
Давайте сначала рассмотрим некоторые источники нарушения внутренней валидности.
1. Внутренние артефакты. Возможно, что эффект, наблюдавшийся экспериментатором, был вызван неконтролируемым событием, которое не предусмотрено экспериментатором. Если дело обстояло именно так, то вывод о том, что эффект вызвала независимая переменная, будет неправильным.
2. Изменения испытуемых. Стимульные события (независимая переменная) могли не являться внешними для испытуемого — возможно, они происходили «внутри» него. Например, испытуемый был болен или беспокоился из — за какой — либо личной проблемы.
3. Эффект предварительного тестирования. Прохождение первого (предварительного) тестирования может повлиять на реакцию испытуемого на второе (итоговое) тестирование.
4. Тенденциозность отбора испытуемых, Если испытуемые распределяются по экспериментальным группам не случайным образом, то всегда сохраняется возможность того, что различия между экспериментальными группами вызваны не различиями в воздействовавшей на них независимой переменной, а ранее существовавшими различиями между испытуемыми из разных групп.
5. Экспериментальный отсев. Если после того, как испытуемые были случайным образом распределены по экспериментальным группам, некоторые из них выбывают из числа участников эксперимента за счет воздействия какого — либо фактора, не поддающегося контролю, то данные по этим испытуемым исключаются из общего анализа результатов, и выводы о влиянии независимой переменной на зависимую нельзя считать валидными. В число таких неконтролируемых факторов входят решение испытуемого не продолжать свое участие в эксперименте или какие — либо особенности, присущие самому эксперименту.
Для того чтобы понять, какие факторы обеспечивают внешнюю валидность эксперимента — или возможность переноса выводов на других людей, ситуации и тому подобное, — необходимо обсудить концепцию взаимодействия. Предположим, что нас интересует влияние наблюдаемого подкрепления на подражание (см. главу 2). Для изучения этого вопроса мы показываем маленьким детям фильмы, в которых взрослый мужчина — модель избивает куклу. В различных вариантах фильма после избиения куклы модель не получает ничего или получает одну, две, четыре или десять шоколадок. Затем детям предоставляют возможность «поиграть» с куклой, а исследователь регистрирует частоту поведения, похожего на «агрессивные» действия модели. Допустим, что среднее число реакций подражания возрастает с увеличением вознаграждения, полученного моделью в фильме. Исследователь заключает, что увеличение наблюдаемого подкрепления приводит к усилению реакции подражания.
Заметьте, что этот вывод не содержит никаких оговорок или ограничений. В нем подразумевается, что для всех типов моделей, испытуемых, вознаграждений, реакций, ситуаций и всех средств, используемых для представления действий модели, справедлива одна и та же зависимость между величиной наблюдаемого вознаграждения и частотой реакции подражания. В выводе не говорится о том, что эта зависимость получена только для детей определенного возраста, обучающихся в конкретной школе, которые наблюдали, как такой — то мужчина — модель в фильме совершал определенные специфические действия по отношению к кукле, за что получал шоколадки. А что если куклу будет бить модель — женщина — может быть, зависимость окажется другой? Предположим, что на самом деле частота реакции подражания уменьшается с увеличением вознаграждения, предлагаемого женщинам — моделям. Если связь между независимой переменной (величиной наблюдаемого подкрепления) и зависимой переменной (частотой реакции подражания) изменяется в зависимости от какой — либо другой переменной (в нашем примере это пол модели), то говорят, что происходит взаимодействие переменных, которое определяет результат.
Существует много типов взаимодействий. Частота подражания могла увеличиваться для обеих моделей, но уровни ее возрастания могли быть различными. Или же связи, обнаруженные в каждом из этих случаев, могли иметь противоположный характер (для одной модели частота возрастала, а для другой уменьшалась). Могло даже оказаться, что в одном случае связь наблюдается, а в другом не обнаруживается (величина наблюдаемого подкрепления не оказывает никакого влияния на частоту подражания). Короче говоря, при наличии взаимодействия ограничивается диапазон ситуаций, условий, испытуемых и т. п., на которые можно переносить результаты или зависимости, интересующие исследователя. При исследовании социального влияния и изменения установок редко удается найти переменные, не взаимодействующие с другими переменными, а значит, и сделать выводы, свободные от каких — либо ограничений или оговорок. На самом деле исследователи часто проводят эксперименты, предназначенные специально для выявления взаимодействий, потому что информация о наличии взаимодействия помогает нам решить главный вопрос о том, существует или отсутствует каузальная связь.
Теперь мы можем проанализировать некоторые из наиболее распространенных факторов, которые могут приводить к нарушению внешней валидности.
1. Эффект тестирования. Когда испытуемым предлагается тест, например, для оценки своих установок по соответствующей шкале, может оказаться, что тестирование влияет на то, как они поведут себя в дальнейшем. В исследовании, посвященном оценке установок, тестирование может стать стимульным условием, порождающим установки; до тестирования у испытуемого могло не быть установки по данному вопросу или он изменяет свою истинную реакцию, поняв цель, с которой проводится тестирование или эксперимент. Таким образом, любые результаты будут справедливы только для испытуемых, которые проходили тестирование.
2. Взаимодействие между факторами отбора и экспериментальной переменной. Влияние экспериментальной переменной может сказываться только на испытуемых, относящихся к определенному типу. Например, если изучались только испытуемые с крайними установками, то возможно, что переменные, которые обычно влияют на установки более умеренных в своих взглядах испытуемых, не повлияют на людей с крайними убеждениями.
3. Воздействие условий эксперимента. Специфические различия между условиями, существующими в экспериментальной обстановке, и условиями, существующими вне стен лаборатории, могут играть решающую роль при решении вопроса о границах применимости результатов эксперимента. Например, возможно, что испытуемые в ходе эксперимента всегда имеют сильную мотивацию внимательно прислушиваться к коммуникации, а в естественной обстановке это условие не выполняется.
4. Интерференция экспериментальных воздействий. Иногда каждый испытуемый подвергается тестированию в присутствии и в отсутствие экспериментальной переменной. Поэтому не исключено, что возникнут эффекты, вызванные последовательным воздействием: первая манипуляция не проходит для испытуемого бесследно и сказывается на том, как вторая манипуляция повлияет на его поведение. В таком случае результаты можно переносить только на испытуемых, подвергавшихся воздействию более одного раза, а возможно, только в той же последовательности.
План эксперимента
Теперь, после того, как мы рассказали о некоторых наиболее распространенных причинах нарушения внутренней и внешней валидности эксперимента, давайте посмотрим, насколько успешно можно устранить эти источники ошибок путем использования различных планов эксперимента.
В табл. 1 в обобщенной форме представлен набор, состоящий из пяти чрезвычайно сложных планов эксперимента. Наблюдения или измерения обозначены в таблице буквой О, а буква X относится к экспериментальному воздействию независимой переменной, которое получают испытуемые из данной группы. В каждом из этих экспериментов участвуют, по крайней мере, две группы испытуемых. Некоторые испытуемые получают данное воздействие; другие не подвергаются такому воздействию. Распределение испытуемых по группам, подвергающимся и не подвергающимся экспериментальному воздействию, всегда производится случайным образом (с помощью рандомизации). На случайный характер распределения испытуемых по группам указывает буква R. Например, самый простой из представленных в таблице планов — это план для двух рандомизированных групп. Экспериментальное воздействие получают только испытуемые из первой группы, после чего проводятся наблюдения за обеими группами.
Группа 1 | R | X | 0 |
Группа 2 | R | 0 |
В таблице также приводится перечень различных причин нарушения внешней валидности, которые были описаны выше. Если в столбце, соответствующем конкретной причине нарушения валидности, стоит «да», то это означает, что данный план эксперимента не позволяет устранить ошибки такого типа. «Нет» означает, что при данном плане эксперимента такая проблема не возникает. (Причины нарушения внутренней валидности в таблице не указаны. Ни одна из них не является источником проблем, если правильно спланирована и проведена экспериментальная процедура.)
«Лучшим» планом, позволяющим свести к минимуму количество источников нарушения валидности, является план для отдельной выборки с предварительным и итоговым тестированием. В этом случае экспериментатор случайным образом распределяет испытуемых по нескольким группам. Сначала экспериментатор тестирует реакции до экспериментального воздействия, но только у половины испытуемых. Оставшаяся половина испытуемых проходит тестирование через какое — то время. Однако те испытуемые, тестирование которых проводится позднее, также делятся пополам, так что одна группа получает экспериментальное воздействие, а другая не
Таблица 1
Некоторые планы эксперимента, минимизирующие источники нарушения валидности
* Здесь рандомизируется как распределение испытуемых по группам, так и выбор групп, получающих экспериментальное воздействие.
получает. Кроме того, читателю следует обратить внимание на одну важную отличительную особенность этого плана. Можно показать, что концептуальный статус независимой переменной не ограничивается единственным набором конкретных операций. При использовании двух различных наборов операций (Х1 и Х2 ), которые оба являются производными одной и той же концептуальной независимой переменной, появляется возможность делать из конкретных наблюдений общие выводы, относящиеся к абстрактным переменным.
Это описание показывает, что при любом плане эксперимента рандомизация играет очень важную роль. Важно также, чтобы наблюдения за испытуемыми не влияли на поведенческие результаты экспериментальных воздействий.