Приложение 2. ОЦЕНКА УСТАНОВОК И ИХ КОМПОНЕНТОВ. «Социальное влияние» | Зимбарго Филип

В ходе лабораторных и полевых исследований производится оценка реакций людей. В этой книге мы проанализировали много исследований и вкратце описали, как в них проводилось измерение зависимой переменной. В данном приложении мы дадим более подробное описание некоторых основных методов психологических измерений. Эти методы часто служат основой для разработки специфических оценок, удовлетворяющих потребностям конкретного исследования. Мы сосредоточим основное внимание на оценке установок, которые являются центральным понятием этой книги. Мы также коротко расскажем о том, как можно оценивать другие компоненты систем установок.

Если вы задумаетесь над этим вопросом, то поймете, что оценка установки — далеко не простая задача. Как измерить нечто, находящееся в человеческом сознании? Можно догадаться, что единственный способ решения этой проблемы — заставить человека сделать внутренние установки внешними, чтобы их можно было оценить. Иными словами, надо добиться, чтобы внутренние установки человека выразились в его внешнем поведении. Элементом этого поведения может быть прохождение письменного тестирования или заполнение анкеты.

Шкалы установок

Для оценки установок разработано несколько различных письменных тестов. Четыре теста после тщательной разработки достигли довольно высокого уровня совершенства. В число этих основных методов тестирования установок входят метод равных интервалов Терстоуна, метод суммируемых оценок Ликерта, шкалограмм — ный анализ Гуттмана и метод семантического дифференциала Осгуда. Надеемся, что, ознакомившись с краткими обзорами каждого из этих методов, вы получите ясное представление о том, как социальные психологи получают данные, на основе которых они потом делают столь красивые обобщения.

В основе каждого из обсуждаемых методов лежат различные предположения о характере пунктов теста и характере информации об установках человека, которую можно получить в результате тестирования. Тем не менее есть некоторые основные предположения, которые являются общими для всех этих методов. В первую очередь предполагается, что субъективные установки поддаются количественному измерению, т. е. мнение каждого человека можно охарактеризовать с помощью какого — либо числового показателя. Во — вторых, во всех этих методах предполагается, что каждый конкретный пункт теста имеет одинаковый смысл для всех респондентов, и поэтому данный ответ будет оцениваться одинаково, кто бы его ни дал. Эти предположения могут быть не всегда оправданными, но до сих пор еще не разработана такая методика измерений, чтобы можно было обойтись без этих предположений.

Метод равных интервалов Терстоуна. Первый из основных методов оценки установок был разработан в 1929 году Терстоуном в работе, посвященной исследованию установок по отношению к религии. Создав шкалу оценки установок, он впервые предложил методику точных измерений для области исследований, в которой они прежде никогда не использовались. Терстоун предположил, что можно отобрать высказывания, содержащие мнения по какому — нибудь конкретному вопросу, и ранжировать эти высказывания по показателю, отражающему благоприятное или неблагоприятное отношение к данному вопросу, выраженное в высказываниях. Кроме того, можно ранжировать эти высказывания таким образом, чтобы разность показателей соседних высказываний континуума оказалась одинаковой. Последнее предположение позволяет дать количественную оценку расхождений между установками разных людей. Терстоун также предположил, что между высказываниями нет корреляционной связи и что в каждом высказывании выражена точка зрения, которая не зависит от других высказываний. Это означает, что из принятия одного высказывания не следует, что надо обязательно принять еще и какое — либо другое.

Шкала Терстоуна состоит примерно из 20 независимых высказываний, содержащих мнения по определенному вопросу. Каждому высказыванию соответствует значение показателя на числовой шкале, которое определяется его положением в континууме, а это положение в свою очередь определяется в соответствии с усредненными судейскими оценками.

Чтобы оценить установки людей по данному вопросу, их просят отметить те высказывания, с которыми они согласны. Общая оценка установок каждого человека определяется как среднее значение показателей тех высказываний, которые он отметил. Ниже приводится в качестве примера сокращенный вариант такой шкалы (табл. 2).

Отличительной особенностью шкалы Терстоуна является то, что интервалы между показателями соседних высказываний примерно одинаковы. Такое свойство шкалы достигается за счет метода ее построения. Первый шаг — это сбор большого количества высказываний по какому — нибудь конкретному вопросу. Все неясные, туманные или двусмысленные высказывания, а также высказывания, которые могли бы одобрить индивидуумы с противоположными установками, сразу же исключа-

Таблица 2

ются из рассмотрения. Затем группа судей сортирует все оставшиеся высказывания, разбивая их на 11 категорий в соответствии с тем, насколько выраженное в высказывании мнение благоприятно или неблагоприятно по отношению к рассматриваемой проблеме, независимо от собственных установок судей. Таким образом, эти классы образуют шкалу с диапазоном от наиболее благоприятных до крайне неблагоприятных мнений по отношению к данной проблеме, включая нейтральные. Протабулировав оценки всех судей, можно рассчитать положение каждого высказывания на числовой шкале (его среднее значение на шкале) и то, насколько судьи единодушны в мнениях об этом положении (разброс оценок). Для включения в окончательную шкалу отбирают высказывания, по которым мнение судей было примерно одинаковым и которые попадают в примерно одинаковые интервалы на континууме. После этого можно оценить установки человека по отношению к данной проблеме по его ответам на набор пунктов окончательно сформированной шкалы.

Метод суммируемых оценок Ликерта. Один из практических недостатков шкалы Терстоуна состоит в том, что ее построение чрезвычайно трудоемко и занимает много времени. Чтобы решить эту проблему, Ликерт разработал другую методику, с помощью которой сравнительно просто можно получить столь же надежную шкалу установок. Шкала Ликерта состоит из ряда высказываний, выражающих мнения по определенной проблеме. Однако в отличие от шкалы Терстоуна для оценки установки человека его просят указать степень своего согласия или несогласия с каждым пунктом. Для этого человек оценивает каждый пункт по пятибалльной шкале реакций (полностью согласен, согласен, не могу решить, не согласен, решительно не согласен). Оценкой установки человека служит сумма выставленных им оценок по всем пунктам. Ниже приводится пример одного пункта такой шкалы.

А. «Смертный приговор — это правильное наказание за преднамеренное убийство».

Ликерт предполагает, что каждое высказывание, включенное в шкалу, является линейной функцией одного и того же параметра установки. На основе этого предположения для получения итоговой оценки установки производится операция суммирования оценок, выставленных человеком по отдельным пунктам шкалы. Отсюда следует, что должна существовать тесная корреляция между пунктами шкалы и некоторой общей характеристикой, а значит, в отличие от четко разграниченных и независимых пунктов шкалы Терстоуна пункты шкалы Ликерта коррелируют между собой. Важно отметить, что Ликерт ни в коем случае не предполагает, что интервалы между значениями шкалы равны. Например, вполне возможно, что разница между «согласен» и «полностью согласен» значительно больше, чем разница между «согласен» и «не могу решить». Это означает, что шкала Ликерта позволяет получить информацию о порядковом распределении установок людей на континууме, но с ее помощью нельзя точно указать, насколько близки или далеки друг от друга различные установки.

Построение шкалы Ликерта на начальном этапе аналогично построению шкалы Терстоуна: производится сбор и редактирование различных высказываний, выражающих определенные мнения по какой — нибудь проблеме. Затем испытуемые из выборки оценивают оставшиеся после отбора высказывания по пятибалльной шкале реакций, основываясь на своем собственном мнении об этих высказываниях. Этим процедура построения шкалы Ликерта отличается от процедуры построения шкалы Терстоуна, где оценки выставляют подготовленные судьи, которые основывают их не на личном мнении, а на некоторой относительно объективной оценке положения каждого высказывания на континууме. В шкалу Ликерта включают те пункты, по которым сильнее всего расходятся в оценках испытуемые с самыми низкими и самыми высокими итоговыми оценками из всей выборки.

Шкалограмма Гуттмана. Третий метод шкалирования основан на предположении, что степень выраженности единственного одномерного свойства можно измерить с помощью набора высказываний, которые упорядочены вдоль континуума «трудности принятия». Это означает, что высказывания находятся в диапазоне от тех, которые большинству людей легко принять, до тех, которые поддержали бы

Таблица 3

лишь немногие люди. Пункты такой шкалы кумулятивны, поскольку из принятия одного пункта следует, что человек принимает все пункты, соответствующие меньшим значениям шкалы (эти пункты принять легче). Таким образом, можно предсказать отношение человека к другим высказываниям, зная, с каким наиболее трудным для принятия пунктом согласен этот человек. Примером шкалы Гуттмана может послужить следующая шкала: табл. 3.

Чтобы построить шкалу, отражающую единственный показатель, Гуттман предлагает испытуемым из выборки начальный набор пунктов и регистрирует их реакции на пункты шкалы, в которых приведены готовые образцы ответов. Эти образцы, которые называются классами шкалы, выстроены в определенном ступенчатом порядке. Испытуемый может не принять ни одного из пунктов этого набора (оценка 0), может принять только пункт А (оценка 1), может принять только пункты А и Б (оценка 2), может принять А, БиВ (оценка 3) и так далее. Если ответы испытуемого не укладываются в схему шкалы (например, он принимает только пункт Вине принимает пункты с меньшими значениями по шкале), то предполагается, что он сделал не менее одной ошибки в ответах. Анализируя количество сделанных в ответах ошибок, можно определить, до какой степени первоначальный набор пунктов отражает одномерное свойство (т. е. насколько эти пункты поддаются шкалированию). Окончательная шкала получается путем исключения непригодных пунктов и повторного тестирования испытуемых из выборки, пока не будет разработан набор пунктов, пригодных для шкалирования.

Чтобы оценить установки человека, его просят отметить на шкале те высказывания, которые для него приемлемы. Варианты шкалы Гуттмана используются в исследованиях актуальности установок для определения сфер принятия и отвержения (см. главу 6). Итоговой оценкой является оценка соответствующего класса шкалы или (если ответы испытуемого не укладываются в схему шкалы) оценка класса шкалы, ближайшего к этим ответам. Из описания процедуры получения оценки следует, что почти невозможно разработать идеальную одномерную шкалу. Возможно, дело в том, что люди в действительности реагируют не на единственный гипотетический параметр, а на какой — то другой или сразу на несколько параметров.

Метод семантического дифференциала Осгуда. В трех вышеописанных методах предпринимается попытка оценивать установки, заставив людей указать степень своего согласия с различными высказываниями, выражающими мнения. В отличие от такого подхода Осгуд при изучении установок обращал основное внимание на смысл, который люди придают слову или понятию. В основе этой методики лежит главное предположение о существовании гипотетического семантического пространства, обладающего неопределенным количеством измерений, в котором смысл любого слова или понятия можно представить в виде конкретной точки. Следуя процедуре Осгуда, надо попросить людей оценить конкретное понятие с помощью набора семантических шкал. На концах этих шкал находятся слова противоположного значения, а в середине — точка нейтральности; обычно шкалы состоят из семи, отличных друг от друга шагов. Например, можно оценить, что понимает конкретный человек под понятием «атомная энергия», зная его оценки этого понятия по ряду семантических шкал, составляющих набор:

Хорошо_____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Плохо

Сильно _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Слабо

Быстро _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Медленно

Активно_____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Пассивно

и так далее.

Анализируя собранные таким образом оценки, можно выявить конкретные параметры, которыми люди пользуются для определения своих ощущений, классы понятий, которые рассматриваются как сходные или различные по смыслу, и интенсивность смысла, вкладываемого в конкретное понятие. Собственные исследования Осгуда показали, что существуют три доминантных, независимых параметра, которыми люди пользуются для оценки понятий (Osgood et al., 1957). Он называет эти параметры оценочным фактором (например, хороший — плохой), фактором мощности (например, сильный — слабый) и фактором активности (например, активный— пассивный). Хотя этот метод может дать массу информации о понятии, не вполне ясно, каким образом смысл понятия для данного человека связан с установками этого человека.

Использование шкал с одним и несколькими пунктами в экспериментах. В большинстве исследований установок или изменения установок, особенно в лабораторных экспериментах, используемая для оценки установки шкала состоит только из одного или нескольких пунктов. Как правило, используется формат шкалы Ликерта, а не систематично разработанный вопросник со многими пунктами. Например, при исследовании убеждения в первом пункте, предлагаемом сразу же после убеждающего сообщения, может быть снова сформулирован вывод из этого сообщения, и испытуемого попросят оценить степень своего согласия с ним по шкале Ликерта. В шкале может быть пять, десять или даже тридцать и более пунктов, а подгруппам пунктов могут быть присвоены описательные ярлыки. Например:

Следует ввести для студентов плату за парковку автомашин на территории университета в размере 50 долларов за семестр:

1 2 3	4 5 6	7 8 9	10 11 12	13 14 15
Резкие возражения	Умеренные возражения	Не могу решить	Умеренное согласие	Полное согласие

Можно также применять шкалу семантических дифференциалов в модифицированной форме. Часто семантические шкалы выбирают для того, чтобы подчеркнуть параметр «хороший — плохой», который лучше всего соответствует определению установки как итогового оценочного мнения. Например, после того как испытуемые прослушали сообщение, в котором поддерживается идея введения платы за автостоянку, их можно попросить оценить концепцию введения для студентов платы за парковку по четырем параметрам: «хорошо — плохо», «умно — глупо», «благоприятно — неблагоприятно» и «полезно — вредно». В некоторых случаях оценки каждого испытуемого по всем параметрам можно просуммировать и принять эту сумму за общую оценку установки испытуемого.

Кроме этих распространенных подходов используются также специфические шкалы самоотчета. Например, можно попросить испытуемых оценить свое отношение к объекту установки по шкале «нравится — не нравится».

Оценка установок: каждый исследователь выбирает метод на свой вкус.

В действительности в исследованиях используются самые разные методы измерения установок. В связи с отсутствием единой измерительной методики при интерпретации и сравнении полученных оценок возникают проблемы. Фактически разные исследования отличаются между собой не только тем, какие в них используются измерительные шкалы или какие задачи ставятся перед испытуемыми при тестировании. Даже при использовании весьма сходных систем измерения в экспериментах могут применяться различные методики преобразования этих обычных реакций в количественно определенные независимые переменные. Последнюю из упомянутых проблем можно проиллюстрировать на примере: в одном исследовании испытуемых просят высказать свое мнение, отметив точку на шкале «за — против», а в другом используется шкала «нравится — не нравится». Изменение установок может быть описано с помощью любой из следующих оценок: 1) процентная доля испытуемых, у которых вообще наблюдаются какие — либо положительные изменения; 2) процентная доля испытуемых, у которых наблюдаются «большие», «умеренные» и «маленькие» изменения или они отсутствуют (классы определяются произвольно); 3) сальдо процентных изменений (положительные, минус, отрицательные изменения); 4) любая из приведенных выше оценок, рассчитанная для произвольно выбранного сочетания пунктов теста; 5) изменение абсолютного среднего положения установки на шкале; 6) изменение положения установки, отнесенное к величине возможного изменения.

Применение разнообразных методов измерения установок имеет и свою положительную сторону. Во — первых, если исследователи получают сходные результаты даже если они используют различные измерительные методики, то возрастает наша уверенность в том, что эти результаты достоверны, а основанные на них выводы можно переносить на других испытуемых, ситуации, условия и т. п. — т. е. можно утверждать, что рассматриваемые независимые переменные действительно влияют на установки таким способом, который наблюдался в исследованиях (Campbell and Fiske, 1959). Если зависимая переменная все время измерялась совершенно одинаковым способом, то не исключается возможность влияния процедуры измерения, которое могло внести свой вклад в появление наблюдавшихся эффектов. Во — вторых, между оценками, полученными при использовании тщательно выбранных и разработанных методов измерения установок (даже при использовании шкал с несколькими пунктами), обычно существует довольно сильная корреляционная связь, что говорит о том, что с их помощью измеряются чрезвычайно сходные аспекты установки. В — третьих, отметим, что разные исследователи могут исходить из неодинаковых определений установки. Например, в некоторых теоретических работах, посвященных проблемам прикладных исследований, установки рассматриваются как сумма убеждений и когниций, в то время как при использовании других подходов и при анализе других проблем исследователей может интересовать в основном аффективный компонент установок. В первом случае наиболее подходящим измерительным инструментом может оказаться шкала Терстоуна; во втором случае можно использовать оценки по шкалам «нравится — не нравится» и «хорошо — плохо». И в том и в другом случае речь идет об измерении установок, однако методы измерений не являются идентичными ни с концептуальной, ни с операционной точки зрения — да они и не должны быть идентичными.

Измерение других компонентов систем установок

Во всех главах этой книги мы встречались со случаями, когда измеряется фактическое поведение, которое должно следовать из установок данного человека. В некоторых исследованиях процессов убеждения, например, экспериментатор может предоставить испытуемым возможность действовать в соответствии с новой установкой, появившейся у них в результате прослушивания убеждающего сообщения: подписать обращение, стать донором и сдать кровь, купить определенный продукт или прореагировать каким — либо иным способом, рекомендованным в убеждающем сообщении. В исследованиях получения согласия и когнитивного диссонанса рассматриваются такие поступки, как покупка лотерейных билетов, ложь в адрес другого испытуемого или откровенный отказ подчиниться групповому решению. Если наблюдение фактического поведения невозможно, то исследователи могут измерять поведенческие намерения, которые обычно коррелируют с будущим поведением, но эту корреляцию ни в коем случае нельзя считать идеальной (см. главы 1 и 5). Исследователь может попросить испытуемых оценить по числовой шкале вероятность того, что они совершат тот или иной поступок (например, приобретут продукт или бросят курить).

В последние годы социальные психологи проявляют все больший интерес к измерению когниций установочной системы. Одним из популярных методов, часто используемых в исследованиях процессов убеждения, является метод перечисления мыслей (Greenwald, 1968; Petty and Cacioppo, 1981). После того как испытуемые прослушали или прочитали убеждающее сообщение, их просят записать все свои мысли, имеющие к нему отношение. Им дают инструкцию разделить свои мысли на «отдельные идеи» и выдают бланки для ответов, где имеются графы для последовательной записи «идей», из которых состоят мысли. На выполнение задания отводится определенное время (часто это три минуты). Затем не менее двух судей оценивают и классифицируют эти мысли (судьям неизвестно, в какой экспериментальной группе находился каждый испытуемый). В зависимости от основной цели эксперимента мысли можно классифицировать по характеру их содержания: выражено ли в них согласие или несогласие с точкой зрения, высказанной в убеждающем сообщении; отражают ли они идеи, высказанные в сообщении, или собственные идеи испытуемого; касаются ли они самого сообщения или коммуникатора и так далее. Проанализировав мысли определенных типов, исследователь часто может узнать многое об убеждениях и знаниях, лежащих в основе установки, и о том, как предъявление убеждающего сообщения и другие манипуляции повлияли на эти ментальные переменные.

Существует также метод контент — анализа, который предназначен для анализа письменных сочинений, групповых дискуссий и других вербальных реакций, причем анализ производится по таким параметрам, как сложность мышления, оценочная последовательность мышления и знание предмета.

Для оценки концептуальных переменных, имеющих отношение к установкам, используются также измерения временных и физиологических показателей. Например, для изучения доступности и силы установок измеряется время, которое необходимо людям для того, чтобы сообщить о своем согласии или несогласии с краткими установочными высказываниями.

Измерение физиологических показателей, таких как частота сердцебиения и гальванические кожные реакции (связанные с потоотделением), уже давно используется при исследовании эмоций и аффективных компонентов установок. Проводя традиционные процедуры измерения физиологических показателей, можно достоверно зарегистрировать изменения интенсивности чувств и эмоций, но такие данные не позволяют судить о том, какие установки отражают эти эмоции — позитивные или негативные. Тем не менее не так давно исследователи начали изучать весьма специфические физиологические реакции на социальные стимулы и предполагают, что эти реакции могут отражать фактическую ориентацию установок человека по отношению к социальному стимулу, однако эта гипотеза требует дальнейшей проверки. Например, в исследованиях по одной тщательно разработанной программе получены данные наблюдений, которые говорят о том, что когда люди слушают и обдумывают убеждающее сообщение, у них происходят небольшие, но поддающиеся измерению изменения активности лицевых мускулов, находящихся вокруг рта (Cacioppo and Petty, 1987). Известно, что эти изменения имеют различный характер для случаев, когда реципиент возражает против доводов, приведенных в сообщении, и когда это сообщение вызывает когнитивные реакции согласия.

В целом можно сказать, что в работах, посвященных исследованию изменения установок и социального влияния, применяется множество самых разнообразных измерительных методик, причем некоторые подходы разработаны лучше, чем другие.

Название книги

Социальное влияние

Зимбарго Филип

Ляйппе Майкл

Приложение 2

ОЦЕНКА УСТАНОВОК И ИХ КОМПОНЕНТОВ