Глава 5. Кнут и пряник. «Законы влияния. Как побудить людей делать то, что вам нужно»

Данную главу мы, пожалуй, начнем с собачьей слюны.

Иван Павлов родился в 1849 году в Рязани, провинциальном российском городе. Его отец был священником, и Иван тоже начинал свое обучение в семинарии. Но бросил ее и поступил в университет, чтобы изучать естественные науки. Там он занялся исследованием процесса пищеварения у животных. Он был весьма серьезным ученым, автором множества научных работ. А в 1904 году он получил Нобелевскую премию в области медицины.

Павлов обнаружил удивившую его особенность. Он измерял количество слюны, которое собаки выделяли в процессе пищеварения, и заметил, что слюноотделение у собак начиналось еще до трапезы, в тот момент, когда они видели еду.

Позже он выяснил, что слюноотделение начиналось еще раньше. Слюноотделение запускал звонок колокольчика, звучавший при отпирании двери в питомник. Собаки также «пускали слюнки», когда слышали шаги человека, который должен был их покормить. Павлов начал серию экспериментов, основываясь на автоматической реакции собак на внешние раздражители, названной им «классическим условным рефлексом». Вот как это работает:

Во-первых, вы совмещаете стимул (пища) и реакцию на него (слюноотделение):

Стимул (пища) → Ответная реакция (слюноотделение)

Затем необходимо добавить дополнительный стимул:

Стимул 1 (пища) + Стимул 2 (звонок) → Ответная реакция (слюноотделение)

Со временем вы сможете удалить первоначальный стимул, и тогда дополнительный стимул сам по себе будет вызывать ответную реакцию:

Стимул 2 (звонок) → Ответная реакция (слюноотделение)

Но какое отношение все это имеет к тому, чтобы заставить людей делать то, что вам нужно? В конце концов, весьма маловероятно, что вы захотите заставить кого-то пускать слюни!

Как заставить людей автоматически делать то, что вам нужно

Классический условный рефлекс — отправная точка для понимания автоматического поведения. Один из способов заставить людей что- то сделать состоит в том, чтобы довести нужное действие до автоматизма. Такую работу выполнять гораздо проще. На самом деле наше поведение соответствует классическому условному рефлексу Павлова очень часто.

Я использую условные рефлексы в преподавательской деятельности. Я веду одно-двухдневные курсы для представителей крупных компаний и некоммерческих организаций, кроме того, преподаю в колледже. Во время лекций я обычно устраиваю несколько коротких перерывов.

Люди выходят, чтобы поболтать, или остаются в аудитории, чтобы проверить электронную почту или почитать эсэмэски. Но когда перерыв заканчивается, я хочу, чтобы слушатели вернулись на свои места и учились дальше. Для этого я использую классические условные рефлексы.

Когда приходит время перерыва, я включаю музыку и открываю дверь в аудиторию. Когда перерыв заканчивается, я выключаю музыку и подхожу к двери, чтобы закрыть ее:

Стимул 1 (Преподаватель говорит: «OK, давайте продолжим с того места, где мы остановились») → Ответная реакция (Люди рассаживаются по местам и затихают)

Затем мы добавляем:

Стимул 1 (Преподаватель говорит: «OK, давайте продолжим с того места, где мы остановились») → Стимул 2 (Музыка выключается и/или преподаватель идет к двери, чтобы закрыть ее) → Ответная реакция (Люди рассаживаются по местам и затихают)

После нескольких повторений мы получим следующее:

Стимул 2 (Музыка выключается и/или преподаватель идет к двери, чтобы закрыть ее) → Ответная реакция (Люди рассаживаются по местам и затихают)

Вот другой пример: я хочу, чтобы мои студенты принимали участие в обсуждении, когда я подхожу к доске и задаю вопрос:

Стимул 1 (Преподаватель говорит: «Что вы думаете об этом? Есть у кого-нибудь идеи?) → Ответная реакция (Люди делятся своими соображениями)

Затем мы добавляем:

Стимул 1 (Преподаватель говорит: «Что вы думаете об этом? Есть у кого-нибудь идеи?) → Стимул 2 (Преподаватель подходит к доске, берет в руку мел и смотрит на класс, вопросительно подняв брови) → Ответная реакция (Люди делятся своими соображениями)

В итоге мы получим следующее:

Стимул 2 (Преподаватель подходит к доске, берет в руку мел и смотрит на класс, вопросительно подняв брови) → Ответная реакция (Люди делятся своими соображениями)

Теперь вы знаете два моих секрета управления классом!

Стратегии

Стратегия 39: когда люди привыкают что-то делать, вы можете добавить пару новых стимулов к нужному вам поведению и заставить людей реагировать на них автоматически.

Что хорошо известно казино

Что объединяет следующие категории людей?

— Школьников, получающих деньги за каждую принесенную домой «пятерку».

— Сотрудников, получающих ежегодную прибавку к зарплате.

— Посетителей кофе, получающих каждую десятую чашку кофе бесплатно.

— Игроков, бросающих жетон за жетоном в игровые автоматы в Лас-Вегасе.

Ответ таков: их поведение формируется согласно принципам, сформулированным Б. Ф. Скиннером.

Каждый раз, когда я вижу людей, которые, сидя в казино, жмут на кнопки игровых автоматов, я вспоминаю об экспериментах Скиннера. Наверняка некоторые из вас уже возмутились: «Лас-Вегас — это не только игровые автоматы». Постараюсь не обидеть защитников казино.

Я хочу поговорить о теориях поведенческого анализа, получивших широкое признание начиная с 1950-х годов. А также пояснить, почему вы должны понимать, как они работают.

В 1950-х годах Скиннер развил теорию Павлова о классических условных рефлексах. Скиннер начал экспериментировать с крысами и голубями, изучая, как на их поведение влияет получение вознаграждения. Он назвал это выработкой «оперантных» условных рефлексов (по аналогии с «классическими» условными рефлексами, описанными Павловым).

При этом сам Скиннер предпочитал термин «подкрепление», и чуть позже я поясню почему.

Идея заключалась в следующем: если вы хотите усилить проявления определенного поведения, вам следует его подкрепить (вознаграждением). Если вы хотите ослабить проявления определенного поведения, вы подкрепляете желательное поведение и игнорируете нежелательное. Звучит вполне здраво, однако Скиннер решил выйти за пределы здравого смысла, чтобы подвести под свои наблюдения научную основу. Вот как выглядела базисная идея Скиннера:

Поведение → Подкрепление → Усиление поведения

Например:

Получение «пятерки» в школе → Получение пяти долларов → Получение большего количества «пятерок»

Или:

Нажатие на кнопку → Получение денег в игровом автомате → Многочисленные нажатия на кнопку

Или:

Своевременное предоставление отчета → Получение похвалы за отличную работу, сделанную в срок → Подготовка последующих отчетов к установленному сроку.

Скиннер пошел дальше, пытаясь выяснить, какими должны быть подкрепления, когда их следует делать, как часто и в каком объеме. Если вы хотите, чтобы люди делали то, что вам нужно, вам следует быть в курсе некоторых тонких, но важных нюансов человеческого поведения.

Задумайтесь: вы пытаетесь заставить кого-то, например, регулярно выносить мусор, вовремя сдавать отчеты или голосовать на выборах. Вы напрягаете свой мозг, пытаясь придумать, как это сделать. «Может быть, мне нужно его (или ее) как-то простимулировать? — думаете вы. — Деньгами или чем-то еще?»

В то же самое время тысячи людей сидят в казино и раз за разом жмут на кнопку, хотя им за нажатие кнопки никто не платит. Напротив, это они платят кому-то за право нажать на кнопку (и в большинстве случаев потерять при этом собственные деньги). Не хочется ли вам узнать «секрет казино», который, вполне возможно, пригодится и вам? Но сначала давайте поговорим о крысах.

Пять базовых режимов подкрепления

Допустим, вы поместили крыс в клетку с кнопкой. Каждый раз, когда крыса нажимает на эту кнопку, она получает порцию пищи. Еда служит подкреплением определенного поведения:

Поведение → Подкрепление → Усиление поведения

В нашем случае эта схема выглядит следующим образом:

Нажать кнопку → Получить порцию пищи → Чаще нажимать на кнопку

Но что будет, если вы сделаете так, что крыса перестанет получать еду каждый раз, когда она нажимает на кнопку?

Скиннер проверял различные сценарии и обнаружил, что может предсказывать и контролировать, как часто и как быстро крысы будут нажимать на кнопку, чтобы получить еду. В ходе эксперимента он менял необходимое для получения пищи условия (количество и частоту нажатий на кнопку) и наблюдал происходящие изменения.

Были использованы пять базовых режимов подкрепления:

— Непрерывное подкрепление. Вы выдаете порцию пищи каждый раз, когда крыса нажимает на кнопку.

— Фиксированный интервал. Вы выдаете порцию пищи в ответ на нажатие кнопки лишь в том случае, если после предыдущего нажатия прошло определенное количество времени, например пять минут. Крыса получает еду при первом нажатии, которое состоится после истечения пятиминутного перерыва.

— Переменный интервал. Вы также выдаете порции пищи с временными интервалами, но при этом продолжительность каждого интервала постоянно меняется. Иногда он составляет одну минуту, иногда пять, иногда три и т. д.

— Фиксированное количество нажатий. Выдача пищи зависит не от частоты, а от количества нажатий на кнопку. Например, крыса получала еду после каждого десятого нажатия. Необходимое количество нажатий оставалось постоянным.

— Переменное количество нажатий. В этом случае подкрепление также основано на количестве нажатий, но при этом необходимое количество постоянно меняется. Иногда требуется нажать на кнопку пять раз, в другой раз — десять, затем три и т. д.

Выяснилось, что в каждом из пяти случаев крысы (и люди) ведут себя предсказуемо. В следующих разделах вы узнаете, как использовать эти режимы для того, чтобы влиять на поведение людей.

Стратегии

Стратегия 40: недостаточно просто дать человеку вознаграждение. Нужно правильно выбрать режим подкрепления, чтобы использование вознаграждения действительно помогло заставить человека делать то, что вам нужно.

Непрерывное подкрепление: как заставить людей сделать что-то новое

Если вы даете своей дочери деньги (подкрепление) каждый раз, когда она получает отличную оценку (желаемое поведение), вы тем самым используете режим непрерывного подкрепления. Если вы хвалите своих сотрудников (подкрепление) каждый раз, когда они своевременно предоставляют вам отчет (желаемое поведение), вы используете тот же режим. Непрерывное подкрепление лучше всего подходит для тех случаев, когда вы пытаетесь сформировать новое поведение. Когда оно уже сформировано, вы должны переключиться на один из других режимов.

Вначале использования режима непрерывного подкрепления вы получаете заметный результат обучения человека (или крысы, или собаки) новому поведению. Но с течением времени желаемое поведение станет неустойчивым. Кроме того, у этого режима есть и обратная сторона. Если вы исключите подкрепление (то есть прекратите платить деньги за каждую «пятерку» или не будете хвалить сотрудников за каждый своевременно предоставленный отчет), желаемое поведение, скорее всего, тоже прекратится.

Стратегии

Стратегия 41: желая сформировать у человека новое поведение, вознаграждайте его всякий раз, когда он ведет себя так, как нужно (непрерывное подкрепление).

Стратегия 42: после того как желаемое поведение будет сформировано, перейдите с режима непрерывного подкрепления на другой режим для сохранения полученного результата.

Переменная норма: как заставить людей продолжать делать то, что вам нужно

Когда вы хвалите сотрудника не за каждое выполненное им поручение, действует режим подкрепления с переменной нормой.

Выигрыш в игровом автомате после 56 проигранных раундов — результат действия этого же режима. Большинство игр казино основаны именно на нем. Игрок жмет на кнопку 10 раз и получает награду, после чего играет еще 52 раза до следующего вознаграждения.

С точки зрения сотрудника или игрока, режим с переменной нормой выглядит непредсказуемым. Количество повторов правильного поведения, необходимых для получения награды, все время меняется. Человек не знает, поощрят ли его уже в следующий раз, когда он сделает требуемое, или же это произойдет лишь на тридцатый, пятый или даже сотый раз. Именно поэтому он повторяет необходимые действия снова и снова.

Режим с переменной нормой заставляет человека придерживаться выработанного поведения. Даже если вы исключите подкрепление, человек будет продолжать делать то, что вам нужно, в течение длительного времени. Психологи назвали бы такое поведение «устойчивым к ослаблению».

Стратегии

Стратегия 43: если вы хотите, чтобы человек придерживался выработанного поведения, давайте ему вознаграждение в переменном режиме.

Переменный интервал: как сделать нужное поведение регулярным

Джордж работает в лаборатории, которую периодически проверяет надзирающее правительственное ведомство. Он знает, что проверяющий обязательно придет, но не знает когда. Возможно, визит состоится уже в этом месяце, или в течение трех ближайших месяцев, или в течение полугода. Инспектор любит приходить неожиданно.

Джордж приходит к выводу, что ему следует постоянно быть наготове, чтобы в любой момент продемонстрировать: лаборатория полностью соответствует всем действующим нормам. В данном случае желаемое поведение состоит в соблюдении всех правил и требований к лаборатории, а получение отличной оценки по результатам проверки служит подкреплением.

Инспектор приходит с непредсказуемыми интервалами. Соответственно, в данном случае используется режим с переменным интервалом:. Можно ожидать, что Джордж большую часть времени будет делать все необходимое для того, чтобы лаборатория удовлетворяла существующим требованиям, и такое (желаемое) поведение будет сохраняться довольно долго (то есть будет обладать устойчивостью к ослаблению).

Если ваша цель — заставить людей делать что-то регулярно, но не обязательно часто, то использование режима с переменным интервалом подкрепления вам подойдет.

Джордж, вероятно, построит свою работу так, чтобы как минимум раз в месяц убеждаться: лаборатория готова к приходу инспектора. Но поскольку проверки проводятся не слишком часто, он не будет заниматься такой подготовкой каждый день. Зато мы можем ожидать, что Джордж будет делать это регулярно.

Режим с переменным интервалом подкрепления не слишком хорош для формирования нового поведения хотя бы потому, что вознаграждение выдается недостаточно часто для того, чтобы создать устойчивую связь между поведением и наградой. Поэтому сначала вам нужно будет использовать непрерывное подкрепление, а после того, как новое поведение будет сформировано, перейти к использованию режима с переменным интервалом подкрепления.

Стратегии

Стратегия 44: используйте режим с переменным интервалом подкрепления, когда нужное вам поведение должно демонстрироваться не часто, но регулярно.

Фиксированная норма: как резко активизировать нужное поведение

Допустим, вы владелец кафе и у вас имеются карточки постоянного покупателя. За каждые десять чашек кофе, купленных клиентом, он получает одну бесплатно. Соответствующая отметка делается на карточке клиента всякий раз, когда он оплачивает чашку кофе. Это режим с фиксированной нормой подкрепления.

Исследователи утверждают, что такой подход приведет к резкой активизации желаемого вами поведения (клиент будет покупать кофе как можно чаще, чтобы быстрее заработать вознаграждение), но затем, после получения вознаграждения (бесплатной чашки), наступит период затишья и количество проявлений желаемого поведения пойдет на спад (клиент будет реже заказывать кофе).

Чем ближе к цели, тем сильнее мотивация

Существует не так много способов предотвратить это. Вы можете побудить людей начать путь сначала (дать им новую, пустую карточку) или же установить для них следующий уровень лояльности, достижение которого принесет им большее вознаграждение.

Однако есть способ заметно активизировать их поведение.

Ран Кивец [46] провел эксперимент с постоянными посетителями кафе. Одним он выдал карточки А, а другим — карточки В:

— На карточке А было 10 пустых клеток для отметок о купленных чашках кофе.

— На карточке В было 12 пустых клеток, но, когда участники эксперимента получали эти карточки, в 2 клетках из 12 отметки уже стояли,

И в том и в другом случае обладатели карт постоянного покупателя должны были заказать десять чашек кофе, чтобы получить одну бесплатно. Можно ли ожидать, что обладатели карточек разного типа будут вести себя по-разному?

Правильный ответ — «да». Обладатели карточек В заполнили их быстрее, чем обладатели карточек А, несмотря на то что и тем и другим потребовалось купить для этого одинаковое количество чашек кофе.

Причиной тому стал так называемый эффект приближения к цели. Он был впервые описан еще в 1934 году Кларком Халлом [40], проводившим опыты с крысами. Халл обнаружил, что крысы, запущенные в лабиринт, на выходе из которого их ждала порция пищи, начинали бежать быстрее по мере приближения к цели.

Поэтому когда клиенты, получившие карточку В, видели, что часть пути к цели уже пройдена (несмотря на то что эти две чашки они не покупали), то начинали действовать быстрее, чтобы заполнить оставшиеся клетки своей карточки.

Кивец также обнаружил, что людям нравится участвовать в программах лояльности. По сравнению с клиентами, не участвовавшими в программе, эти посетители больше улыбались, чаще болтали с сотрудниками кафе и благодарили их, чаще оставляли чаевые.

Люди придают большее значение тому, что осталось сделать, чем тому, что уже сделано

Вот тонкое, но важное замечание по использованию режима с фиксированной нормой подкрепления. Минджунг Ку [48] провел специальное исследование, измеряя мотивацию людей к достижению цели.

Выяснилось, что люди были более мотивированы на продолжение работы, когда фокусировались на том, что отделяло их от желаемой цели, а не на том, что уже сделано для ее достижения.

Это означает, что при использовании режима с фиксированной нормой подкрепления важно указать людям на каждый шаг пути, который осталось пройти до цели.

Стратегии

Стратегия 45: при использовании режима с фиксированной нормой подкрепления вы получаете резкую активизацию желаемого поведения, которая падает сразу после получения вознаграждения.

Стратегия 46: при использовании режима с фиксированной нормой подкрепления люди будут более мотивированы, если вы сфокусируете их внимание на том, что осталось сделать для достижения цели, а не на том, как много они уже сделали.

Режим с фиксированным интервалом наименее эффективен

Повышая сотрудникам зарплату один раз в год, вы используете режим подкрепления с фиксированным интервалом. Эффективность применения такого подхода не слишком высока, поскольку в этом случае сотрудники не чувствуют себя достаточно мотивированными на протяжении большей части года (пока не приближается момент очередного подкрепления).

Вы проводите ежегодную встречу, на которой сотрудники в ответ на увеличение заработной платы обязуются повысить свою производительность. Скорее всего, сразу после этого они действительно улучшат свои показатели, но затем все вернется в старое русло. Через одиннадцать месяцев сотрудники снова повысят производительность, поскольку понимают, что на носу очередное подведение годовых итогов работы и решение вопроса об очередном повышении их заработной платы. Это говорит о том, что выбранный вами режим подкрепления с фиксированным интервалом не подходит для закрепления желательного поведения сотрудников.

Чтобы добиться постоянного роста производительности, вам стоит вначале применить режим непрерывного подкрепления нужного поведения, а затем перейти к использованию другого режима, например с переменной нормой или переменным интервалом.

Стратегии

Стратегия 47: избегайте выдачи вознаграждения через фиксированные отрезки времени. Такой режим подкрепления наименее эффективен.

Слот-машины: Павлов и Скиннер

Давайте вернемся к игровым автоматам, которые на самом деле объединяют в себе и классические условные рефлексы Павлова, и оперантные условные рефлексы Скиннера:

Стимулы (яркие огоньки и музыка) → Желаемое поведение (Бросить в автомат деньги и нажать кнопку) → Время от времени получение подкрепления вида A (деньги) Стимулы (яркие огоньки и музыка) → Желаемое поведение (Бросить в автомат деньги и нажать кнопку) → Постоянное получение подкрепления вида B (яркие огоньки и музыка)

Казино использует один из видов подкрепления (яркие огоньки и музыка) в качестве стимула. Это вызывает цикл привыкания:

Стимулы (яркие огоньки и музыка) Стимулы (яркие огоньки и музыка) → Желаемое поведение (Бросить в автомат деньги и нажать кнопку) → Постоянное получение подкрепления вида B (яркие огоньки и музыка, которые становятся следующими стимулами) → Желаемое поведение (Бросить в автомат деньги и нажать кнопку) → Время от времени получение подкрепления вида A (деньги) и постоянное получение подкрепления вида B (яркие огоньки и музыка), и так по кругу.

Владельцы казино — умные люди. Эта схема работает.

Поощрение детских шажков

Среди будущих психологов популярна история о том, как группа студентов, сговорившись до начала занятий, решила проверить действенность идеи оперантного «шейпинга», то есть формирования поведения, заставив своего профессора выйти из аудитории в середине лекции.

Для этого они использовали последовательность подкреплений. Когда профессор вошел в аудиторию, студенты игнорировали его появление (отсутствие подкрепления) до тех пор, пока он случайно не посмотрел в сторону двери. Как только он это сделал, студенты на мгновение дружно сфокусировал и внимание на нем.

Каждый раз, когда профессор смотрел в сторону двери, студенты демонстрировали ему свое внимание. Это служило подкреплением. Профессорам нравится, когда студенты выглядят заинтересованными и внимательно слушают их лекции.

Довольно скоро профессор стал все чаще поглядывать на дверь. Затем по незаметному сигналу, поданному одним из студентов, вся группа прекратила подкрепление взгляда в сторону двери. С этого момента всеобщее внимание должно было включаться лишь в том случае, если профессор делал шаг в направлении двери. Как только это произошло, студенты тут же одарили профессора пристальным вниманием.

Такой многоуровневый «шейпинг» поведения профессора (он перемещался все ближе к двери, затем брался за ручку, поворачивал ее и т. д.), продолжался до тех пор, пока он на самом деле не вышел из аудитории.

Я уверена, что это просто легенда, придуманная неким профессором психологии, чтобы объяснить принцип работы поведенческого «шейпинга». Но такое действительно возможно!

Официальное описание понятия «шейпинг» звучит следующим образом: «дифференцированное усиление последовательных приближений». Исходя из принципа оперантного условного рефлекса, любое поведение, получающее подкрепление, будет проявляться все более явно. Но если вы пытаетесь создать новое поведение, вы пока еще не можете его подкреплять, поэтому вначале вы должны заняться подкреплением того существующего поведения, которое в дальнейшем приведет к желаемому вами новому.

После того как подкрепление существующего поведения сделает его устойчивым, вы можете исключить это подкрепление и в дальнейшем подкреплять лишь те шаги, которые ведут к появлению желаемого результата.

Пример формирования поведения «Вымой руки»

Кэти — старшая медсестра в больнице. Она хотела бы заставить одну из коллег, Джоан, чаще мыть руки. Мытье рук весьма важно в уходе за больными, но не все сотрудники больницы относились к этой мере предосторожности как следует.

Кэти пыталась поговорить с Джоан об этом, но поведение медсестры не изменилось. Кэти даже считает, что чем чаще она упоминает о мытье рук, тем реже Джоан это делает. В результате Кэти решает попробовать на Джоан метод поведенческого «шейпинга». Она реализует следующий план формирования у Джоан желаемого поведения:

1. Кэти ищет возможность быть рядом с Джоан, когда у той возникает шанс вымыть руки.

Кэти дожидается момента, когда Джоан движется в сторону умывальника. Как только она делает шаг в этом направлении, Кэти улыбается и начинает разговаривать с Джоан. Первоначально движения Джоан к умывальнику случайны, но это не имеет значения. В любом случае при маломальском приближении Джоан к умывальнику Кэти ей улыбается и за что-нибудь хвалит. Кэти знает, что и похвалу, и разговоры Джоан любит, и это будет для нее эффективным подкреплением. Кэти поступает так в течение нескольких дней, пока поведение, состоящее в движении в сторону умывальника, не оказывается закрепленным.

2. Кэти переходит к следующему этапу формирования желаемого поведения: она поощряет не просто приближение к умывальнику, а прикосновение к нему.

В первый день формирования нового поведения Кэти уже ничего не говорит в тот момент, когда Джоан движется к умывальнику. Но когда Джоан к нему прикасается, Кэти улыбается и вновь хвалит Джоан за какие-то поступки. Кэти демонстрирует такую реакцию на прикосновение Джоан к умывальнику в течение нескольких последующих дней.

3. Заключительный этап формирования желаемого поведения состоит в том, чтобы действительно заставить Джоан помыть руки. Для этого Кэти прекращает заговаривать с ней и раздавать похвалы в тех случаях, когда Джоан просто прикасается к умывальнику.

Она молча ждет того момента, когда Джоан включит воду и начнет намыливать руки. Как только они покрываются мыльной пеной, Кэти улыбается и начинает разговор, включающий в себя очередную похвалу. Она будет продолжать делать это в течение нескольких дней, пока не убедится в том, что желаемое поведение закрепилось.

Вы можете сказать: «Вот это да! Потратить столько усилий, чтобы добиться одной маленькой победы». Формирование поведения действительно представляет собой нелегкую работу! Кроме того, есть несколько критически важных компонентов, без которых этот метод не будет работать.

— Внимательность. Вы должны быть очень внимательны, чтобы замечать любые подвижки человека к поведению, которое вы хотите у него сформировать.

— Выбор правильного подкрепления (на начальном этапе). Вначале вы должны подкреплять каждое проявление желаемого поведения. Для Джоан таким подкреплением служили похвала и разговор. При выработке оперантного условного рефлекса (а поведенческий «шейпинг» является одним из способов его использования) нужно очень тщательно выбирать форму подкрепления. Если вы выберете в качестве подкрепления дружескую беседу, но при этом не нравитесь собеседнику, то разговор с вами не будет способствовать подкреплению его поведения!

— Своевременность подкрепления. Если между желаемым поведением и его подкреплением проходит слишком много времени, то в результате вы можете ненароком подкрепить что-то другое. Люди реагируют на подкрепление бессознательно. Если бы Кэти начинала разговор с Джоан спустя два часа после ее действия, мозг Джоан не уловил бы связи между поведением и получением вознаграждения.

— Упорство и выдержка. Формирование поведения может занять много времени. Эта работа потребует от вас сосредоточенности и внимательности при наблюдении за происходящими изменениями.

Поведенческий «шейпинг» лучше всего работает, когда вы пытаетесь сформировать поведение, которое является или, по крайней мере, может стать бессознательным. Он лучше всего подходит для выработки непродолжительных, не слишком значительных и имеющих физиологическую основу действий.

Стратегии

Стратегия 48: когда вы не можете вознаградить желаемое поведение в связи с его отсутствием, используйте поведенческий «шейпинг», чтобы способствовать появлению у человека нужного вам поведения.

Выбор правильного вознаграждения

Одним из ключевых вопросов в теории Скиннера об оперантных условных рефлексах является выбор правильного вознаграждения (подкрепления). Если бы Скиннер вместо порций пищи вознаграждал крыс деньгами, он, вероятно, не дождался бы шквала нажатий на кнопку. С точки зрения крыс деньги не являются подкреплением. И наоборот, крысиная еда, скорее всего, не заинтересует людей.

Найти подкрепление, которое заинтересует конкретного человека, иногда довольно сложно.

Например, вы хотите, чтобы сотрудники вашего отдела продаж использовали в работе новое программное обеспечение (ПО). Вы предлагаете наградить поездкой в Лас-Вегас каждого продавца, который воспользуется данным ПО не менее 30 раз в течение ближайших 30 дней.

Что плохого в этой идее? Вот несколько причин, по которым она может не сработать:

— Вы, на первый взгляд, используете режим подкрепления с фиксированной нормой (после тридцатикратного использования ПО вы выдаете подкрепление). Я написала «на первый взгляд» потому, что предложение сопровождается дополнительным условием — «в течение ближайших 30 дней». Но вы не сделали ничего, чтобы установить желаемое поведение. Вам следовало бы вначале давать сотрудникам небольшое подкрепление каждый раз, когда они используют новое ПО (например, завести список лидеров по частоте использования нового ПО за прошедшую неделю (подкрепление признанием) или хвалить за использование ПО). А уже потом применить режим подкрепления с фиксированной нормой.

— Возможно, поездка в Лас-Вегас не воспринимается конкретным человеком как подкрепление. Кто-то из продавцов не любит путешествовать, или терпеть не может Лас-Вегас, или не хочет отдыхать отдельно от семьи. Для них поездка в Лас-Вегас также не будет эффективным подкреплением.

Подкрепление может быть самым разным. Вот лишь несколько примеров (не все из них подходят для использования на работе):

— Деньги

— Еда

— Билеты на концерт или спортивное мероприятие

— Ювелирные изделия

— Одежда

— Похвала

— Признательность

— Свобода действий

— Социальное взаимодействие

— Секс

Вообще, если человек чего-то хочет, это может быть использовано в качестве подкрепления.

Обещание денежного вознаграждения вызывает выброс дофамина

Брайан Кнутсон [47], анализируя корпоративные планы премий, обнаружил: когда вы обещаете людям денежное вознаграждение за работу, в прилежащем ядре их головного мозга (участке, который также называют «центром удовольствий») наблюдается повышение активности. Та же самая реакция в том же участке мозга наблюдается, когда люди ожидают получения того, к чему испытывают непреодолимое влечение (алкоголь, табак и т. п.). В их мозге происходит высвобождение дофамина. Помимо прочего, это вызывает усиление склонности к рискованному поведению (что также наблюдается у наркоманов, предвкушающих получение дозы).

Стратегии

Стратегия 49: используйте в качестве вознаграждения только то, что человек действительно хочет получить. Иначе вознаграждение не сработает

Когда выдавать вознаграждение

Как только вы выбрали правильное вознаграждение и режим подкрепления (постоянный, переменный и т. д.), убедитесь в том, что вознаграждение выдается вовремя. Чтобы оно по максимуму влияло на поведение, человек должен получать его сразу после совершения желаемого вами действия. Тогда образуется устойчивая связь между поведением и вознаграждением.

Предположим, вы используете непрерывный режим подкрепления, чтобы сформировать новое поведение у кого-то из членов вашей команды. Каждый раз, когда он приходит на встречу вовремя, вы хвалите его: «Спасибо, Джим, что пришел пораньше».

Вы должны говорить это сразу, как только он входит в кабинет. Если вы сделаете двухдневную паузу и лишь после этого скажете: «Отлично, что в понедельник ты пришел на совещание вовремя», эффект от похвалы будет заметно меньше.

И, конечно, не следует выдавать вознаграждение авансом («Я повышу вас в должности, но при этом ожидаю, что в будущем вы начнете выдерживать установленные сроки выполнения работы»). Вознаграждения эффективны только в том случае, когда они выдаются после получения желаемого результата.

Стратегии

Стратегия 50: демонстрация желаемого поведения должна вознаграждаться незамедлительно (в соответствии с тем режимом подкрепления, который вы используете).

Стратегия 51: вознаграждение должно выдаваться после демонстрации желаемого поведения, ни в коем случае не заранее.

Отрицательное подкрепление

До сих пор все наши примеры были построены на положительном подкреплении. Мы давали людям то, что они хотели, и желаемое нами поведение закреплялось:

Но мы не говорили о возможности применения отрицательных подкреплений. Люди часто путают отрицательное подкрепление с наказанием, но это вовсе не одно и то же. Отрицательное подкрепление — мощный инструмент изменения поведения.

Давайте снова начнем с крыс. Вы помещаете крысу в клетку и бьете ее электрическим током. Вы обучаете крысу тому, что, нажав на кнопку, она может остановить подачу электрических разрядов. Удары тока в данном случае служат отрицательным подкреплением. Подкреплением — поскольку оно приводит к усилению желаемого поведения; отрицательным — так как крыса нажатием кнопки (демонстрацией желаемого вами поведения) избавляет себя от ударов током:

Теперь давайте попробуем привести пример с человеком. Джо хочет, чтобы его сотрудник Кевин тщательнее относился к уборке своего рабочего места.

Сначала Джо применяет положительное подкрепление. Он решает каждый раз, когда Кевин будет приводить свое рабочее место в порядок, говорить ему что-то вроде: «Как приятно видеть твое рабочее место чистым, Кевин!»

Уборка рабочего места → Получение похвалы → Регулярная уборка рабочего места

Но это не работает. Кевин по-прежнему пренебрегает уборкой. Джо считает, что отчасти проблема состоит в том, что похвала не является для Кевина эффективным подкреплением. По крайней мере, похвала Джо.

Вместо того чтобы искать другое положительное подкрепление, Джо решает попробовать воздействовать на Кевина отрицательным. Он знает, что Кевин не любит, когда Джо ходит вокруг, заглядывает ему через плечо и говорит, что и как нужно делать. Джо полагает, что, если он будет то и дело подходить к рабочему месту Кевина и напоминать ему о необходимости уборки, это послужит отрицательным подкреплением.

По мнению Джо, использование отрицательного подкрепления будет способствовать тому, что Кевин начнет регулярно убирать свой стол:

При использовании отрицательного подкрепления человек начинает вести себя так, как вам нужно, чтобы прекратить нечто неприятное для себя (или избежать этого). Как и в случае с положительным подкреплением, вы должны определить, что именно послужит эффективным подкреплением для конкретного человека. Именно потому, что подкрепление может быть и отрицательным, Скиннер не стал использовать термин «вознаграждение». Вознаграждение подразумевает, что вы даете людям то, что они хотят получить. Используя термин «подкрепление», Скиннер мог говорить об использовании всего, что способствует усилению желаемого поведения.

Стратегии

Стратегия 52: вы можете использовать отрицательное подкрепление, чтобы заставить людей делать то, что вам нужно. Избавление конкретного человека от того, что ему действительно не нравится, воспринимается им как своего рода «вознаграждение».

Наказание

А что насчет наказания? Чем оно отличается от отрицательного подкрепления? Насколько оно эффективно?

До сих пор мы рассматривали в качестве подкрепления либо то, что человек хочет получить (положительное подкрепление), либо то, от чего он хочет избавиться (отрицательное подкрепление). Наказание отличается от положительного и отрицательного подкрепления тем, что, наказывая кого-то, вы не пытаетесь закрепить или усилить желательное поведение человека, а хотите исключить или ослабить проявления нежелательного для вас поведения.

Наказание может иметь нежелательные последствия

Применение наказаний может иметь неприятные последствия. В книге «Драйв. Что на самом деле нас мотивирует» [7] Дэниел Пинк описывает исследование Гнизи [30], в ходе которого выяснилось, что введение наказания на деле привело к усилению проявлений нежелательного поведения.

Администрация детского сада решила наказывать денежными штрафами родителей, которые слишком поздно забирали детей. Опоздавшие родители должны были заплатить определенную сумму за каждую минуту опоздания. Казалось, что это заставит всех приходить за детьми вовремя.

Однако произошло обратное. С введением наказания количество родительских опозданий значительно увеличилось. Причиной тому стало изменение отношения родителей к опозданиям. Раньше, когда родители забирали детей позже установленного времени, они понимали, что тем самым создают неудобства: «Из-за меня воспитатели не могут уйти домой вовремя». Но с переходом на чисто коммерческий принцип (больше опозданий = больше денег) опаздывающие родители перестали чувствовать себя виноватыми. Они просто начали платить персоналу детского сада дополнительные деньги за сверхурочную работу.

Наказание может работать, но его эффективность меньше, чем у подкрепления. Чтобы заставить людей прекратить что-то делать, нужно потратить больше усилий, чем на то, чтобы привить им альтернативное поведение.

В то время как подкрепление может привести к усилению и закреплению поведения, наказание, как правило, работает лишь до тех пор, пока оно применяется. Если вы прекратите наказывать человека за определенное поведение, оно вскоре вернется.

Стратегии

Стратегия 53: вознаграждайте желаемое и игнорируйте нежелательное поведение. Наказание является менее эффективным инструментом, чем награда.

Название книги

Законы влияния. Как побудить людей делать то, что вам нужно

Вайншенк Сьюзан

Глава 5. Кнут и пряник