Почему. Руководство по поиску причин и принятию решений

Клейнберг Саманта

4. Время. Как время влияет на способность причинного восприятия и осмысления

 

 

В выборочном контролируемом эксперименте (2001) проверялось, могут ли молитвы улучшить здоровье пациентов, например сократить время их пребывания в больнице. В двойном слепом исследовании (ни врачи, ни пациенты не знали, кто в какой группе) принимали участие 3393 взрослых больных с инфекциями кровотока, примерно половина из которых была отнесена к контрольной группе, а вторая половина – к группе «молитвенного вмешательства». По итогам и показатель времени пребывания в больнице, и показатель лихорадочного состояния в группе вмешательства снизились, причем со статистически значимым различием (p-значения равнялись 0,01 и 0,04).

Но, если подобное вмешательство столь эффективно, почему его практикуют не во всех больницах?

Одна причина в том, что участники исследования находились в больнице с 1990 по 1996 год, то есть молебны за их выздоровление устраивались задолго до того, как были зарегистрированы сроки пребывания и результаты. Действительно, молитвы были мерой не только ретроактивной, но также и дистанционной, читались в разных местах и в разное время людьми, которые не были в контакте с пациентами.

Причина, влиявшая на нечто в прошлом, целиком противоречит нашему пониманию причинности. Мы считаем, что причины предшествуют следствиям (если только не приближены по времени), и существует убедительная физическая зависимость, связывающая причину и следствие. И все же эксперимент проводился согласно обычным стандартам выборочных экспериментов (например, двойным слепым методом), а результаты оказались статистически значимыми в соответствии с общепринятыми критериями.

Статья об этом эксперименте вызвала вал писем на адрес редактора. В его издании обсуждались философские и религиозные соображения, и вопросы веры были не главными. На самом деле исследование требовало от читателей ответа на вопрос: смогли бы они принять результаты, серьезно противоречащие их устоявшимся верованиям, если бы стандарты испытания соответствовали их пониманию методологической разумности и статистической значимости.

Можете представить эксперимент, который уверит вас, что причина способна вызвать нечто, уже случившееся в прошлом? Даже если такой опыт кажется разумным, мы вряд ли поверим, что причиной стало произведенное вмешательство, поскольку это противоречит нашему пониманию временного паттерна причин и следствий. Если вы прежде слабо верили в некую гипотезу, возможно, ни один эксперимент не сможет значимым образом поменять ваши верования.

В причинности порядок событий оказывается центральным, да и мы сами прекрасно чувствуем, что между причиной и следствием должно пройти определенное время. К примеру, если вы смотрите фильм вместе с другом, который болен гриппом, и сами заболеваете через три месяца, вы вряд ли скажете, что это друг вас заразил. Но, если вы верите, что контакт с больным вызывает болезнь, почему бы не поставить грипп в вину другу? Дело не просто в подверженности болезнетворному вирусу, а скорее в том, что эта расположенность не способна моментально вызвать симптомы вируса из-за инкубационного периода, и на нее нельзя возлагать вину за заболевание гриппом в нескором будущем. Действительно, временной коридор, когда контакт приводит к болезни, очень уж узкий, и можно использовать это знание, чтобы ограничить диапазон контактов, вызывавших конкретный исход.

* * *

Именно время часто позволяет провести различие между причиной и следствием (болезнь, предшествующая потере веса, говорит о том, что похудение не могло ее спровоцировать), делает вмешательство эффективнее (некоторые лекарства необходимо принимать после контакта с вирусом) и помогает предсказывать события (знать, когда цены на акции пойдут вверх, намного полезнее, чем знать, что это случится в неопределенном будущем). Но время тоже способно вводить в заблуждение: мы можем обнаружить корреляции между несвязанными временными рядами со схожими трендами, можем оказаться не способны выяснить причину для запаздывающих следствий (например, между воздействием окружающей среды и состоянием здоровья), а между несвязанными событиями ошибочно установить связь, если одно из них предшествует другому (изготовители зонтиков, которые открыли свой магазин до сезона дождей, разумеется, не стали его причиной).

 

Восприятие причинности

Каким образом мы можем от корреляции, скажем, между физическими упражнениями и потерей веса прийти к логическому выводу, что это упражнения вызывают потерю веса, а не наоборот?

Корреляция – это симметричная взаимосвязь (соотношение роста и возраста в точности такое же, как и между возрастом и ростом). А вот причинные взаимосвязи асимметричны (жаркая погода может заставить спортсмена бежать медленнее, но сам факт бега не вызывает климатических изменений). Мы можем полагаться на базовое знание (скорость бегуна никак не влияет на погоду), но один из ключевых сегментов информации, позволяющих перейти от корреляций к гипотезам, – это время.

Юм решил проблему асимметрии, утверждая, что причина и следствие не могут происходить одновременно и что причина – более ранний эпизод. Итак, если мы наблюдаем устойчивый паттерн событий, может иметь место только одна ситуация, а именно: предыдущее отвечает за последующее. Но философские труды Юма были в основном теоретическими, и, хотя с точки зрения интуиции верно утверждение, что наше восприятие причинности зависит от приоритета по времени, это не значит, что всегда будет иметь место именно такая ситуация.

Если вы наблюдаете, как один бильярдный шар движется по направлению к другому, ударяет по нему и второй устремляется вперед, вы справедливо верите, что первый шар вызвал движение второго. С другой стороны, если бы отмечалась длительная задержка, прежде чем второй шар пришел в движение, или первый остановился бы, не коснувшись второго, вы бы, возможно, не так решительно утверждали, что движение стало результатом воздействия первого шара.

Правда ли, что тайминг событий определяет восприятие причинности, или же это впечатление зависит от пространственного расположения?

Чтобы разобраться, прибегнем к помощи знакомого нам психолога Альберта Мишотта. В 1940-е годы он попытался разобраться, как время и пространство влияют на наше восприятие причинности. Типичный эксперимент выглядел так: участникам показывали на экране две движущиеся фигуры и просили описать увиденное. Варьируя различные свойства движения (например, фигуры соприкасались, двигаясь одна за другой), ученый пытался выяснить влияние этих свойств на каузальные впечатления участников.

Труды Мишотта, как считается, заложили основу исследований по восприятию причинности, хотя его методы и задокументированные результаты не лишены некоторых противоречий. Не всегда ясно, сколько в каждом эксперименте было участников, как они отбирались, каковы их демографические характеристики и какие точно реакции наблюдались. Нет сведений, каковы были точные реакции и по какому принципу они квалифицировались как причинные или нет. Согласно Мишотту, многие из участников были его коллегами, сотрудниками и учениками, а это делает их более осознанными по сравнению с основной массой населения. Хотя труды ученого заложили значимую основу будущих экспериментов, стоило их повторить и провести дальнейшие исследования.

В экспериментах Мишотта, где две фигурки двигались на экране, при этом ни одна не начинала движение раньше и не касалась другой (как на рис. 4.1 (а)), участники, как правило, не описывали движение в терминах причинности. С другой стороны, когда одна фигура двигалась навстречу другой, а вторая трогалась после контакта с первой (как на рис. 4.1 (б)), участники часто заявляли, что причиной движения второй фигуры становилась первая, при этом использовали язык каузальности (например, толчок и запуск). Даже когда сценки просто изображают движущиеся фигуры, без реальной причинной взаимосвязи между траекториями, люди все равно склонны интерпретировать и описывать движение в терминах причинности. Такой феномен, когда наблюдатели описывают движение второй фигуры как вызванное первой, которая действует пусковым средством, называется эффектом запуска.

Рис. 4.1. На картинках представлен ряд экспериментов Мишотта с разными типами движения фигур. Стрелки показывают факт (и направление) движения фигур

Пространственный разрыв между фигурами (как на рис. 4.1 (в)) не устранял впечатления причинно-следственной связи. То есть если порядок событий оставался неизменным и один кружок двигался за другим, останавливался, не коснувшись его, а второй кружок начинал двигаться сразу после остановки первого, участники все равно описывали это каузальным языком.

Похоже, в некоторых случаях предшествование во времени оказывается важнее пространственной смежности, однако это может зависеть от характеристик проблемы и точного расстояния.

На основе опубликованных описаний нельзя в точности воспроизвести оригинальную методологию, но другие труды подтверждают существование эффекта запуска. Его распространенность, однако, оказалась ниже, чем у Мишотта: всего от 64 до 87 % наблюдателей описывают движение как каузальное, впервые его увидев.

Теперь представим, что один шар катится к другому. Первый останавливается, как только коснется второго, и после некоторой паузы второй шар начинается катиться в том же направлении, что и первый. Можно ли утверждать, что первый шар – причина движения второго?

Имеет ли значение время запаздывания в 1 или 10 секунд? Юм утверждал, что смежность в пространстве и времени существенна для вывода о взаимозависимости, однако мы не всегда наблюдаем каждое из звеньев в причинной цепи. Чтобы изучить действие эффекта запаздывания на восприятие каузальности, Мишотт создал сценки вроде наблюдаемых с двумя шарами, с паузой между окончанием движения первой фигуры и началом движения второй, как на рис. 4.1 (г). Он обнаружил, что, несмотря на пространственную смежность (фигуры не соприкасались), запаздывание движения уничтожало всяческое восприятие причинности.

Помимо проблем с профессиональным уровнем участников (и их осведомленностью об экспериментах и о гипотезах Мишотта), одно из ограничений экспериментов заключается в том, что участники только описывают поведение фигур на экране, а не пытаются выявить свойства системы, взаимодействуя с ней. Попробуйте подумать об этом как о различии между ситуациями, когда вы видите, как некто нажимает кнопку вызова лифта, и просто наблюдаете за его прибытием и когда можете сами нажимать кнопку с любыми выбранными вами интервалами по времени.

Труды Мишотта доказали, что люди при определенных обстоятельствах описывают сценки в терминах каузальности. Но что именно происходит в физической системе, когда участник может контролировать проявление причины?

Взяв за основу работы Мишотта, Шэнкс, Пирсон и Дикинсон (1989) провели капитальное исследование, задачей которого было установить, как фактор времени формирует суждения о каузальности. В отличие от Мишотта, система здесь была инструментом, с которым взаимодействовали участники. Нажатие пробела на клавиатуре вызывало появление на дисплее мигающего треугольника, и участники должны были определить степень, с которой нажатие клавиши становилось причиной появления фигуры.

Исследователи обнаружили, что при интервале запаздывания от 0 до 2 секунд между нажатием клавиши и появлением треугольника участники считали маловероятным, что клавиша вызывала визуальный эффект. При интервале запаздывания от 0 до 16 секунд было обнаружено, что фактор причинности снижался по мере увеличения задержки между действием и его следствием.

* * *

Имея дело с физическими объектами, мы вполне обоснованно подозреваем, что один не заставляет двигаться другой, если есть длительная задержка от контакта между объектами до начала движения. Но в иных случаях нельзя ожидать немедленного эффекта. Воздействие патогенного вируса не сразу вызывает болезнь; требуются годы, чтобы политика властей дала измеримый результат; похудение за счет физических упражнений – процесс постепенный. И то, что, согласно результатам экспериментов, запаздывание всегда снижает восприятие причинности или приводит к ложным умозаключениям, представляет некоторую проблему.

Недавние исследования обнаружили, что, хотя запаздывание мешает корректно судить о каузальности, суждения частично могут зависеть от ожидаемого временного паттерна. Десятиминутная задержка между ударом по мячу для гольфа и началом его движения серьезно противоречит нашим знаниям физики; но интервал в 10 лет между воздействием канцерогенного фактора и развитием рака нельзя назвать неожиданностью.

Значимость времени запаздывания может частично зависеть от того, что уже известно о проблеме и ходе развития событий, по нашему мнению. Во многих из упомянутых психологических экспериментов подготовленные сценарии заставляют вспомнить о знакомых ситуациях, в которых ожидается немедленный эффект. К примеру, движущиеся кружки Мишотта обозначают шары (и ожидается, что один из них, ударяя по другому, должен немедленно заставить его катиться, а запаздывание будет ситуацией необычной), а в экспериментах Шэнкса с коллегами использовалась клавиатура (где ожидается, что нажатие клавиши вызовет быстрый ответ). С другой стороны, если участникам предлагался определенный сценарий (например, оценить, был ли рак легких вызван курением, на основе данных о курении конкретного лица и диагностике рака), они могли обнаружить, что если между фактом курения и постановкой диагноза прошла всего неделя, такая ситуация совершенно неправдоподобна, поскольку курение не может вызвать заболевание за такой короткий срок.

Чтобы изучить эту проблему, Бюхнер и Май (2003) провели такое же исследование, как Шэнкс и его коллеги, за одним исключением: они манипулировали ожиданиями участников, изначально сообщая, что между нажатием клавиши и высвечиванием треугольника может быть задержка. Сравнение результатов двух групп, из которых только одна получила сведения о возможном запаздывании, показало: хотя последнее всегда снижало восприятие действенности причины, предоставление информации нивелировало эффект.

Порядок экспериментов (какой эффект отмечался сначала – запаздывание или смежность) также серьезно влиял на результаты. То есть если участники вначале наблюдали задержку, выводы о вероятности причинно-следственной связи делались чаще, чем если сперва демонстрировалась смежность. Подобные следствия эксперимента говорят в пользу идеи о том, что на суждения влияет не просто порядок событий или длительность отставания, но и имеющееся знание.

Участники экспериментов Мишотта наблюдали, как на экране двигаются кружки, но интерпретировали их как физические объекты, перенося на них собственные ожидания по передаче импульса.

Базовая информация ограничивала влияние запаздывания на вывод о причинно-следственной связи в исследованиях Бюхнера и Мая, но этот эффект, как ни удивительно, все равно не исчезал полностью, даже если участники знали о задержке. Полученные результаты можно объяснить, например, тем, что экспериментальный сценарий так или иначе предусматривал нажатие клавиши и появление эффекта. Возможно, устойчивые сформированные ожидания относительно того, как быстро компьютер обрабатывает ввод данных с клавиатуры, не устранила даже полученная инструкция. Участники все равно действовали на основе имеющегося опыта о временном паттерне нажатия клавиш и ответных реакций, даже если руководство утверждало иное.

Позднее, воспользовавшись историей об обычной и энергосберегающей лампочках (когда участники наблюдали, с какой задержкой они загорались), команда исследователей смогла устранить негативное влияние отставания во времени на силу каузальных суждений. Так, группа, получившая инструкции, демонстрировала те же средние рейтинги причинности, независимо от факта запаздывания.

* * *

В каждом из сценариев факт запаздывания уже не оказывал отрицательного воздействия на вывод о причинности, но участники по-прежнему считали мгновенные эффекты каузальными, даже если это не поддерживалось полученной информацией.

Трудно спланировать эксперимент, где участники имели бы очень сильные ожидания относительно интервала запаздывания, которые при этом соответствовали бы их базовому знанию о работе тех или иных вещей. В позднейших опытах использовалась доска, установленная под углом. На ее верх ставили шарик, который катился вниз, исчезая из виду, и активировал внизу маленький выключатель. Угол наклона доски можно было менять. При вертикальном ее положении долгая задержка между началом движения шарика и включением света кажется невероятной; если доска почти горизонтальна – возможной. Здесь наблюдается сходство с механизмами быстрого и замедленного действия, как в психологических экспериментах (см. ).

Используя этот сценарий, Бюхнер и Макгрегор (2006) показали, что в ряде случаев немедленное следствие снижает вероятность причины. Согласно большинству ранних исследований, запаздывания затрудняют поиск причин или в лучшем случае не влияют на логические заключения. Но ученым удалось показать, что иногда задержки способствуют выявлению причин (при малом отставании и низком столике, стоящем под уклоном, вероятность каузальных выводов снижалась). Эти результаты очень важны, поскольку доказали: запаздывание не всегда мешает выводам о причинности или делает причину менее правдоподобной. Напротив, главное, как наблюдаемый временной паттерн соотносится с нашими ожиданиями.

Заметим, что эти эксперименты отвечали на единственный вопрос: в какой степени нажатие клавиши становится причиной визуального следствия (действительно ли шарик включает свет), а не различение между многочисленными возможными причинами. В целом нужно не только оценить, с какой вероятностью конкретное событие оказывается поводом для исхода, но и сформулировать гипотезу о факторах, которые становятся причинами. Если вы, к примеру, получили пищевое отравление, то вам нужно не просто оценить, мог ли его спровоцировать отдельный продукт. Чтобы определить «виновника», вы проанализируете все, что употребляли в пищу. И время становится важным фактором, ведь под подозрение попадут блюда, которые вы ели совсем недавно, а не на прошлой неделе.

В некоторых психологических трудах представлены свидетельства подобного типа мышления, а именно: когда нет информации о причинно-следственных связях, сведения о временных паттернах могут перевесить другие возможности (к примеру, как часто события происходят одновременно). Однако это часто приводит к некорректным выводам. При пищевом отравлении вы можете ошибочно возложить вину на продукт, который съели последним, исходя только из временного паттерна и игнорируя другую информацию (например, какие рестораны или еда чаще всего ассоциируются с отравлениями).

Согласно Лагнадо и Сломэну (2006), даже когда участникам эксперимента сообщали о возможных задержках по времени, из-за чего порядок наблюдений мог оказаться недостоверным, они часто делали неверные заключения о причинных связях. То есть при определении взаимозависимостей они по-прежнему полагались на временной фактор, даже если он вступал в противоречие с данными о частоте одновременности событий.

А теперь представим, что вы щелкаете переключателем. Вы не знаете, чем он управляет, поэтому щелкаете несколько раз. Иногда свет зажигается сразу же, а иногда – с задержкой. Порой запаздывание составляет 1 минуту, а порой – 5 минут. Действительно ли кнопка становится причиной включения света?

Это похоже на ситуацию, когда вы нажимаете кнопку на пешеходном переходе: при этом не похоже, что сигнал светофора меняется быстрее. Причина, по которой сложно определить наличие каузальной взаимосвязи, состоит в том, что задержка между нажатием кнопки и сменой сигнала светофора сильно варьируется. Эксперименты со сменой последовательности запаздываний показали, что статичные отставания между причиной и следствием (например, треугольник всегда появляется на экране точно через 4 секунды после нажатия клавиши или отставание варьируется от 2 до 6 секунд) повышают вероятность определения причинной связи, а усиление изменчивости задержек ее понижает.

Как подсказывает интуиция, если запаздывание остается в узком диапазоне средних значений, довольно правдоподобно, что небольшие вариации других факторов или даже отставание наблюдения способны это объяснить. С другой стороны, при сильной изменчивости временного паттерна может существовать более одного механизма, посредством которого причина вызывает следствие. Например, если побочные эффекты лекарства проявляются в интервале от 1 дня до 10 лет после его приема, то с большей достоверностью присутствует иной фактор, влияющий на временной паттерн, – ускорение или задержка следствия. Это называется смешанным следствием.

 

Направленность времени

Скажем, подруга утверждает, что новое лекарство помогло ей справиться с аллергией. Если она убедительно расскажет, как препарат помог остановить выделения из носа, что вы подумаете о последовательности таких событий, как прием таблеток и прекращение симптомов аллергии? На основании этой взаимосвязи вы, вероятно, решите, что сначала подруга приняла лекарство, а затем проблема была устранена. Действительно, временной паттерн помогает обнаружить причины, а тесная связь между ними также заставляет делать вывод о времени из каузальных зависимостей. Ряд исследований показал, что знание о причинах может влиять на наше восприятие временного интервала между двумя событиями и даже их последовательности.

Одна из проблем заключается в том, что два события могут казаться происходящими одновременно лишь в силу детальности измерений или нашей ограниченной наблюдательности. Например, в микроматричном анализе одномоментно измеряется деятельность тысяч генов, причем уровни такой активности обычно замеряются регулярно, скажем, раз в час. При анализе данных может показаться, что два гена показывают одинаковый паттерн активности (бывают одновременно сверхэкспрессированы и неэкспрессированы), даже если один из них, с повышенным уровнем экспрессии, вызывает аналогичное состояние у другого. И все-таки, не видя последовательности событий и не имея базового знания, согласно которому один ген обязательно проявляется в действии прежде второго, все, что можно утверждать, – это что их уровни экспрессии коррелируют, а не что один регулирует действие другого.

Точно так же в медицинские карты пациентов сведения не заносятся ежедневно: скорее, они формируют серию временных точек с нерегулярными пространственными промежутками (данные регистрируются, только когда люди обращаются за врачебной помощью). Таким образом, видно, что в некую конкретную дату пациент принимает лекарство, которое проявляет побочные эффекты; однако мы знаем только, что оба эти фактора присутствуют, но не можем быть уверены, что пациент сначала принял лекарство и именно оно стало потенциальной причиной побочного эффекта. В долгосрочных когортных исследованиях опрос отдельных лиц может проводиться всего раз в год. Таким образом, если окружающие условия или иные факторы оказывают влияние на более коротком временном горизонте, подобная последовательность ими не охватывается (а значит, события могут оцениваться объективно). Во многих случаях любое событие может наступить первым с высокой правдоподобностью, и их совместное наступление не обязательно предполагает определенное направление причинности.

Самый вопиющий случай – если информации о времени нет совсем: к примеру, при перекрестном исследовании, когда данные собираются в одно время. Так, чтобы определить наличие взаимосвязи между раком и конкретным вирусом, обследовалась случайно выбранная группа населения. Не зная, какой фактор был первым, нельзя разобраться, что оказывается провокатором, если между ними заметна корреляция (вирус вызывает рак или рак повышает подверженность вирусу?), и можно ли говорить о причинности вообще.

Если предположения о направлении причинности делаются на основе предыдущего убеждения о том, что было первым, а не факта, мы можем некорректно увидеть причинно-следственную связь там, где есть только корреляции. К примеру, многие исследователи пытались определить, способны ли такие явления, как ожирение и развод, распространяться в соцсетях за счет социальных связей (например, в результате распространения на других людей эмоциональных состояний и психозов). Без информации о временных паттернах нет способа определить, какое направление достовернее.

Ряд философов, например Ганс Рейхенбах, пытались дать определение причинности в терминах теории вероятности, не используя данные о временных паттернах и стараясь вместо этого вывести направление времени из направления каузальности. Есть и вычислительные методы, в определенных ситуациях способные идентифицировать причинные взаимосвязи на основе временных данных. Но большинство подходов строится на том, что причина предшествует следствию, и именно эта информация используется при ее наличии.

Один из редких примеров действительно одновременного наступления причины и следствия, когда применяемая для измерения временная шкала не имеет значения и мы не можем сказать, что произошло первым, дает физика. Существует так называемый парадокс Эйнштейна – Подольского – Розена (ЭПР), когда две частицы связаны таким образом, что при изменении импульса или положения одной из них эти же свойства другой частицы меняются в полном соответствии с первой.

Парадоксальность ситуации в том, что частицы разделены в пространстве, но изменение все равно происходит моментально, для чего неизбежно должна иметь место каузальная связь в отсутствие пространственной смежности или предшествования по времени (два свойства, которые мы считаем ключевыми). Эйнштейн называл нелокальную причинность «жутким дальнодействием», поскольку каузальные взаимосвязи в космосе требуют, чтобы информация путешествовала со скоростью выше скорости света, в нарушение законов классической физики. Заметим, однако, что этот вопрос вызывает немало дебатов как среди физиков, так и среди философов.

Одна из идей решения ЭПР-парадокса – это обратная причинность (которую иногда именуют ретропричинностью). Она допускает, что причины могут влиять на события прошлого, а не только будущего. Если частица, меняя состояние, послала сигнал другой, связанной с ней частице в некий момент времени в прошлом, чтобы та также изменилась, тогда перемена состояния не требует, чтобы информация передавалась быстрее скорости света (хотя это предполагает некие квантовые «путешествия во времени»). Мы примем за данность, что время течет в одном направлении, и даже если мы не наблюдаем события как последовательные, причина наступает раньше следствия.

 

Когда вещи изменяются со временем

Может ли исчезновение пиратов вызвать повышение температуры в глобальном масштабе? Правда ли, что поедание сыра моцарелла побуждает изучать информационные технологии? В самом деле поставки лимонов в страну снижают количество аварий на дорогах?

На рис. 4.2 (a) показана взаимосвязь между импортом лимонов и количеством погибших в ДТП: чем выше объемы импорта, тем меньше смертельных случаев.

Рис. 4.2. Объемы ввоза лимонов в США (в тоннах) и смертность на дорогах в США [число летальных случаев на 100 человек]: а) как отношение одной переменной к другой и б) как временная функция

Хотя коэффициент корреляции Пирсона для этих данных составляет –0,98, что означает практически абсолютное отрицательное соотношение, никто почему-то до сих пор не предложил увеличить импорт цитрусовых, чтобы снизить количество погибших на дорогах.

А теперь взглянем, что получится на рис. 4.2 (б), если выстроить график данных по импорту и смертельным случаям в виде временной функции. Выходит, импорт со временем неуклонно падает, а смертность за тот же период растет. Данные на рис. 4.2 также представляют динамический ряд в обратном хронологическом порядке. Но мы можем заменить импорт лимонов любым другим динамическим рядом, падающим во времени (долей рынка Internet Explorer; акваторией арктических вод, покрытой льдом; распространением курения в США), и обнаружить точно такую же зависимость.

Причина в том, что подобные временные ряды не стационарны, а это значит, что их свойства – к примеру, средние значения – со временем меняются. Например, дисперсия свойства может модулироваться: средний объем импорта цитрусовых окажется стабильным, а годовые колебания – нет. Спрос на электроэнергию при двух подсчетах в год может проявить нестационарность, поскольку общая потребность будет, вероятнее всего, со временем расти, а тенденции – зависеть от сезонности. С другой стороны, результаты длинных серий подбрасывания монеток считаются стационарными, поскольку вероятность выпадения орлов или решек в каждой временной точке абсолютно одинакова.

Если на длинном временном горизонте наблюдается одинаковый (или абсолютно противоположный) тренд, некоторые ряды будут коррелировать, но это не значит, что один фактор станет причиной другого. Существует и другой метод поиска корреляций без соответствующей каузальной зависимости. Если цена на все акции в определенной группе за конкретный промежуток времени растет, можно обнаружить корреляцию между этими ценами, даже если дневные тренды совершенно отличаются.

В другом примере, который показан на рис. 4.3, количество диагнозов аутизма растет в том же темпе, что и число кофеен Starbucks, поскольку и те и другие показатели растут по экспоненте – но то же справедливо и для многих других временных рядов (ВВП, количество веб-страниц и научных статей). Здесь причинно-следственная связь весьма правдоподобна, но это далеко не всегда так, и можно придумать кучу убедительных историй, объясняя различные корреляции динамических рядов. Если бы я вместо этого взяла, скажем, процент домохозяйств с высокоскоростным интернетом, вряд ли можно было найти убедительные свидетельства взаимосвязи, кроме того, что – уж так случилось – оба фактора растут со временем. Хотя кое-кто мог бы и придумать объяснение их взаимоотношений. Но это всего лишь корреляция, которая легко исчезнет, если мы учтем разную степень детализации данных по времени или сделаем поправку на их нестационарность.

Рис. 4.3. Два нестационарных динамических ряда, которые кажутся коррелирующими только потому, что оба со временем растут по экспоненте

Еще один вид нестационарности – если группа населения, среди которого проводилась выборка, изменяется со временем. В 2013 году Американская кардиологическая ассоциация (American Heart Assosiation, AHA) и Американская коллегия кардиологов (American College of Cardiology, ACC) выпустили новые справочники по борьбе с избытком холестерина вместе с онлайн-калькулятором, чтобы прогнозировать риск инфарктов и инсультов на 10 лет вперед. Однако некоторые исследователи обнаружили, что калькулятор завышает риски на 75–100 %, что может вести к назначению избыточного объема лекарств, потому что рекомендации основаны на уровнях риска для каждого пациента.

Калькулятор учитывает такие факторы риска, как диабет, гипертензия и курение, но не берет – и не способен брать – в расчет все возможные моменты, влияющие на уровень риска, к примеру, подробную историю курения в прошлом. Коэффициенты в уравнениях (значимость каждого фактора) оценивались на основании данных, собранных в 1990-х годах, поэтому допущение заключается в том, что и другие свойства этой группы населения совпадут для ее текущего состава. Однако привычки курильщиков и другие важные факторы касательно образа жизни со временем изменились. Согласно анализу Кука и Ридкера (2014), 33 % белого населения на дату начала долгосрочного исследования курили по сравнению с 20 % той же группы на сегодня, что дало иной базовый уровень риска и в потенциале привело к переоценке этого фактора.

Мы часто говорим о внешней валидности, то есть можно ли экстраполировать некое заключение за пределы исследуемой выборки (подробнее об этом – в ). Но есть и другой тип валидности – по времени.

Внешняя валидность определяет, как то, что мы узнаём в одном месте, способно информировать, что будет происходить в другом: к примеру, смогут ли результаты выборочного контролируемого эксперимента в Европе сказать что-либо об эффективности этого лекарства в США? Со временем также могут наблюдаться изменения в причинно-следственных взаимосвязях (новые законы спровоцируют перемены, влияющие на цену акций) или их силе (если люди начнут читать новости только в Сети, печатные объявления утратят воздействие на умы). Точно так же рекламный агент может выяснить, как конкретная социальная сеть влияет на объем продаж; но если цель, с которой люди пользуются соцсетями, со временем изменится, эта зависимость прекратит существование (например, вместо того чтобы «френдить» только близких друзей, люди начнут массово расширять знакомства).

Используя причинные зависимости, можно сделать косвенное предположение, что вещи, образующие взаимосвязь, со временем проявляют стабильность. Аналогичный сценарий реален, если мы рассматриваем, скажем, данные о повторной госпитализации пациентов на некоем временном отрезке. Возможно, количество рецидивов со временем возросло, и это было вызвано новой политикой или сменой руководства. Но могло случиться так, что население, лечившееся в больнице, также изменилось: к примеру, люди стали менее здоровыми. Получается, политика сама по себе привела к изменениям в населении. Мы узнаем об этом подробнее в , так как нередко стараемся понять, как причинные зависимости влияют на политику, хотя она сама приносит перемены. В результате первичные причинные зависимости могут прекратиться, и вмешательство окажется неэффективным. Один из примеров – программа сокращения числа учащихся в калифорнийских школах, когда внезапный рост спроса на учителей привел к снижению их профессионального уровня.

Могут также образовываться новые причинно-следственные связи, такие как появление нового канцерогена. Может меняться значение переменных. К примеру, язык постоянно трансформируется, возникают новые слова, а существующие используются иначе (например, слово «плохо» в значении «хорошо»). Или сначала речи политика повышали его рейтинг, поскольку его слова одобрялись обществом, а затем, когда люди перестали с ним соглашаться, его популярность снизилась. В результате прогнозы о повышении рейтингов не сработают, а действия – к примеру, написание новых речей – окажутся неэффективными. А на более коротком временном отрезке зависимость может оказаться истинной, если не учитывать дневные колебания.

Существует несколько стратегий для работы со нестационарными временными рядами. Можно, конечно, проигнорировать нестационарность, однако лучшие подходы используют более короткое время (набор рядов должен обладать стационарностью), если для этого достаточно данных, или же трансформируют временные ряды в стационарные.

В качестве примера нестационарности очень часто берется ситуация, предложенная Эллиотом Собером, , – зависимость между уровнем воды в Венецианской лагуне и ценами на хлеб в Англии, которые видимым образом коррелируют и со временем растут. Действительно, если взять данные Собера из этого примера с рис. 4.4 (а) (единицы переменных не приводятся), корреляция Пирсона для переменных составляет 0,8204. Хотя два временных ряда всегда растут, точный размер этого роста каждый год варьируется. Что мы действительно хотим понять – как эти изменения соотносятся.

Рис. 4.4. Уровень моря и цены на хлеб

Простейший подход заключается в изучении различий, а не голых фактов. Иными словами, насколько сильно увеличивается уровень моря или цены на хлеб относительно измерений предыдущего года?

Если взять изменения по годам, как показано на рис. 4.4 (б), корреляция падает до 0,4714.

Такой подход называется дифференцированием (что буквально означает вычисление разности между последовательными точками данных): это простейший способ превратить временной ряд в стационарный.

Даже если два временных ряда показывают одинаковые долгосрочные тренды (например, неуклонный прирост), дифференцированные данные могут уже не коррелировать, если разнятся дневные или годовые колебания. В целом одно только дифференцирование не гарантирует стационарность измененного временного ряда; требуются более сложные трансформации данных.

Это одна из причин, по которым работа с фондовым рынком обычно использует прибыли (изменение цены), а не фактические ценовые данные. Обратите внимание: именно здесь обнаружилась связь с лимонами и смертностью в ДТП, и именно поэтому можно выявить одинаковые зависимости для многих пар динамических рядов. Если общие тренды аналогичны и значимы, они обеспечивают основную часть измерений корреляции, доминируя над любыми различиями краткосрочных трендов, которые могут совершенно не коррелировать.

 

Использование причин. Все дело во времени

Можно ли назвать оптимальный день недели для заказа билетов на самолет? Когда лучше заниматься спортом: утром или вечером? Сколько нужно выждать, прежде чем просить о прибавке жалованья?

Экономисты часто упоминают сезонные эффекты – паттерны, которые проявляются каждый год в одно и то же время и представляют собой форму нестационарности. Однако временные тренды обнаруживаются во многих других видах динамических рядов, таких как посещение кинотеатров (на которое влияет фактор сезонности и выходных дней) или травмопунктов (резкий рост совпадает с сезонными болезнями). То есть, если мы найдем условия, активирующие продажи билетов в кино зимой, они могут оказаться неприменимыми, если мы попытаемся приложить их к росту летних продаж. Другие паттерны могут объясняться днем недели (к примеру, тренды внутригородской ежедневной миграции) или графиком государственных праздников.

Последовательность событий способна помочь при выяснении причин и качества прогнозирования (или получения информации о том, когда ожидать некое следствие). Но эффективное использование причин требует больше информации, чем простое знание о том, что случилось первым.

Во-первых, мы должны узнать, не оказывается ли некая зависимость истинной только в некоторых случаях, а во-вторых, каково запаздывание между причиной и следствием. Вот почему необычайно важно собирать сведения о временных паттернах и делиться ими. Немедленное лечение может улучшить исход многих болезней (к примеру, инсульта), но эффективность не всегда демонстрирует линейный спад по времени. К примеру, сообщалось, что если лечение синдрома Кавасаки начать не позднее 10 дней после его проявления, риск будущего повреждения коронарных артерий значительно снижается. Еще лучше, если лечение начнется не позднее 7 дней; но, если атаковать болезнь через 5 дней, это не окажет дополнительного влияния на благоприятный исход. В других случаях прием препарата утром или вечером мог сказаться на его действенности: если в процессе тестирования лекарство давалось в конкретные часы или просто каждый день в одно и то же время, но в реальной жизни, вне рамок тестирования, график приема существенно варьировался, оно могло не оказывать действия, предсказанного на основе клинических испытаний.

Чтобы определить, когда именно действовать, надо знать, сколько времени нужно, чтобы причина вызвала следствие. То есть необходимо определить, когда именно до начала выборов распространять конкретный агитационный материал; когда продавать акции, получив определенную информацию; или в какой момент до поездки в тропики принимать таблетки против малярии. В ряде случаев действия могут оказаться неэффективными, если совершаются без учета времени: к примеру, слишком ранний показ рекламы (когда воздействуют иные причины), принятие торгового решения до того, как акции окажутся на пике, или запоздалый прием профилактического средства (которое не успевает оказать эффект).

Точно так же временные паттерны могут влиять на наши решения, предпринимать ли некие действия вообще, поскольку от них зависят наши суждения как о полезности причин, так и об их потенциальных рисках. Полезность причины зависит и от вероятности того, что наступит следствие (при прочих равных причина, дающая 90 % успеха, предпочтительнее той, что обеспечивает только 10 %), и от срока ее срабатывания. Известно, к примеру, что курение вызывает рак легких и сердечно-сосудистые заболевания, но они не развиваются немедленно после начала курения. Знания только о вероятности рака недостаточно, чтобы принять обоснованное решение учесть риск курения, если вам также неизвестны временные паттерны. Возможно, кому-то невысокая вероятность заболевания в ближайшем будущем покажется более рискованной, чем почти стопроцентное ее проявление в отдаленное время.

Однако, принимая решение о вмешательстве, мы, как правило, не просто думаем, использовать ли некую конкретную причину для получения результата: мы выбираем между потенциальными вмешательствами. В одном из эпизодов сериала Seinfeld Джерри задумчиво рассуждает о многочисленных средствах от насморка и кашля: «Это действует быстро, а у этого действие запоздалое, но пролонгированное. Так когда мне нужно чувствовать себя хорошо – теперь или потом?»

Хотя такая информация усложняет принятие решений, она дает возможность лучше строить планы, исходя из ограничений (например, важная встреча через час или долгий день на лекциях в институте).

 

Время обманывает

Время – одно из ключевых свойств, позволяющих отличать причины от корреляций. Просто мы исходим из предпосылки, что там, где наблюдается соотношение, проявляющийся первым фактор и есть единственная потенциальная причина.

Но, поскольку последовательность событий критически важна, ее достоверности при установлении причинных зависимостей может придаваться слишком большой вес.

Скажем, руководство школьной столовой решает сократить число жареных и высококалорийных блюд и увеличить ассортимент фруктов, овощей и цельнозерновых продуктов. После этого каждый месяц вес учащихся снижается.

Рис. 4.5 показывает искусственную медианную кривую значений веса учащихся по временному параметру (половина значений выше медианы, половина ниже). После изменений в меню заметно внезапное снижение, которое устойчиво держится месяцами. Значит ли это, что такой показатель вызван новыми блюдами здорового питания?

Рис. 4.5. Значение переменной по временному критерию. После изменения значение измеренной переменной падает

Такой вид графика, где наблюдается четкое изменение значения переменной после некоторого события, часто применяется для подтверждения вывода; но вряд ли можно считать его убедительным аргументом. Общий пример подобной ситуации – когда сторонники некоего закона заявляют о падении уровня смертности сразу после его введения в действие, или когда человек уверен, что лекарство вызвало побочный эффект, потому что тот проявился через несколько дней после его приема.

В примере со столовой мы понятия не имеем, идет ли речь о той же самой группе учащихся (возможно, в школу поступили новые дети, которым нравится здоровая пища, а те, кто терпеть не может фрукты, разом переехали); а может, дети или их родители потребовали изменить меню, потому что уже раньше пытались регулировать вес; или в отмеченный период произошло некое изменение, вызвавшее такое следствие (возможно, одновременно наметился рост физической активности в каникулы). Редко бывает так (если бывает вообще), чтобы единственная вещь трансформировалась, а остальной мир пребывал в полнейшей неизменности; поэтому представление динамического ряда всего лишь с двумя переменными ведет к ошибочному представлению о том, что следствие нового фактора проявляется изолированно. Это опять-таки лишь корреляция, пусть и временная.

Вмешательства в реальный мир – это гораздо более сложные и гораздо менее безусловные явления, чем лабораторные эксперименты. Скажем, в районе, где располагается промышленное предприятие, регистрируется ряд предположительных диагнозов рака. В итоге предприятие закрывается, и принимаются меры по ликвидации последствий загрязнения воды и почвы. Если после этого снижается число диагнозов рака, можно ли сделать вывод, что именно производство было причиной заболевания?

Мы действительно не представляем, стал ли зарегистрированный спад совпадением (или сам первоначальный рост был таковым), или же что-то другое в то же самое время вызвало изменения и стало истинной причиной, и тому подобное. Помимо того, количественная статистика порой столь мала, что любые вариации не могут быть статистически значимыми.

Есть общеизвестный софизм, который звучит так: post hoc ergo propter hoc, или «после этого, следовательно, по причине этого». Иными словами, некто ошибочно заключает, что одно событие вызвано другим просто потому, что происходит после него.

Например, можно выяснить, как некий рейтинг поменялся после определенного исторического события: действительно ли уровень смертности в ДТП упал после принятия закона о ремнях безопасности? Однако многие изменения случаются в одно и то же время, и даже вся система целиком может трансформироваться в результате вмешательства. О вызове под названием «смерть» мы поговорим в . Но возможно, однако, что здоровая пища в школьной столовой лишь косвенно вызвала потерю веса, просто побуждая учеников активнее заниматься спортом. Аналогично временные паттерны (к примеру, если спортивная команда побеждает каждый раз, когда перед матчем идет дождь) могут заставить кого-то решить, что это причинная зависимость, даже если события с большой долей правдоподобия можно объяснить совпадениями.

Такая проблема нередко возникает, если концентрироваться на коротком временном промежутке, игнорируя долгосрочные колебания. Две экстремально снежные зимы подряд, рассматриваемые в отрыве от исторических данных, ведут к ошибочному выводу о погодных паттернах холодного сезона. Но если вместо этого проанализировать данные за десятилетия, мы увидим годовые колебания в рамках общего тренда. Наконец, два события могут происходить одновременно только потому, что такую вероятность создают другие факторы. К примеру, если детям дают новую пищу примерно в том же возрасте, когда у них проявляются симптомы определенного заболевания, многие отметят видимую связь между двумя событиями, потому что они всегда случаются примерно в одно время.

Итак, здесь имеет место софизм cum hoc ergo propter hoc («вместе с этим, значит, вследствие этого»), или выявление причинной связи между событиями, которые всего лишь произошли одновременно. Отличие от post hoc («после этого») в том, что это временная последовательность событий, и поэтому такая ошибка встречается особенно часто.

Как всегда, для первого события и следствия может быть общая причина (к примеру, действительно ли лекарства от депрессии заставляют людей совершать самоубийство, или люди, подверженные депрессии, более склонны к самоубийству и употреблению антидепрессантов?); однако следствие также могло случиться само по себе и просто случайно предшествовало причине.

У меня разболелась голова, и я принял некое средство. Через несколько часов боль ушла. Можно ли утверждать, что помогло лекарство? Временной паттерн позволяет сделать предположение, что ослабление симптома произошло благодаря приему лекарства, однако я не могу сказать наверняка, что боль не прошла бы сама. Мне пришлось бы провести множество выборочных экспериментов, где я бы принимал или не принимал препарат, а потом записывал, как быстро исчезала головная боль, чтобы иметь возможность утверждать хоть что-то относительно подобной причинной зависимости. В мы рассмотрим, почему результаты такого эксперимента окажутся малоубедительными и почему придется сравнивать действия лекарства и плацебо.

Точно так же, как близлежащие по времени события могут привести к ошибочным заключениям о причинности, длительные задержки между причиной и следствием способны помешать достоверному установлению причинно-следственных связей. Некоторые следствия наступают быстро (удар по бильярдному шару заставляет его двигаться), а некоторые процессы протекают в замедленном режиме. Известно, что курение вызывает рак легких; но между первой сигаретой и днем, когда диагностируют рак, пролегают долгие годы. Побочные эффекты от приема некоторых препаратов проявляются через десятилетия. Перемены в состоянии здоровья благодаря физическим упражнениям достигаются медленно и не сразу, и, если мы будем ориентироваться только на стрелку весов, может показаться, что вес сначала даже увеличивается, потому что мускулы наращиваются быстрее, чем уходит жир. Ожидая, что следствие должно идти непосредственно за причиной, мы не видим связи между этими глубоко взаимозависимыми факторами. Ученым чисто технически непросто собрать данные за десятилетия, чтобы выявить факторы, влияющие на здоровье. Но проблема частично заключается в том, что и обычным людям сложно выявить условия, коррелирующие с их состоянием здоровья, такие как диета и физическая активность.