5. Наблюдение. Как выявить причину, наблюдая за порядком вещей. «Почему. Руководство по поиску причин и принятию решений»

Однажды по пути на работу я увидела в нью-йоркской подземке объявление: «Получите образование, найдите работу, не заводите детей до брака – и 98 шансов из 100, что бедность вам не грозит!» Цель этого объявления – профилактика подростковой беременности. Неясно, однако, как интерпретировать подобную статистику. Похоже, рекламщики предполагают, что если девушка-тинейджер совершит все вышеизложенное, то с вероятностью 98 % избежит нищеты. Но так ли это? И подразумевается ли, что она в настоящий момент не должна испытывать проблем с деньгами или никогда в жизни не окажется за чертой бедности?

Этот прецедент взят из исследования, где изучались показатели обнищания среди людей с различными характеристиками – такими как семейный статус, возраст и образование, – а потом подсчитывалось, какая часть этой группы населения живет за чертой бедности. Но все равно оказывается, что итоговая статистика основана лишь на данных наблюдений.

Никто пока не ввел в действие политику (в рамках всего общества или индивидуально), стимулирующую беременность подростков или препятствующую ей, опускающую их на дно или поднимающую в общество богатых. А значит, статистика всего лишь описывает некие характеристики, наблюдаемые у населения. Из тех, кто уже окончил школу, получил работу и вступил в брак до рождения детей, 98 % не оказались в нищете. Но если кто-то собирается завершить среднее образование, начать трудиться и завести семью, их личные шансы оказаться среди бедноты могут варьироваться.

Здесь явно то же отличие между риском любой семьи попасть в группу воздействия СВДС (синдрома внезапной детской смертности) и шансами ребенка из конкретной семьи умереть от СВДС (см. ).

Может случиться и так, что аналогичные условия, из-за которых кому-то не удалось окончить школу или найти работу, сами ведут к бедности и находятся вне контроля конкретных молодых людей. Вероятно, им приходится заботиться о пожилом родственнике, или у них ограниченный доступ к медицинской помощи либо поддержке со стороны семьи. Это значит, что они попросту не смогли получить работу из-за сторонних факторов (например, не нашли сиделку для пожилых родителей); но даже соответствие всем трем критериям не изменило бы фактор подверженности риску бедности, если бы он в итоге определялся теми самыми сторонними факторами (к примеру, высокими ценами на медицинские услуги). То есть если бы невозможность окончить школу, получить работу и избежать беременности до брака стали всего лишь иным следствием некоего условия, также ведущего к бедности, то вмешательство в эти обстоятельства было бы сродни влиянию на следствие вместо причины. Бедность может вызываться случайными обстоятельствами, на которые намного сложнее воздействовать: к примеру, дискриминацией, отсутствием рабочих мест в регионе или некачественной системой образования.

Этот факт может иметь громадную значимость для формирования социальной политики. Если мы поставим во главу угла повышение доступности образования и занятости, не зная при этом, что мешает людям получать и то и другое и действительно ли эти факторы оказываются причинами бедности, намного труднее проводить эффективное вмешательство. По-прежнему будут препятствия к финансовой безопасности, которым не уделяется внимание, а мы не будем знать, действительно ли работаем над целевыми факторами, способными обеспечить желаемый результат. Далее, все указанные свойства могут быть следствиями бедности, и, возможно, воздействие должно быть нацелено непосредственно на то, что наполнит карманы людей звонкой монетой. В и мы подробнее поговорим, как осуществлять успешные вмешательства и какая информация нужна, чтобы спрогнозировать последствия конкретного воздействия.

Напротив, если мы бы имели возможность заставить людей в адресном порядке окончить (или не окончить) школу и поставили бы их выборочно в соответствующие условия (безотносительно прочих обстоятельств), то смогли бы изолировать влияние этих действий на их экономическую ситуацию в будущем. Реальность такова, что наблюдение – часто все, что у нас есть. Неэтично проводить эксперименты, где бы требовалось выяснить, что такое подростковая беременность – следствие или причина бедности (а может, это вообще порочный круг).

Точно так же ученые часто пытаются определить эффект воздействия СМИ (может ли рекламная кампания повлиять на общественное мнение? На самом ли деле передача 16 and Pregnant канала MTV изменила уровень подростковой беременности?). В этих случаях мы не только не способны контролировать влияние на отдельных лиц, но даже редко в силах определить, было ли такое влияние вообще. Часто исследователи вынуждены полагаться на сводные показатели рынка СМИ, где демонстрировалась реклама, и на то, как данные опросов общественного мнения в конкретном регионе изменялись со временем по сравнению с другими. Иногда нереально отслеживать участников эксперимента достаточно долгое время, или же эксперименты оказываются чрезмерно затратными. Чтобы десятилетиями наблюдать группу значительного размера, как в проекте «Фрамингемское исследование сердца»,, необходимы масштабные изыскания; на практике это скорее исключение, чем правило.

В этой главе мы поговорим о том, как проникнуть в порядок вещей, лишь наблюдая за происходящим. Рассмотрим ограничения как этих методов, так и данных наблюдений в целом.

Закономерности

МЕТОД МИЛЛЯ

Скажем, группа программистов устраивает хакерский марафон. Компьютерщики, обожающие работать по ночам, вряд ли могут похвастаться сбалансированной и здоровой диетой, так что многие из них, чтобы продержаться до рассвета, сидят на крепком кофе, пицце и энергетических напитках. К несчастью, на следующий день, когда раздают награды, многие члены команды оказываются больны или по какой-то причине не выходят на связь. Как определить, какие факторы вызвали недомогание?

Попытка понять, что общего и в чем разница у групп с отмеченным или не наблюдаемым определенным результатом, – одна из классических сфер приложения метода, разработанного в XIX веке Джоном Миллем (где подавляющее большинство примеров – это пищевые отравления).

Прежде всего мы можем задаться вопросом: что общего во всех ситуациях, где имеет место некое следствие? Если потребление энергетических напитков – единственный совпадающий фактор для всех случаев головной боли, это дает некоторое доказательство в пользу утверждения, что ее вызывают, возможно, энергетики. Именно это Милль называл методом согласованности. В примере на рис. 5.1 нас интересуют случаи, когда головная боль есть, так что мы просто возьмем из таблицы колонки, где отмечены люди с этой проблемой.

Рис. 5.1. J-образная кривая

Итак, мы начнем только с ситуаций, где следствие имеет место, а потом вернемся и посмотрим, что у них общего. Отметим: единственное совпадение – потребление энергетических напитков, а стало быть, по методу согласованности, это и есть причина головных болей.

Согласованность предполагает, что для следствия необходима причина, ибо следствие не наступает до причины. Это, однако, не означает, что следствие происходит каждый раз, когда имеет место причина. Речь идет о достаточности. Например, как следует из табл. 5.1, Бетти также пьет энергетические напитки, но головной болью не страдает. Итак, мы не готовы утверждать, что энергетики – достаточное условие головной боли. Как и относительно трудов Юма, можем только сказать, что эти факторы истинны касательно того, что мы наблюдали.

Таблица 5.1. Применив метод согласованности Милля, мы обнаруживаем, что энергетические напитки вызывают головную боль

На основе ограниченной выборки мы не имеем права заявлять о необходимости или достаточности.

Одно из ограничений такого подхода – требование согласованности каждого конкретного случая. Если сотни людей заболевают, а один нет, здесь не найти причинной зависимости. Заметим, этот метод не принимает в расчет то, что Бетти тоже пила энергетики, но голова у нее не разболелась. Именно поэтому он скажет только о необходимости, но не о достаточности: не рассматривается возможность ненаступления следствия при наличии причины.

Чтобы определить достаточность, посмотрим, в чем отличие между ситуациями, когда следствие наступает и когда нет. К примеру, если все, кто на следующий день чувствовал себя уставшим, бодрствовали ночь напролет, при этом несколько не уставших человек немного поспали, мы могли бы сказать, что полное исключение сна есть достаточное условие (для этого примера) усталости наутро. Это и есть метод согласованности Милля.

С помощью табл. 5.2 путем сравнения мы узнаём, чем отличаются ситуации с наличием и отсутствием усталости. Заметим, что случаи усталости согласованы по всем четырем факторам, а значит, мы не можем выделить из них единственный как причину, если применить метод согласованности. Изучив отличия, мы увидим, что бодрствование допоздна кажется единственным условием, коррелирующим со следствием. При согласованности это довольно жесткое требование, поскольку могут возникнуть неожиданные ситуации, даже если усталость по-прежнему останется в статусе причины.

Таблица 5.2. Применив метод дифференциации Милля, мы обнаружим, что бодрствование по ночам вызывает усталость

В следующей главе мы изучим вероятностные методы, которые не требуют столь жесткой взаимозависимости, но используют показатель относительной частоты встречаемости.

Повторим еще раз: причина есть необходимое условие следствия, если оно не может произойти без причины (каждому факту следствия предшествует факт причины), и причина есть достаточное условие следствия, если она без него не может быть (за каждым фактом причины должен идти факт следствия). Причина может быть необходима, но не достаточна и наоборот. В хакерском марафоне каждый факт усталости, которому предшествует работа допоздна, делает последнюю необходимым условием усталости, но ничего не говорит о ее достаточности (может, некоторые люди бодрствуют всю ночь и не устают).

Аналогично каждый случай употребления энергетика, за которым следует головная боль, свидетельствует, что эти напитки – достаточное условие головной боли, но не необходимое (поскольку бывает головная боль иной этиологии).

Итак, некоторые причины могут быть одновременно необходимыми и достаточными для указанных следствий.

Возьмем табл. 5.3. Чтобы выяснить, какие причины одновременно необходимы и достаточны, объединим согласованность и дифференциацию – способ, названный Миллем «метод согласованности и дифференциации». Здесь мы рассмотрим факторы, общие для всех случаев наступления следствия – и только для них.

Таблица 5.3. Используя единый метод согласованности и дифференциации Милля, мы видим, что кофе способствует боли в желудке

Итак, люди, у которых разболелся желудок, и бодрствовали ночью, и пили кофе. Значит, по методу согласованности, эти факторы могут иметь характер причинности. Посмотрим, отличаются ли они для случаев, когда следствие наступает и когда нет. Диана бодрствовала допоздна, но желудок у нее не болит, а значит, работа по ночам не удовлетворяет критериям метода дифференциации. С другой стороны, потребление кофе им удовлетворяет, так как все те, кто выпил много кофе, ощутили боль в желудке, а никто из воздержавшихся этим недугом не страдал. Таким образом, кофе есть одновременно необходимое и достаточное условие больного желудка, если исходить из таблицы.

Итак, в чем же подвох?

Представьте, что 2000 человек заболели, поев немытых фруктов, при этом двоим удалось избежать пищевого отравления, а еще несколько отравились недоваренной курицей. Методы Милля не нашли бы никакой причинной зависимости между фруктами и отравлением, поскольку здесь нет ни необходимости, ни достаточности. Многие примеры каузальности, взятые из реальной жизни, не соответствуют обоим случаям, так что это условие очень строгое. В целом всего несколько контрпримеров не должны заставить полностью сбрасывать со счетов причины; однако такой метод все же может дать чисто интуитивную ниточку в исследовании каузальных гипотез. К тому же он соответствует некоторым способам качественного выяснения причин.

К тому же на практике единственная причина и единственное следствие – редчайший случай.

Допустим, люди едят пиццу, допоздна не спят и пьют немереное количество кофе. Это приводит к тому, что все они одновременно заболевают различными хворями. Если мы видим, что все вместе жалуются на усталость и больной желудок, при этом нет других факторов, общих для всех или отличных, что можно сделать?

В некоторых ситуациях достаточно выяснить различие между причинами, которые привели к каждой болезни. К примеру, из табл. 5.4 мы знаем, что бодрствование по ночам порождает усталость. Итак, то, что Алан, Бетти и Диана устали, объясняется ночным бдением за компьютером. Тогда можно просто взглянуть, в чем сходство и различие в случаях с больным желудком (избыточное потребление кофе), предположив, что должно быть что-то еще, вызывающее подобное недомогание, поскольку неизвестно, повинно ли в этом отсутствие ночного сна.

Таблица 5.4. Используя метод остатков Милля, мы видим, что кофе ведет к боли в желудке

Если проигнорировать усталость и бодрствование допоздна, вторым общим фактором будет кофе. Хотя люди с больным желудком часто тоже не рано ложатся, Милль делает допущение, что мы в итоге можем отбросить известные причины и следствия. Зная, что ночная работа вызывает усталость, нужно посмотреть, что останется после того, как мы примем во внимание эту причину и следствие. Если выявлена одна причина, она и есть вина оставшегося следствия. Это так называемый метод остатков. Конечно, предполагается, что нам известны все следствия других возможных причин и каждая имеет только одно следствие. Если же бодрствование допоздна и потребление кофе совместно вызывают боль в желудке, к этому заключению нельзя прийти подобным образом.

Этот метод способен дать гипотезы по поводу того, что могло вызвать результаты наблюдений, но не может доказать каузальную природу взаимосвязи. Мы вообще ничего не упоминали о наборе переменных или о том, откуда они берутся. Переменные всегда представляют собой подгруппу возможно измеримых показателей; вероятно, они отобраны на основе воспринимаемого соответствия или просто суть результаты фактических измерений при анализе данных после наступления события.

В результате набор гипотез может не охватывать истинных причин, и мы либо терпим поражение в поиске вины конкретного следствия, либо обнаруживаем всего лишь ее индикатор. Иными словами, если каждый, кто ел пиццу, к тому же напился воды подозрительной чистоты, а вода не включена в набор переменных, то мы придем к выводу, что пицца и есть причина. Просто этот индикатор дает сведения о потреблении воды, даже если на самом деле это и не причина. И если бы мы учли потребление воды, если взаимосвязь между водой и пиццей безусловна (все, кто ел пиццу, пили воду, и каждый, кто пил воду, ел пиццу), мы не смогли бы выделить пиццу в качестве единственной причины, поскольку на деле оба фактора могут быть таковыми. Именно поэтому, не наблюдая их по отдельности, мы видим только четкую закономерность между обеими потенциальными причинами и следствием.

Эта проблема не специфическая только для методов Милля: она важна в более широком смысле выведения причинно-следственных связей из данных наблюдения. Если, с другой стороны, мы провели бы эксперимент, заставив людей поесть пиццы без воды, а потом наоборот, это, видимо, решило бы проблему. Мы бы поняли, что заболели только те, кто пил воду (и не важно, ели они пиццу или нет).

Итак, возможно, наши программисты, работая ночью, решили приналечь на пиццу. Если избыточное ее потребление провоцирует набор веса, можно ожидать, что люди будут толстеть. Очередной метод Милля назван «сопутствующее изменение», когда просматривается зависимость реакции от дозы для причины и следствия. По мере количественного роста причины растет и объем следствия. К примеру, если некое исследование утверждает, что кофе снижает риск смертности до определенного возраста, мы можем решить, что должна наблюдаться дифференциация риска в зависимости от того, сколько кофе пьет некий индивидуум. С другой стороны, если одна чашка кофе в день оказывает в точности тот же эффект, что и десять, кажется более правдоподобным наличие чего-то еще, реально снижающего риск, помимо кофе.

Разумеется, реальность всегда сложнее, и может не быть линейной зависимости между причиной и следствием. К примеру, алкоголь в маленьких количествах способен положительно воздействовать на самочувствие. Однако избыточное потребление спиртных напитков – вещь крайне нездоровая. Известна так называемая J-образная (или восходящая) кривая, которая отображает соотношение потребления спиртного и, например, ишемической болезни сердца (). Симптомы заболевания уменьшаются при потреблении до 20 г в день, а потом начинают усиливаться. Среди других аналогичных зависимостей – гипотетическая связь между интенсивными физическими упражнениями и инфекционными заболеваниями, а также между потреблением кофе и количеством инфарктов. Как и со многими лекарственными средствами, для этих факторов есть предел, после которого они могут причинять вред. Итак, мы не обнаруживаем ожидаемого соотношения между дозой и реакцией и наблюдаем затухание эффекта после некой точки вместо постоянного роста.

Один из самых знаменитых в истории примеров применения методов Милля – когда Джон Сноу обнаружил, что именно спровоцировало вспышку холеры 1854 года в Лондоне. Он не копировал методы Милля, однако используемый им подход строился по тому же принципу.

Тогда никто не знал, каким путем распространяется болезнь, но карта города (с нанесенными очагами инфекции) дала возможность увидеть резкие отличия между районами. Передавался ли возбудитель от одного человека к другому? Или болезнь вызвало что-то по соседству? А может, у людей, проживающих в зараженных районах, имелось нечто общее?

Сноу обнаружил, что самая высокая смертность отмечалась не просто в конкретном географическом районе, а возле водяной колонки на Брод-стрит:

В домах, расположенных ближе к колонке на другой улице, умерли всего 10 человек. В пяти случаях из этих 10 родственники больных сообщили, что они всегда ходили к колонке на Брод-стрит, потому что предпочитали воду из нее другим колонкам, даже если те располагались ближе. В трех других случаях это были дети, которые шли в школу мимо колонки на Брод-стрит [195] .

Увидев, что умершие в основном пользовались этой колонкой, Сноу рассмотрел, видимо, не соответствующие этой тенденции случаи, когда люди не жили по соседству, и выяснил, что они тоже брали воду на Брод-стрит. Это и есть в точности метод согласованности Милля, где выясняется, что общего у всех случаев наступления следствия (например, заболевание холерой). Сноу также применял метод дифференциации, когда писал, что «в этой части Лондона не отмечалось никаких особых вспышек или заболеваемости холерой, кроме как среди людей, имеющих обыкновение пить воду из вышеупомянутой колонки». Иными словами, доказал, что заболеваемость возросла в группе лиц, пользовавшихся колонкой, и только в этой группе.

Комплекс причин

Единственная проблема с методами Милля – ситуация, когда причина обусловливает, с той или иной долей вероятности, зависимость следствия от иных факторов. К примеру, два лекарственных препарата сами по себе могут не влиять на содержание глюкозы в крови, однако, взаимодействуя при одновременном приеме, способны существенно повысить ее показатель. Один из вариантов преодолеть эту трудность – не концентрироваться на парных зависимостях между отдельно взятыми причинами и следствиями, но рассматривать комплекс условий, вызывающих следствие. Так, одной из причин дорожного происшествия может быть нетрезвое вождение в комбинации с близко проезжающими машинами, другой – плохая видимость на обледеневшей дороге и неосторожное вождение, третьей – нарушение скоростного режима и отправка электронных сообщений за рулем.

Подобные ситуации часто возникают в эпидемиологии, где принято считать, что причины всегда взаимосвязаны, и такие факторы, как длительная подверженность окружающим условиям, образ жизни, острые кратковременные воздействия (например, инфекционные заболевания) и так далее, комбинированно влияют на здоровье. Взяв за основу подобные рассуждения, эпидемиолог Кеннет Ротман ввел идею изображения таких комплексов причин в виде секторных диаграмм.

Секторная диаграмма причинно-следственных связей – группа факторов, достаточных для возникновения следствия, которая содержит все необходимые для этого компоненты. На рис. 5.2 изображены такие диаграммы для всех трех примеров с вождением.

Рис. 5.2. Три причинных комплекса дорожных происшествий

В этом примере каждая диаграмма – достаточное условие для наступления следствия, поэтому ДТП произойдет в каждом случае присутствия этих факторов. Но каждый из них по отдельности не необходимый, поскольку лишь множество условий вызывают следствие. Соблюдение требования, что причина всегда производит следствие (по утверждениям Милля и Юма), в то время как могут существовать необходимые условия для проявления следствия, которых нет в наличии; или что причина есть необходимое условие каждого случая проявления следствия, когда может быть множество возможных его причин, – это исключительно жесткие рамки. В реальности разнообразные следствия могут проявляться множеством различных путей, для чего часто требуется целый набор факторов.

Таким образом, согласно одной из концепций, причина есть компонент группы факторов, которые вместе оказываются достаточным условием возникновения следствия. Правда, такая группа может не быть необходимой, поскольку их способно оказаться множество. Этот подход разделяет Джон Маки, который описывает причины как INUS (недостаточные, но необходимые компоненты не-необходимых, но достаточных условий). В примере с секторными диаграммами каждый «кусочек пирога» сам по себе недостаточен (поскольку, чтобы вызвать следствие, нужны другие кусочки), но необходим (потому что, если какой-нибудь кусочек будет упущен, следствие не возникнет). С другой стороны, любая диаграмма (или «пирог») сама по себе не необходима, поскольку таких пирогов может быть много и каждый окажется достаточным условием следствия.

Итак, вместо того чтобы пытаться выделить такие факторы, как экономика, рекламные кампании конкурентов или рейтинги общественной поддержки, в качестве единственной причины результатов выборов, мы отобразим все сопутствующие факторы и, возможно, попробуем выяснить их относительную значимость.

Но не все причины становятся необходимыми INUS-условиями. К примеру, причинно-следственная связь может не иметь характер детерминизма, так что, даже если бы мы владели всей возможной информацией и наблюдали все необходимые условия, следствие не всегда возникало бы. Один из примеров индетерминизма – радиоактивный распад, где никогда нельзя знать наверняка, будет ли иметь место распад частицы в конкретный момент времени: нам известна только вероятность события. INUS-условие распада – вещь невозможная, поскольку достаточных условий здесь не существует. Точно так же могут наблюдаться INUS-условия, не оказывающиеся причинами, если, как в примере с пиццей и водой, у нас нет корректного набора переменных. Точность и полнота логических выводов всегда зависят от полноты данных.

Вероятности

Почему вероятность

Эта глава начиналась со строчки из рекламного объявления: «Получите образование, найдите работу и не заводите детей до брака – и 98 шансов из 100, что бедность вам не грозит!» Само утверждение – попытка вывести причинную зависимость: когда такие факторы, как высшее образование, работа и брак до рождения детей, считаются истинными, вероятность, что удастся избежать бедности, составляет 0,98. Эта статистика особо убедительна потому, что шансы очень близки к стопроцентным; и все же высокая вероятность не значит, что это соотношение каузально. Точно так же, как может иметь место сильная вероятностная зависимость, не носящая причинного характера, могут существовать и каузальные зависимости, когда причина снижает или не меняет вероятности наступления следствия вообще.

Так в чем же привлекательность вероятностных концепций причинности?

Как и в примере с радиоактивным распадом, одна из причин, по которой мы нуждаемся в вероятностных подходах (не требующих, чтобы причина всегда и безусловно производила следствие или каждый раз ему предшествовала), состоит в том, что некоторые отношения не детерминированы. В таких случаях при всем знании мы не можем быть убеждены, произойдет ли то или иное следствие. Здесь не только не будет закономерности в событиях, какую требуют все ранее описанные подходы, но также ни одна комбинация переменных не даст возможности ее установить.

Примеры индетерминизма часто встречаются в физике (например, в квантовой механике), а также в более приземленных ситуациях – скажем, при неисправности оборудования.

Но во многих других случаях, однако, вещи кажутся недетерминированными лишь в силу нехватки знаний – даже если их можно целиком спрогнозировать на основе полной информации. Не все, кто работает с асбестом, заболевают раком; лекарства дают побочный эффект только части пациентов; сходные условия не всегда приводят к образованию пузыря на фондовой бирже. Может, однако, случиться так, что, зная досконально действие лекарства или имея возможность пронаблюдать достаточно побочных эффектов и пациентов, у которых они обнаруживаются, можно выявить набор необходимых факторов.

Нам в основном приходится иметь дело не только с показателями наблюдений (нельзя заставить людей стать заядлыми курильщиками, чтобы посмотреть, кто из них заболеет раком), но еще и с неполными данными. Это означает, что мы упускаем некоторые переменные (вероятно, сведения по аэробной способности – лишь результаты оценки, а не измерения с помощью теста VO2 max на «бегущей дорожке»), можем наблюдать данные только на ограниченном временном отрезке (отслеживаем последствия хирургической операции 1 год, а не 30 лет) или берем пробы в режиме, далеком от идеального (отмечаем обмен веществ в тканях мозга раз в час вместо режима ЭЭГ). Проблема может заключаться в затратности (в масштабных исследованиях делать тесты VO2 max неразумно с финансовой точки зрения, а также длительно по времени и потенциально небезопасно для больных людей), возможности сбора данных (редко есть шанс следить за человеком десятки лет) или технологических ограничениях (микродиализ для измерения метаболизма – процесс медленный). Вероятностные подходы часто путают эти вероятности (одна – из-за недостатка знаний, другая – из-за природы самой зависимости), однако стоит помнить, что это разные вещи.

Один из главных мотивов использования вероятностных определений причинности – наше желание знать, служит ли нечто причиной и насколько важно это нечто. Иными словами, мы стремимся различать обычные и редкие побочные эффекты лекарственного средства или сформулировать политическую концепцию, которая вероятнее всего привела бы к росту рабочих мест. Один из методов, позволяющих квантифицировать степень влияния причины на следствие, – определить силу следствия, когда переменные непрерывны (например, как повышается цена акции после выпуска новостей), или вероятность некоего события, когда они дискретны (например, какова вероятность, что цена на акции пойдет вверх).

Но часто все, что удается вычитать в книгах на тему причинно-следственных взаимосвязей, это утверждение, что риск некоторого исхода увеличивается по некоторой причине. Вот несколько начальных строк из статей в научных изданиях:

Ученые утверждают: лечение бессонницы у людей, страдающих от депрессии, может вдвое повысить шансы на полное исцеление [203] .

Как утверждает группа исследователей из Гарвардской школы здравоохранения (HSPH), несколько чашек кофе в день снижают риск суицида у взрослых примерно на 50 % [204] .

Мужчины пожилого возраста чаще, чем молодые, становятся отцами детей, у которых впоследствии развиваются аутизм или шизофрения. Причина – случайные мутации, риск которых растет с приближением к концу возраста отцовства; об этом сообщили ученые, проведя первое исследование с целью квантификации этого эффекта, который усиливается год от года [205] .

Множество других статей начинается с упоминания о снижении или повышении риска, при этом точные цифры роста или падения даются несколькими абзацами ниже. И даже в этом случае данные, приведенные во всех подобных примерах, относительны: удвоить шансы или снизить риск на 50 %. Конечно, фраза «удвоить шансы на некое событие» может прозвучать совсем по-другому, однако, когда речь заходит о двух событиях вместо одного, все гораздо менее убедительно. Скажем, повышение риска инсульта у человека, иногда употребляющего алкоголь, составит либо 0,0000001–0,0000002, либо 0,1–0,2. В обоих случаях шансы удваиваются, но в первом удвоению подлежит очень маленькое число, и результирующее число также остается крайне малым.

На рис. 5.3 это различие представлено наглядно. Для набора из 10 000 000 событий самая низкая степень вероятности составит всего 1, а потом 2. Таким образом, для каждого отдельного события на рисунке есть обозначающие их точки, в то время как каждая из остальных точек на рисунке обозначает 10 000 событий. Итак, при том же удвоении относительного риска можно иначе решить вопрос с курением, когда станут видны абсолютные значения.

Рис. 5.3. Каждая точка представляет 10 000 событий, кроме нижних двух картинок, где черные точки обозначают единичные события. Вероятность событий, представленных черными точками, удваивается от левых картинок к правым, однако необходимо также принимать во внимание общее количество событий

Эту идею степени влияния причины на следствие, или количества вероятности, очень важно вспомнить позднее, при рассмотрении проведения и оценки экспериментов и формулирования политических концепций. Кроме того, постарайтесь держать ее в уме, когда будете в следующий раз читать о новейшем научном открытии.

Особо важно знать размер выборки (велика ли численность исследуемого населения), поскольку без значительного количества наблюдений мы не сможем даже дифференцировать эти результаты. Различие может объясняться естественными вариациями, помехами или погрешностями измерений. К примеру, в зависимости от индивидуальных факторов риска, риск субарахноидального кровоизлияния – редкий, но часто приводящий к смерти вид геморрагического инсульта – составляет всего 8 на 100 000 человеко-лет. Это значит, что если отслеживать 100 000 человек в течение года или 10 000 человек в течение 10 лет, можно ожидать, что мы увидим 8 случаев инсульта. Поэтому гораздо менее вероятно наблюдать истинные вероятностные показатели на меньших выборках: в результате эта цифра может составить 8 или 0 событий, что приведет к некорректным заключениям о степени риска.

От вероятностей к причине

Подобно тому как в центре юмовского подхода к причинности лежит регулярная повторяемость событий, идея вероятностной причинности основана на том, что причина повышает вероятность наступления следствия.

Если одно событие не имеет причинно-следственной связи с другим, вероятность второго не должна изменяться после того, как станет известно о первом. К примеру, вероятность выпадения орла или решки при подбрасывании монетки составляет ½, при этом вероятность того или другого исхода не меняется после первого броска, поскольку все события независимые. То есть вероятность выпадения орлов четко равна вероятности выпадения решек, если при предыдущем броске выпала решка.

Эта концепция представлена на рис. 5.4 (a) в виде эйкосограммы (также ее называют мозаичной диаграммой или диаграммой Маримекко). По оси Х указаны возможные исходы первого события (орлы или решки), по оси У – исходы второго события (также орлы или решки). Ширина столбцов отражает вероятность выпадения орла или решки при первом броске (если монетка сильно несимметричная, первый столбец будет очень узким), а высота серых столбцов показывает вероятность выпадения орла при втором броске (оставшаяся область обозначает вероятность выпадения решки).

Рис. 5.4. На диаграммах представлены условные вероятности. Как только вы выбираете событие в нижней части (например, К), вероятность второго события (не С) обозначается закрашенным столбцом. С маловероятно после К (маленький столбец), в то время как орел или решка с равной степенью вероятности выпадают после любого броска (столбцы одинаковых размеров)

Так как вероятность любого исхода абсолютно одинакова, все сегменты равны. С другой стороны, вероятность того, что конкретного человека изберут кандидатом в вице-президенты, выше или ниже в зависимости от того, кто будет претендовать на президентский пост: тут важны политические убеждения и альянсы, так что эти события зависимы.

На интуитивном уровне, если нечто влечет за собой следствие, после появления причины следствие должно произойти с большей вероятностью, чем обычно. То есть в местностях, где обитают малярийные комары, должно отмечаться больше случаев заболевания, так как комары – разносчики инфекции. Причина также может снизить вероятность следствия – если точнее, причина повышает вероятность отсутствия его наличия. Так, если калий успокаивает мышечные судороги, мы должны отмечать меньше подобных случаев после принятия препаратов калия. Этот случай показан на рис. 5.4 (б), когда вероятность потребления калия (К) ниже, чем непотребления, так что соответствующий столбец уже. Однако большая часть столбца закрашена, поскольку шанс отсутствия мышечных судорог (нет С) намного выше, чем шанс судорог при принятии калия. И наоборот, возможность начала судорог без добавления в организм калия намного выше.

Это простая идея повышения или снижения вероятностей способна привести одновременно как к ложным утверждениям о причинности (поскольку может показаться, что непричины усиливают вероятность следствий), так и к невозможности эту связь выявить (так как не каждая причина увеличивает вероятность следствия).

В мы познакомились с корреляциями и порядком их возникновения. В некоторых ситуациях они оказываются результатом простого совпадения, в других же можно протестировать так много гипотез, что рано или поздно совершенно случайно проявится нечто значительное.

Еще может случиться так, что используемые переменные не будут точно представлять фактические причины. К примеру, о диете скажут, что она обеспечивает определенный уровень похудения, однако соответствующей переменной, вызывающей потерю веса, может стать следование любой диете, а не той конкретной, которую мы тестируем. Возможно также, если мы просто рассмотрим зависимость двух факторов, обнаружится множество аналогичных закономерностей вследствие неких структурных условий. В мы видели выявление ложной корреляции между потреблением шоколада в стране и количеством Нобелевских лауреатов среди ее жителей. Возможно, повышенные объемы вина, сыра или кофе имели бы не менее сильные ассоциации с Нобелевками. Действительно, согласно одному исследованию, среди прочего наблюдалась взаимосвязь между числом Нобелевских премий и количеством магазинов IKEA. Таким образом, потребление шоколада могло быть аналогом некоего индикатора населения, который повышает вероятность одновременного поедания этого продукта и получения Нобелевки, например благосостояния и ресурсов страны.

Именно на подобный тип общей причины нередко возлагают вину, когда одна переменная, кажется, делает другую более вероятной, но в действительности ее причиной не служит. К примеру, если рецессия приводит одновременно к снижению инфляции и безработице, можно решить, что каждый из этих факторов повышает шансы на проявление другого. Мы просто берем пары переменных и интересуемся, усиливает ли одна из них вероятность другой.

Есть и такая методика работы со смешиванием эффектов из-за общих причин (когда измеряются все переменные) – выяснить, можно ли с помощью одной переменной оправдать корреляции между другими. Это ключевой атрибут множества вероятностных подходов, разработанных философами (такими как Саппс (1970), Гуд (1961) и Рейхенбах (1956)), на котором построены вычислительные методы выведения причин по имеющимся данным.

Скажем, некое заболевание (D) вызывает утомляемость (F) и обычно лечится определенным лекарством (М). Идея в том, что смена препарата не приведет к улучшению состояния пациента (утомляемости), если проблема вызвана только болезнью и не решается лекарством. Если заболевание остается константой, другие переменные не дают никакой информации друг о друге. Концепция общей причины, которая подобным образом разделяет следствия, называется экранированием.

Обратимся к диаграмме на рис. 5.5 (а). Есть лекарство, и есть усталость; похоже, первое повышает вероятность второй. Серый столбец выше для усталости, чем для неусталости, показывая, что вероятность выше для случая, когда лекарство истинно, чем ложно. Но как только мы разделим варианты, когда человек болен и когда нет (рис. 5.5 (б) и 5.5 (в)), вероятность усталости уравнивается, вне зависимости от значения препарата. Таким образом, лечение не меняет возможность усталости, как только мы получаем знание о болезни.

Рис. 5.5. Если не принимать во внимание состояние заболевания, кажется, что M и F коррелируют. Если, однако, учитывать этот фактор, корреляции нет (F равновероятен независимо от истинности М)

Подобный тип разделения также может иметь место в цепи событий. Скажем, болезнь приводит к назначению лекарства, и здесь оно действительно вызывает усталость как побочный эффект. Если отношения D → M и M → F истинны, мы также обнаружим, что болезнь повышает вероятность усталости. Однако часто требуется выявить самые непосредственные причинные взаимосвязи, чтобы осуществить более прямые вмешательства. Чтобы избежать появления симптома, нужно отменить лекарство или перейти на другое; но, если мы придем к ошибочному заключению, что как болезнь, так и лекарство провоцируют усталость, мы не сможем узнать, что смена препарата могла бы предотвратить возникновение симптома. И снова, если мы ставим условием М, вероятностное отношение между D и F исчезает.

Как обычно, ни один метод не совершенен, и успех зависит на самом деле от измерения общей причины. То есть, если рецессия приводит одновременно к снижению инфляции и безработице и мы не знаем, имеет ли место рецессия, нет возможности использовать условие экранирования, чтобы выяснить, не ложна ли видимая причинная зависимость между инфляцией и безработицей. Получается, реальные мы найдем взаимосвязи или ошибочные, целиком зависит от наличия верного набора переменных.

Эта проблема вновь выйдет на передний план, когда в мы затронем вычислительные методы. Но, хотя на базе ряда сценариев мы и располагаем несколькими способами отыскать скрытую общую причину, это не решает проблему вычислительных методов в целом.

На этом, однако, история не заканчивается. Иногда просто нет единственной переменной для экранирования двух следствий. Скажем, Алиса и Боб любят занятия по машинному обучению и предпочитают те, которые назначены на послеобеденное время. Тогда, взяв условием либо содержание курса, либо время, мы не сможем полностью экранировать такие переменные, как выбор занятий Алисой и Бобом. Если известно только время занятий, то запишется на них Боб или нет, действительно дает информацию о выборе Алисы, так как этот фактор становится косвенным индикатором содержания курса. Нет единственной переменной, экранирующей А и Б друг от друга.

И если мы добавим переменную, которая будет истинной, только если курс одновременно и начинается после полудня, и посвящен машинному обучению, этот фокус поможет. Но, чтобы понять необходимость этой более сложной переменной, нужно знать кое-что о проблеме и потенциальных причинных взаимосвязях, а это не всегда возможно.

Пока мы вообще не затрагивали временные паттерны (приняли как данность, что причина происходит до следствия). Однако иногда используется фактор, способный объяснить корреляцию, который мы обычно не включаем в свой анализ, – изменение взаимозависимости во времени.

Чтобы представить ситуацию, когда экранирование не срабатывает, вспомним примеры индетерминизма из начала этой главы. Если некое оборудование неисправно, это может помешать идеальному экранированию его эффектов. Чтобы это проиллюстрировать, часто используется пример с неисправным тумблером, одновременно включающим телевизор и лампу (он не всегда замыкает цепь). Если телевизор работает, горит и лампа, и наоборот, но, бывает, оба прибора не активированы. Для решения этой проблемы можно добавить четвертую переменную – замкнутую цепь; но, чтобы узнать о ее необходимости, нужно иметь некоторое понимание о структуре проблемы, а оно есть не всегда.

Один из вариантов – не рассматривать точную взаимосвязь, но изучить, будет ли возможная причина иметь большое значение для следствия, если другие факторы останутся неизменными. До сих пор мы анализировали все ситуации, при которых то, что нельзя считать причиной, может все-таки повышать вероятность следствия; но возможно также, что истинная причина не повысит эту вероятность. Один из очевидных примеров – это причина, предотвращающая следствие (например, вакцина, которая предупреждает болезнь). С такими случаями разобраться легко, поскольку мы можем либо переопределить факторы в терминах снижения вероятности, либо применить отрицание следствия как интересующий нас исход (то есть «неболезнь»). Но как насчет иных ситуаций, когда положительная причина снижает вероятность или вообще не оказывает никакого действия? Здесь ключевые факторы – это выборка, на основе которой берется информация, и степень детализации переменных.

Парадокс Симпсона

Представим, что вы пациент, которому надо выбрать одного из двух врачей. У доктора А (Алиса) смертность пациентов, проходивших лечение от определенной болезни, составляет 40 %, у доктора B (Бетти) – 10 %. Если исходить только из этой информации, легко выбрать Бетти; на самом деле у вас недостаточно данных, чтобы принять подобное решение.

Действительно, возможно, что для каждого отдельного пациента лечение у Алисы дает лучшие результаты, даже если кажется, что общий уровень смертности у нее выше.

Алиса и Бетти не выбирают пациентов случайным образом: видимо, их направляют другие врачи, или те приходят по объявлениям. Поэтому, если большой опыт Алисы привлекает к ней самые сложные и трудноизлечимые случаи, общий уровень смертности может показаться очень плохим, хотя как доктор она и лучше.

В этом примере интересно то, что мы не просто обнаруживаем ошибочную причинную зависимость, но и можем реально выявить зависимость, обратную истинной: что результаты Алисы хуже, хотя в действительности они лучше. Точно такой же сценарий может иметь место с медикаментами, если не анализировать данные выборочных экспериментов (когда пациенты распределяются по группам лечения случайным образом).

Главная проблема в том, что может быть смещение относительно того, кто какое лекарство принимает, а устранить его на деле получится только выборочным распределением пациентов по группам. К примеру, если больные с агрессивной формой рака получают лечение А, а с более легкими случаями – лечение В, несомненно, результаты А покажутся хуже, поскольку эта группа имеет более серьезные проблемы. Смещение выборки – одна из причин, по которой так сложно делать логические заключения на основе данных наблюдения. Можно обнаружить, что люди, активно занимающиеся спортом в пожилом возрасте, живут дольше тех, кто ведет малоподвижный образ жизни, – но, возможно, потому, что физически активные всю жизнь просто здоровее прочих.

Странный феномен, когда причинные взаимосвязи исчезают или обращаются вспять, известен как парадокс Симпсона, . Симпсон описал математические свойства, которые должны быть присущи данным, чтобы такая ситуация смогла возникнуть. Он привел пример, когда лечение приносит пользу, если данные по пациентам разного пола рассматриваются отдельно, но кажется неэффективным для контингента в целом. Другие исследователи показали, как возникает еще более экстремальная ситуация, когда новое лечение на деле приводит к повышению смертности у населения в целом, хотя и мне, и еще кому-то оно помогло. Это показано на рис. 5.6. Прочие известные примеры – процент поступивших в Беркли (когда показатель для женщин кажется ниже, поскольку они подают документы на факультеты с высоким конкурсом) и количество смертных приговоров во Флориде (когда казалось, что раса подсудимого влияла на приговор, хотя в действительности на него влияла раса жертвы).

Рис. 5.6. Иллюстрация парадокса Симпсона, где А лучше в каждой подгруппе, но В кажется лучше в комбинации

В каждом из примеров парадокса Симпсона можно объяснить сомнительную взаимосвязь с новой информацией – особенно если рассматривать подгруппы. В примере с докторами, изучив группы пациентов с одинаковым состоянием здоровья или уровнем риска, можно сделать вывод, что показатели Алисы лучше. В примере с процентом поступивших в Беркли можно провести стратификацию по факультетам, а в примере со смертными приговорами – по расовой принадлежности жертв. Это значит, что все дело в уровне детализации при изучении данных. Чтобы вывести на основе данных вероятностные зависимости, нужно знать, что наблюдаемые вероятности репрезентативны для зависимостей, лежащих в их основе. Если наша задача – осуществление политической программы, необходимо знать, что вероятности для одной группы населения применимы ко всей целевой группе.

Конечно, ключевая проблема – определить, когда и как подразделить имеющиеся данные, поскольку неверно, что очередное дробление решит вопрос. Можно иметь контринтуитивные результаты для отдельной подгруппы, которые не получить на агрегированных данных, и более мелкое деление снова изменит взаимосвязи. В примере с лекарством, лучше действующим на мужчин и женщин в индивидуальном порядке и хуже – на все население, вероятно, мы должны поверить, что лекарство вообще работает. Хотя подобная точка зрения немало дискутировалась, сам Симпсон считает, что такое лечение «вряд ли можно отвергать как бесполезное для всей человеческой расы, если оно приносит пользу мужчинам и женщинам». И все же он приводит пример, когда подобная интерпретация оказывается несостоятельной. Корректный набор переменных, используемых как условия, можно найти, однако для этого требуется, чтобы мы уже имели некоторое знание о причинно-следственной структуре. А это проблематично, если мы только приступаем к ее изучению.

Именно здесь кроется корень многих вопросов причинности. Мы просто не в состоянии полностью устранить потребность в базовом знании проблемы и обязаны использовать это знание, чтобы выбирать данные для анализа и интерпретировать результаты.

Контрфактуальное высказывание

«Если бы вы не шумели, когда я играл в боулинг, я не промахнулся бы». «Если бы на улице было жарче, я бежал бы медленнее».

В подобных случаях мы пытаемся выделить один ярко выраженный фактор, который приводит к одному исходу вместо другого. Часто говорим о причинности в терминах альтернативы уже случившемуся. Мы не можем ничего сказать наверняка: «Возможно, даже при идеальной погоде я растянул бы связки на пробежке или должен был остановиться и завязать шнурки на кроссовках».

Если исходить из предпосылки, что в случившемся сценарии все прочее оставалось бы неизменным, «я бежал бы быстрее, если бы погода была получше».

Такие высказывания указывают на определенную необходимость или значимость, а их не могут обеспечить закономерности. Если в случае с юмовской идеей регулярной повторяемости событий мы знаем только, что те или иные вещи часто происходят совместно, здесь пытаемся показать следующее: чтобы все произошло так, как произошло, нужна была определенная причина, и без этой причины все произошло бы иначе. Это называется контрфактуальным рассуждениеем. Фактически контрфактуальным называется высказывание следующего вида: «Если бы А было истинно, то и С было бы истинно». Например, если бы я нанес крем от загара, избежал бы ожога.

Интересно, что Юм положил начало как закономерному, так и контрфактуальному подходу к причинности. Он писал, что причина есть «объект, за которым следует другой объект, и когда за всеми объектами, подобными первому, следуют объекты, подобные второму» (определение закономерности), и далее: «Другими словами, без первого объекта никогда не существовал бы второй» (определение контрфактуальности).

Может показаться, что он верит, будто это всего лишь два способа сказать одно и то же. На деле, однако, эти определения породили два отдельных направления в области причинности.

Контрфактуальный подход (вдохновил его Юм, а формальное определение дал Дэвид Льюис (1973)) предполагает: чтобы С стало причиной Е, две вещи должны быть истинными: если бы С не произошло, Е не случилось бы, и если случилось С, то должно случиться и Е. То есть если бы я нанес крем от загара, не обгорел бы на солнце, а если бы не нанес, не смог бы избежать воздействия солнечных лучей. Такая формулировка охватывает одновременно и необходимость, и достаточность. Существуют также вероятностные контрфактуальные подходы, но мы не станем в них вдаваться.

Вспомним пример с хакерским марафоном. Может случиться так, что каждый раз, когда программисты выпивают много кофе, на следующий день они ощущают сильную усталость. Возможно, они пьют только кофе, но в больших объемах всегда, засиживаясь допоздна. И тем не менее, используя только эту регулярную повторяемость, мы обнаружим, что кофе и есть причина усталости. Но, если бы программисты не пили кофе, они все равно на следующий день валились бы с ног (они же не спали всю ночь, плюс отсутствие кофеина). Таким образом, потребление кофе не может быть причиной усталости – если проанализировать этот случай с помощью контрфактуальных высказываний.

В теории такой подход помогает различать факторы, случающиеся совместно по чистому совпадению и потому, что между ними есть реальная причинная зависимость.

Теперь спросите: откуда мы можем знать, что произошло бы?

Это одна из коренных сложностей построения юридических рассуждений (к этой теме мы еще вернемся): можем ли мы знать наверняка, что вы не были бы вынуждены резко тормозить, если бы автомобиль перед вами не занесло, и в результате столкновение не произошло бы? Возможно, ехавший за вами водитель отвлекся или был нетрезв, поэтому в любом случае он ударил бы вашу машину.

Контрфактуальные высказывания относятся именно к таким единичным событиям, а не к обобщенным свойствам (подробнее о них в ). Один из способов превратить такие случаи в объект, подлежащий формальной оценке, – соотнести их с моделью.

То есть, если мы сможем представить систему в виде набора уравнений, получим возможность проверить: останется ли следствие истинным, если окажется, что причина была ложной. К примеру, если яд всегда смертелен, то смерть истинна, если истинен яд. Конечно, смерть может наступить от многих возможных причин, поэтому для них нужно также установить набор значений. Тогда мы сможем увидеть, что произойдет при изменении значения яда. Если мы припишем ему значение «ложно», будут ли другие переменные достаточны, чтобы значение смерти осталось истинным? Эта идея лежит в основе моделей структурных уравнений, где каждая переменная – это функция от некоторого набора других переменных системы.

Однако контрфактуальный подход не свободен от проблем. Возьмем дело Распутина. Как гласит легенда, он съел пирожные с отравленным вином (содержащегося в нем цианистого калия хватило бы, чтобы убить пятерых человек), но все же остался жив. Потом он получил выстрел в спину – и снова не погиб; в него выстрелили еще раз. В конце концов его связали и бросили в ледяную воду. Он пережил и это! В итоге Распутин все же умер – захлебнулся. Что стало причиной смерти? Можно ли утверждать наверняка, что он бы умер, не будь отравлен? Могло случиться так, что яд подействовал не сразу или он ввел Распутина в коматозное состояние, и тот просто не мог выплыть. Точно такую же роль могли сыграть выстрелы (то есть другим способом способствовать смерти).

Подобные ситуации с несколькими причинами, любая из которых могла вызвать следствие, особенно сложны для контрфактуальных рассуждений. Это примеры множественности равнозначных причин, или симметричная форма так называемой избыточной причинности. Среди ее образцов – момент, когда в арестанта выпускают обоймы несколько членов расстрельной команды или когда пациент принял два лекарства, вызывающие одинаковые побочные эффекты. В обоих случаях, если одной из индивидуальных причин не было (один из солдат не стрелял, пациент принял одно из лекарств), следствие все равно случается. Следствие не зависит контрфактуально от каждой из причин.

Теперь сделаем условие менее жестким и скажем, что следствие случилось бы, но несколько иное. Возможно, побочные эффекты начались бы позже или, к примеру, не оказались бы столь сильными.

При множественности равнозначных проблематично не найти вообще никаких причин, но чисто теоретически мы никак не можем выделить одну особую. И кажется логичным, что каждая отдельная причина вносит в следствие свой вклад.

Возьмем ситуацию, когда есть две причины, но только одна из них активна в каждый конкретный момент времени, а другая представляет собой что-то вроде резерва, который активируется, если не срабатывает первая: к примеру, если каждый солдат будет стрелять, только если предыдущий залп не убил арестанта. В биологии часто встречаются подобные типы резервных механизмов: например, два гена дают одинаковый фенотип, но один из них к тому же побуждает другой к действию. То есть ген А подавляет ген B, и ген B активен, только когда неактивен ген A. И опять-таки фенотип не зависит от А, поскольку, если А неактивен, B активен и создает фенотип. Этот случай гораздо более проблематичен, чем предыдущий, поскольку мы можем интуитивно выбрать один фактор в качестве активатора следствия, хотя с помощью контрфактуального метода его нельзя обнаружить. Такой тип проблемы, когда есть две или более возможные причины для следствия, но реальна только одна, называется вытеснением.

Часто различают так называемые раннее и позднее вытеснения. При раннем вытеснении только один каузальный процесс доходит до завершения, в то время как другой – который был бы активен в отсутствие первого – подавляется. Именно это происходит в примере с резервным геном. Позднее вытеснение – ситуация, когда имеют место обе причины, но только одна ответственна за наступление следствия. Пример – расстрельная команда выполняет свою работу, но одна пуля настигает цель чуть раньше других и убивает арестанта до того, как в него попадают остальные.

Есть и другие ситуации со специфическими формулировками причинности в терминах контрфактуальности, в частности, когда каузальность рассматривается в цепочках контрфактуальных зависимостей. В случае с цепочкой контрфактуальной причинной зависимости говорится, что первый элемент цепи есть причина последнего.

К примеру, в эпизоде сериала «Как я встретил вашу маму» два персонажа спорят, кто виноват, что они опоздали на самолет. Робин винит Барни, потому что Тед, прыгая через турникет, чтобы встретиться с Барни в метро, получил штраф, и судебное заседание было назначено как раз на утро в день вылета. Тед, однако, позднее решает, что виновата Робин, потому что именно из-за нее Барни пришлось бежать марафон (поэтому ему понадобилась помощь в метро), и образовалась сложная цепочка разнообразных событий, включая сломанную ногу Маршалла (в чем была виновна Робин). Робин, в свою очередь, обвиняет Лили: из-за того что Лили долго ждала в очереди на распродаже свадебных платьев, Робин заснула у нее дома, поэтому Маршалл заметался и в результате сломал ногу. История заканчивается выводом Теда: во всем виноват он, потому что нашел редкую счастливую монетку и они с Робин использовали деньги от ее продажи, чтобы купить хот-доги через улицу от магазина одежды. В сериале все эти высказывания контрфактуальны: если бы Теду не нужно было идти в суд, он не пропустил бы свой рейс; если бы Маршалл бежал марафон, Барни не понадобилась бы помощь; если бы Лили не пошла в магазин одежды, Маршалл не сломал бы ногу; если бы Тед не подобрал монетку, они не узнали бы о распродаже.

Различные теории каузальности расходятся в том, что в подобных ситуациях считать истинной причиной. Некоторые базируются на поиске самого раннего фактора, запустившего цепочку событий, которые привели к следствию, другие – последней по времени причины. Одна из проблем состоит в том, что мы можем выявлять события, все более и более удаленные от фактического следствия.

Но еще проблематичнее ситуация, когда нечто препятствует одному проявлению следствия, но вызывает другое его проявление, создавая видимую цепочку зависимости. К примеру, добрый самаритянин спасает жизнь человеку, который падает на рельсы метро перед приближающимся поездом. Этот человек, однако, позже все равно погибает, прыгая с парашютом. Он не мог бы заниматься парашютным спортом, если бы его не спасли; выходит, что смерть контрфактуально зависит от прыжков с парашютом, а те – от факта спасения. Таким образом, добрый самаритянин стал причиной его смерти.

В мы рассмотрим, как это решается в юридических случаях. Как бы то ни было, если спасенный человек затем садится пьяным за руль и сбивает пешехода, мы не станем возлагать вину на спасителя, даже если его действия сделали реальным позднейший инцидент. Здесь, конечно, возможна причинно-следственная связь, но этого недостаточно, чтобы возложить юридическую ответственность: ее компонентом считается предсказуемость последствий, а здесь таковой не наблюдается.

Пределы наблюдений

Вернемся к статистическому примеру в начале этой главы, где утверждалось, что определенные факторы на 98 % спасают от бедности. К этому моменту вы, надеюсь, уже осознали, как сложно вывести из этой статистики причинную зависимость. Если мы располагаем только данными наблюдения, то не можем быть уверены, что нет никаких общих неявных причин, ответственных за видимые каузальные взаимосвязи. Например, мы способны обнаружить корреляцию между детской любовью к видеоиграм со сценами насилия и превращением в насильника во взрослом возрасте. Но любовь к подобным играм может зависеть исключительно от окружающих условий и генетических факторов. Точно так же, когда мы имеем возможность только наблюдать, но не вмешиваться, стоит учитывать вероятность смещения выборки. Скажем, люди, занимающиеся спортом, имеют усиленную толерантность к боли. Это ничего не говорит о том, действительно ли спорт повышает болевой порог или правда ли, что люди с высоким болевым порогом любят физические упражнения, поскольку легче выносят дискомфорт.

И все же наблюдения дают точку отсчета для последующих экспериментов или обращения к базовому знанию механизма действия (то есть к выяснению, как именно причина вызывает следствие).

Название книги

Почему. Руководство по поиску причин и принятию решений

Клейнберг Саманта

5. Наблюдение. Как выявить причину, наблюдая за порядком вещей