Почему. Руководство по поиску причин и принятию решений

Клейнберг Саманта

10. Двигаемся дальше. Почему же все-таки причинность

 

 

Потребность в причинности

Тысячи лет спустя после эпохального труда Аристотеля о причинности, через сотни лет после того, как Юм сформулировал два ее определения, и десятилетия после того, как автоматизация причинно-следственных выводов стала возможной благодаря новым мощным компьютерам, каузальность по-прежнему остается неразрешенной проблемой. Люди склонны видеть причинно-следственные связи там, где их нет, а наши алгоритмы не имеют «защиты от дурака». Более того, как только мы находим причину, все равно остается трудность использования этой информации для предотвращения или продуцирования определенного результата, поскольку существуют ограничения относительно того, какую именно информацию мы собрали и до какой степени способны ее осмыслить.

Теперь, рассмотрев все случаи, когда методики не работают, а ученые и политики совершают досадные каузальные ошибки, вы можете спросить: а какое нам до этого дело? Мы же более не связаны рамками маломасштабных экспериментов, когда приходится систематически изменять только один объект за раз, чтобы узнать, как работает система. Теперь мы располагаем громадными объемами данных о покупательских привычках, медицинских записях и активности в Сети, и все это – в цифровом формате. Теперь, куда бы вы ни направлялись, можете взять с собой датчик ускорений и GPS «в одном флаконе» (то есть смартфон), а ваша деятельность в Сети отслеживается множеством способов. Природа интернета, распространение электронных медкарт и вездесущие сенсоры сделали возможным генерирование огромного объема информации о великом количестве видов деятельности большего числа людей, чем когда бы то ни было. При таком массиве исходного материала, может, и не слишком важно, как что-то там работает. Можно отыскать информацию для корреляции – и хватит.

Когда есть столько информации, да еще такой детальной – последовательность книг, которые приобретает человек; каждый шаг, который он делает; результаты миллионов телефонных звонков в рамках политической кампании, – продавцы могут составлять рекламные объявления в расчете на целевых покупателей, фитнес-центры – оценивать, сколько калорий вы сожгли, а политики – выискивать избирателей, которых можно привлечь на свою сторону. Да, огромный объем данных в самом деле может повысить точность прогнозов, и если все, что мы желаем знать, это кто с большей вероятностью купит пару туфель, увидев рекламу, тогда, возможно, и не важно, как эта реклама работает. Даже если какие-то прогнозы окажутся ошибочными.

В таком случае забудьте про теорию и объяснения механизмов действия; все ответы уже содержатся в имеющихся данных.

Конечно, слово «причина» используется не всегда. Анализ данных может охватывать ассоциации, корреляции, связи, тенденции, взаимоотношения, взаимосвязи и факторы риска. И даже в тех случаях, когда язык каузальности звучит уж слишком туманно, выводы и заключения часто все равно применяются так, как если бы они причинами и были. В конце концов, мы оперируем сведениями, чтобы выяснить вероятный итог и иметь возможность изменить его или проконтролировать.

Даже если вам не приходится анализировать данные такого рода по долгу службы и неинтересно забираться в дебри функционирования девайсов вроде вашего фитнес-трекера, вам все равно не укрыться от результатов аналитической работы, которую выполняют другие.

Стоит ли поддерживать новую политику, предусматривающую снижение страховой премии людям, которые носят шагомеры? Почему мы выбираем одно лекарство, а не другое? Как мы уже видели, корреляции здесь не помогут. Даже если бы мы могли делать безошибочные прогнозы и осуществлять вмешательства на их основе, мы все равно всегда хотим знать, почему происходит то или иное, – и дети со своим назойливым «почему», и взрослые, которым нужно решить, где ошибка и кто виноват.

Ни в коей мере не выступая в роли «реликта ушедшей эпохи», как утверждал больше века назад Бертран Рассел,, причинность – и способность ее критического осмысления – необходима больше, чем когда-либо, именно сейчас, когда мы собираем эти громадные базы данных. Осознание того, когда можно, а когда нельзя выяснить причину, – умение столь же фундаментальное, как способность читать и писать. Мы проводим миллионы экспериментов, чтобы вычленить какой-нибудь значимый сигнал в горах цифрового щебня, и шансы найти нечто ценное по чистой случайности все растут, как и необходимость скептического отношения ко всем находкам без исключения.

Там, где невозможна экспериментальная валидация каждой отдельной находки, на помощь приходит статистика, с помощью которой мнимые открытия можно контролировать (до известной степени). Но знание о том, почему возникают ложные взаимосвязи, также поможет понять, когда полученный вывод – всего лишь корреляция.

Существует неверное понимание, что так называемые большие данные – это всего-навсего больше сведений: больше людей, временных точек, переменных. Но сбор таких данных – это не просто расширение малого массива.

Чтобы получить несколько телефонных номеров, можно просмотреть адресную книгу и методично проверить каждый контакт. Звоня приятелю по телефону, мы точно знаем, кому соответствует этот номер, персональный он или принадлежит всему домовладению, домашний или мобильный. С другой стороны, когда нам нужны миллионы телефонных номеров, мы просто не способны знать каждого человека лично и должны собирать сведения из совокупности таких источников, как коммерческие базы данных и списки обзвона, которые, возможно, устарели или неверны и которые нельзя верифицировать в индивидуальном порядке. Кто-то мог переехать, кто-то зарегистрировал несколько номеров под разными именами, а кто-то просто отключил телефон.

Чем больше данных, тем выше шансы помех и ошибок, поэтому сопоставление не настолько однозначно, как кажется. По сравнению с небольшими контролируемыми наборами сведений возникает больше вопросов о качестве данных и потенциальных источников ошибок, смещений и упущенных моментов. При больших массивах информации переменные сложнее интерпретировать, а данные часто собираются по другим временным графикам.

Вместо того чтобы исчезнуть, становится только насущнее необходимость знать, почему происходит то или иное.

* * *

Мы нуждаемся не только в причинной зависимости, но и в глубоком знании соответствующего предмета, чтобы просто понять, был ли эксперимент успешным, и интерпретировать его результаты.

В ходе одного проекта я анализировала данные пациентов неврологического отделения интенсивной терапии, чтобы выяснить, что вызывает вторичные мозговые травмы у больных с инсультом. Чтобы ускорить исцеление, они содержатся в прохладных условиях, и у некоторых регистрировалась температура тела 20 °C. Этот показатель кажется необычно низким, но у таких пациентов вообще многие показатели аномальные, потому что они серьезно больны. Чтобы понимать, что 20 °C означают очень сильную гипотермию, и скептически отнестись к такому значению, нужно обладать определенными знаниями из области физиологии. А чтобы точно определить, почему зарегистрирована такая низкая температура, требуется еще больше специальных знаний. Многие клиницисты, однако, способны только взглянуть на этот показатель и немедленно понять, что произошло. Температура измеряется катетером, который вводится в мочевой пузырь, поэтому, если катетер выскальзывает, он начинает измерять температуру комнаты, которая как раз составляет около 20 °C. Это очевидно, если взглянуть на ситуацию в ретроспективе, но только тот, кто разбирается в данных и знает, откуда они берутся, способен все объяснить.

Без подобного понимания человек, перед которым просто вывалили беспорядочную кучу информации из базы и сказали «Ройся в ней, как твоей душе угодно», может ошибочно обнаружить, что низкая температура – индикатор улучшения состояния пациента, потому что медсестры после случая с выскользнувшим катетером начинают уделять ему больше внимания и быстро устранять проблемы. Действия на основе подобной корреляции способны стать причиной неэффективных вмешательств, когда охлаждение пациентов приблизится к опасному уровню.

В добавление к необходимости определять корректность значения переменной, узнавать, что она означает и когда ее нет, тоже может оказаться сложнее, чем представляется. Практически все вычислительные методы исходят из допущения, что общие причины измерены и мы располагаем «правильным» набором переменных. Этого, однако, недостаточно, если данные не показательны в отношении истинного состояния переменной или если общее следствие – единственный надежный индикатор того, что причина имела место.

Среди прочего, диагноз может упоминаться в медицинской карте пациента для выставления счета, потому что это предполагаемый диагноз или данные наследственности, а также по иным причинам (например, ошибка копирования). Даже если значение указано, оно может неэффективно экранировать последствия причины, наличие определенного заболевания отражается неточно, а если не указано, это может быть результатом недосмотра регистратора. Если пациент болен диабетом, но это неадекватно отражено в документации, можно вывести некорректное соотношение между высоким содержанием сахара в крови и инсулином.

В некоторых случаях необходимо обладать обширными знаниями, чтобы проводить различие между переменными, измеренными в разных временных рамках (сюда входят все теоретически измеримые временные точки), и теми, для которых недостает данных. Биллинговые коды в медицинских картах могут сказать, от чего лечился пациент, а иногда в картах содержатся перечни патологических состояний пациента.

Если в ходе одного визита к врачу астма указывается, а в ходе другого нет, как это истолковать? Маловероятно, чтобы астма обладала свойством истинности только в один конкретный момент: это хроническое состояние. Однако пациент мог получать соответствующее лечение только в одном случае (и, следовательно, счет выставили только за этот визит). Все же, чтобы узнать, какие сведения упущены (врач некорректно не указал астму в списке проблем), а какие ложные (острое состояние вроде гриппа со временем ослабевает), нужно понимать не только саму проблему, но и как именно генерируются данные.

Наиболее оптимистичный сценарий – когда ошибки представляют собой просто случайные помехи, влияющие на все переменные в равной степени. В реальности, однако, устройства имеют разные уровни помех, а люди могут отвечать на одни вопросы точнее, чем на другие. К примеру, если мы спросим некую группу, курят ли они, одни солгут, а другие решат, что их спрашивают, курят они сейчас или курили ли в прошлом. Измерения артериального давления печально известны своей ненадежностью, поэтому мы можем обнаружить, что лекарство от гипертензии – лучший индикатор, указывающий, страдает ли человек от повышенного давления на самом деле. Конечно, затем мы увидим корреляции между этим препаратом и другими состояниями, а не между гипертензией и сопутствующими патологиями. Необходимы знания в конкретной области, чтобы понять: лекарство – просто индикатор гипертензии, оно не может быть причиной заболеваний.

Наконец, корреляции, выведенные на основе крупных наборов данных, которые изначально не предназначались для научных целей, могут отличаться низким уровнем обобщаемости, ограничивая нашу способность применить новое знание к будущим ситуациям.

В 2010 году ученые проверили, действительно ли пользователи Facebook с большей вероятностью пойдут на выборы в американский Конгресс, если получат информацию о голосовании при входе в соцсеть. И в частности, действительно ли процент пришедших на избирательные участки вырастет, если люди узнают, что их друзья уже проголосовали. Более 60 миллионов человек получили извещения от Facebook с перечнем их друзей, которые указали, что уже проголосовали, а две группы поменьше (примерно по 600 000 человек в каждой) либо получили такую информацию в виде ссылки на местный избирательный участок, либо не получили никакой. Сравнив эти группы и кросс-ссылки с данными голосования, ученые заявили, что, по их оценкам, информирование в соцсети привело к увеличению числа проголосовавших примерно на 60 000 (а по косвенным данным – еще на 280 000).

И все же дополнительные 60 000 избирателей после рассылки извещений 61 миллиону – это прирост голосов менее чем на 0,1 %. Необработанные данные могут выглядеть внушительно, но только наличие громадной соцсети позволило применить подобный нецелевой метод. Если бы его пришлось реплицировать на соцсети меньшего охвата, то, чтобы получить значимую цифру новых голосов, понадобился бы иной, более прямой подход. В действительности фотографии близких друзей оказались намного эффективнее информации о том, что какие-то дальние знакомые посетили избирательные участки, однако фильтр подобного рода потребовал бы сведений о взаимоотношениях между людьми. С учетом слабого эффекта такого подхода, различий между пользователями Facebook и других соцсетей, а также несбалансированных размеров групп нельзя сказать, что это вмешательство эффективно и его можно с успехом использовать на примере других соцсетей или во время избирательных кампаний вне США. Вместо того чтобы отказываться от преимуществ причинности, лучше отказаться от идеи заиметь «черный ящик», который поглощает некий набор данных прямо из их источника и выдает поток причин, не требуя ни интерпретации, ни человеческого вмешательства. Каузальное осмысление необходимо и возможно, однако оно не идеально и, что более важно, требует специальных знаний.

 

Основные принципы

Легко может создаться впечатление, что множество не связанных между собой отраслей знания работают в изоляции друг от друга над мелкими частями проблемы, потому что ученые, затворившись в своих узкоспециальных башнях из слоновой кости, спорят о наилучших способах выявления и применения причин. Очевидного консенсуса не видно, а каждый подход страдает таким количеством ограничений, что все предприятие кажется просто безнадежным. Нужно понимать, что, даже если мы искренне хотим узнать причины, скорее всего, сделать этого так и не сможем.

Проблема каузальности не решена, и здесь нет никакой великой и единой теории. Мы не можем дать определение причины, работающее в каждом отдельном случае, с которым столкнемся, и не существует метода выявления причин на основе данных любого и каждого типа. Безусловно, азарт исследователей подогревается недосягаемыми горизонтами неизведанного. Но если вы не из их числа, что можете для себя вынести?

Нам, конечно, известно не все, но кое-что все-таки понятно. Еще важнее и обнадеживает, что наше понимание причинности постепенно совершенствуется.

Это стало возможным отчасти за счет лучшей информации и более мощных вычислительных систем, а отчасти за счет сближения узкоспециальных и междисциплинарных познаний.

Причинность и корреляция не синонимы

Итак, один из главных «сухих остатков» этой книги – понимание, как сложен поиск причин.

В подавляющем большинстве случаев, когда мы уверены, что отыскали причину, на самом деле мы обнаружили всего лишь корреляцию. А иногда даже и она мнимая. Это может быть результатом искажений (когда, не замерив правильные переменные, мы обнаруживаем ложную взаимосвязь между следствиями с общей причиной), смещений поиска и оценки информации (предвзятость подтверждения означает, что мы видим только положительные примеры) или многих других проанализированных нами факторов.

Очень важно знать все возможности обнаружения корреляций, которые не считаются причинными зависимостями, так как это поможет критически оценить наши выводы и допущения и предотвратить неэффективные вмешательства.

Скажем, я увидела корреляцию между дистанцией своих пробежек и уровнем энергетики организма. Неожиданный вывод: чем дольше я бегаю, тем энергичнее себя ощущаю. Но, если это происходит лишь потому, что я дольше бегаю в те дни, когда у меня больше свободного времени и я могу позже лечь спать, тогда в действительности я выяснила только следующее: энергией заряжает долгий сон, и любое предположение по поводу громадного вброса энергии после марафона определенно не сбудется. Также это значит, что для меня лучшая стратегия восстановиться – больше спать, а не бегать часами.

И не важно, насколько велик массив данных, – все равно не уйти от необходимости подвергнуть свои выводы сомнению и задать вопрос «почему».

К примеру, компания Google использовала корреляции между поисковыми критериями пользователей интернета и случаями заболевания гриппом, чтобы спрогнозировать тенденции болезни еще до того, как это успевали сделать Центры по контролю заболеваемости. Но подобный подход работает только в том случае, если люди ищут информацию в Сети, потому что уже наблюдают симптомы, а не потому, что их заботит распространение гриппа, симптомы появились у членов их семьи или стало известно об исследованиях Google. На деле эффективность сервиса Google Flu Trends со временем снизилась. В 2011 году предсказанные им уровни заболеваемости оказались намного выше того, что было в действительности, и завышение показателей продолжалось еще некоторое время после эпидемии. Не понимая, почему нечто становится прогностическим индикатором, нельзя избежать непредвиденных неудач.

Критический подход к смещению

Аналогично существует много областей, где мы можем ошибаться, но их выявление и учет помогут разработать усовершенствованные методы, избегать мнимых причинно-следственных выводов и проводить более эффективные вмешательства. Одна из причин, по которой мы посвятили целую главу психологии каузальности, такова: зная, где мы добились отличных результатов в поиске причин, мы сможем разработать лучшие методы автоматизации этого процесса, а зная, где кроются ошибки в осмыслении, сумеем уделить особое внимание слабым звеньям цепи. То есть мы будем внимательнее отслеживать когнитивные искажения и избегать их, разрабатывать алгоритмы, способные эффективно справляться со смещением выборки, или передавать обязанности по очистке и анализу данных другим людям. Главное – чтобы они не были знакомы с гипотезой, на которой строится конкретное исследование, чтобы избежать случайной предвзятости подтверждения.

Психология позволила глубже осмыслить извечные философские вопросы (такие как зависимости между моральными и каузальными суждениями), а также сформулировала предположение, что стоит обращать гораздо больше внимания на внешнюю валидность и на то, как именно мы оцениваем методы причинного осмысления и объяснения.

Во многих случаях необходимо собирать больше данных (притом из разных источников), чем планировалось изначально. Один из ключевых выводов психологической науки звучит так: люди могут в действительности расходиться во мнениях как насчет того, что именно стало причиной события, так и насчет относительной значимости различных причин единичного события. Эти разногласия могут корениться в культурных различиях, которые необходимо учитывать, разрабатывая методы поиска каузальных объяснений. В философии, где тестовые случаи оцениваются аналитически, чтобы доказать некую теорию, это означает, что интуитивные прозрения конкретного человека необязательно формируют общие понятия путем синтеза.

То, что, по мнению канадского профессора, заставило студента мошенничать на экзамене, необязательно совпадет с предположением фермера из индийской деревни. Даже в простейших исследованиях каузального восприятия, например в экспериментах Мишотта, не все участники воспринимают сюжеты одинаково.

Конкретная причинность намного более сложна, и потенциально могут быть правильными разные ответы, которые все же более-менее релевантны в различных случаях. Дорожные происшествия могут быть вызваны недосмотром автопроизводителя, невнимательным вождением и плохими погодными условиями – и все это в одно и то же время. Однако то, что будет важным в судебном разбирательстве, приобретет иную значимость в других целях. Подобные различия в объяснении также влияют на решения, принимаемые судьями, и в конечном счете на выбор присяжных. Труды в области экспериментальной философии ставят задачей определить вариативность подобных суждений и выяснить, какие факторы обусловливают разницу мнений и методов оценок различных случаев. Хотя мы до сих пор не располагаем идеальной теорией, объясняющей, как именно люди определяют виновность или идентифицируют токен-случаи, применение экспериментальных методов из области когнитивной психологии для решения философских проблем помогает выходить за рамки интуитивных прозрений отдельных лиц, оценивая сработавшие методы.

Для валидации методов необходима фундаментальная истина (то есть знание реальной причины события), чтобы иметь возможность сравнить ее с результатами, которые дало применение этого метода. Но, если объяснения субъективны, а истина изменяется в зависимости от того, кому задают вопросы, необходима переоценка наших схем валидации. К примеру, при опросе краудворкеров платформы Amazon Mechanical Turks или пользователей конкретной соцсети необходимо учесть культурные смещения в полученных результатах и реплицировать эксперимент в различных контекстах, чтобы обеспечить разнообразие демографических характеристик участников.

Время имеет значение

Вечером в день президентских выборов 1948 года Chicago Tribune опубликовала статью под печально известным заголовком «Дьюи победил Трумэна»,. Газету требовалось отдать в печать до того, как стали известны финальные результаты, а опросы Гэллапа, Ропера и Кроссли единодушно предсказывали убедительную победу Дьюи. В дополнение к проблемам, связанным с методом выборки участников плебисцита, который привел к преобладанию сторонников республиканской партии, агентства слишком рано приостановили работу – некоторые даже в сентябре, за два месяца до выборов, так как исходили из допущения, что желание участвовать в голосовании и выбор кандидата в последние месяцы уже не переменятся.

Но даже результаты опросов способны повлиять на исход процесса, поскольку видимая победа Дьюи могла вселить в его сторонников избыточную уверенность, и они легко проигнорировали выборы, в то время как сторонники Трумэна имели стимул прийти на избирательные участки.

Те, кто оценивает риск заболевания расчетными методами, могут переоценивать риск для целевой группы, беря за основу многолетние данные. И мы должны задать себе вопрос, не могли ли эти данные и причинные взаимосвязи со временем поменяться и применимы ли они по-прежнему в интересующий нас момент.

Устанавливаем ли мы причинную взаимосвязь между физическими явлениями (когда запаздывания при отсутствии механистического знания ослабляют каузальные суждения) или оцениваем политику (когда временные паттерны необходимы как для оценки рисков, так и для определения действенности), нельзя игнорировать временные паттерны событий. Время – центральный аспект нашего восприятия причинности, поскольку мы ожидаем, что следствие проявится вскоре после своей причины. Мы можем ожидать определенного запаздывания, если нам известно что-то о процессе, посредством которого причина производит следствие (например, курение провоцирует рак только по прошествии некоторого времени). Однако идея о первичности причины по отношении к следствию – ключ ко множеству философских теорий, которые мы рассматривали, и в ее поддержку говорят эксперименты из области психологии.

Эксперимент не лучше наблюдения

Вопрос, что лучше – исследования с использованием эксперимента или наблюдения, – представляет собой ложную дихотомию. В реальности мы не в состоянии проводить эксперименты в любом возможном случае (кто захочет войти в контрольную группу исследования, цель которого – узнать, правда ли парашюты предотвращают гибель во время прыжков?) и не всегда нуждаемся в этом (физика и инженерные знания, а также немного симуляций с успехом заменят парашютный ВКЭ). К тому же выборочные эксперименты нередко проводятся недобросовестно, а в некоторых случаях посредством наблюдения можно узнать больше.

Недовольная медленными темпами медицинского исследования, группа пациентов с диагнозом «амиотрофический боковой склероз» разработала собственное исследование, чтобы выяснить, действительно ли экспериментальное лечение замедляет прогрессирование заболевания. В подобного рода исследованиях проблема заключается в организации контрольной группы, поскольку пациенты сильно мотивированы и активно действуют, когда речь идет об их здоровье. Однако это исследование было основано на большом количестве данных, которыми участники и другие пациенты делились на социальном ресурсе PatientsLikeMe. При поддержке врачей экспериментальная группа добавляла литий в прописанное им лекарство и 12 месяцев тщательно отслеживала и документировала состояние своего здоровья.

Поскольку это исследование не было слепым или рандомизированным, оно оказалось несвободным от различных смещений. Чтобы решить эту проблему, каждому пациенту сопоставили не одного, а множество других, которые не принимали литий и у которых наблюдалось аналогичное течение болезни до начала исследования. Сравнив показатели после приема лития, можно было увидеть, наблюдаются ли различия в прогрессировании заболевания. Различий не было, и этот отрицательный результат был подтвержден многочисленными выборочными экспериментами.

В некотором смысле отрицательный результат имеет большую силу, чем результаты ВКЭ, поскольку множество факторов могли исказить результаты в пользу приема лекарства. Пациенты действовали не вслепую, а поскольку свои итоги они фиксировали сами, когнитивные смещения могли способствовать разной оценке значимости состояния. Больные же хотели, чтобы препарат сработал. Во множестве ситуаций продуманное комбинирование данных эксперимента и наблюдения способно снять ограничения, присущие методам. И еще: когда оба подхода дают одинаковые результаты, повышается доверие к каждому.

 

Богатый арсенал

Если все, что у вас есть, это молоток, вы попытаетесь каждую проблему свести к гвоздю.

Цель самого жесткого и подробного обсуждения слабых мест каждого метода не создать впечатление, будто ни один из них не работает, а скорее показать, что ни один метод не будет работать всегда и везде. Вероятностные модели нельзя считать единственным подходом к осмыслению причинности; точно так же контрфактуальность не единственный способ объяснения событий. Кроме того, в различных областях знания эти методы используются самым неожиданным образом. Причинность по Грэнджеру изначально разрабатывалась для финансовых временных рядов, однако применяется в анализе пакетов нейронных импульсов. Байесовские сети создавались для представления вероятностных зависимостей, а используются в моделировании психологических процессов, лежащих в основе причинного осмысления. Ни один метод и ни одна модель не работают всегда; возможно, в поисках решения своей проблемы вам придется выйти за рамки узкоспециальной области.

Если и существует какой-то ответ, то он может быть таким: мы нуждаемся в плюрализме методов. Каждый из них работает в конкретном случае, так что если у вас в наличии лишь один инструмент, которому вы доверяете, рано или поздно вы уткнетесь в его границы. Приложив массу усилий и пролив много пота, вы сможете адаптировать большинство из них к разным сценариям. Правда, это аналогично тому как, скажем, приспособить молоток к переворачиванию блинов на сковороде, прикрепив к нему клейкой лентой металлическую пластинку. Если вам известно о существовании кухонной лопаточки, вы избавитесь от массы разочарований.

В последние годы растет осознание необходимости иметь набор комплементарных методов в противовес поискам панацеи, решающей все проблемы разом. К примеру, Иллари и Руссо (2014) недавно представили подход, который назвали методом причинной мозаики (causal mosaic view). Точно так же, как невозможно понять роль отдельной плитки в мозаичной картине, выбор методик для применения зависит от контекста, то есть от насущной проблемы и заданной цели.

Это вписывается в рамки общей тенденции каузального плюрализма, и ко множеству вещей следует применять такой подход. Можно использовать его для определения причины, свидетельств в ее поддержку и сбора фактического материала.

Когда мы ставим перед собой практические задачи, нас, как правило, мало заботит метафизика каузальности или природа причин, однако следует помнить о различии между ними. Кто-то согласится, что есть множество типов свойств, на основе которых можно отличить причину от корреляции: к примеру, вероятностные, интервенционистские (воздействующие) и механистические подходы позволяют проникнуть в суть причин. Но, даже если вы сочтете вмешательство единственным способом обосновать причинные утверждения, существуют другие пути, которые могут представить аналогичную фактуру (вспомните разнообразные экспериментальные методы из ).

Точно так же есть множество мер причинной значимости для расстановки приоритетов в рамках различных свойств.

Для решения некоторых задач машинного обучения, таких как оптимизация, существует набор теорем под названием «Бесплатных обедов не бывает» (TANSTAAFL). То есть если метод заточен под один тип проблем, с другими он будет работать хуже, и ни один нельзя назвать наилучшим для всех. Это означает, что нереально провести оптимизацию для устранения всех проблем. Нет способа улучшить одно, не заплатив за это чем-то другим. В этом заключается некоторая трудность, поскольку, начав работу с новой проблемой, мы не знаем, какой метод применить.

Но мы не всегда приступаем к работе, не имея в багаже совсем никаких знаний. Если хоть что-то известно о поставленной проблеме и о том, на какой компромисс мы готовы пойти (к примеру, принять больше ложноотрицательных результатов, чтобы сократить количество ложноположительных), то не понадобится «лучший» метод – просто надо знать, как выбрать один из способов решения конкретной задачи.

Например, если я хочу оценить, действительно ли информация о калорийности блюд в ресторанах привела к снижению потребления калорий в отдельном городе, это будет вопрос из области конкретной каузальности, поэтому здесь лучше применить контрфактуальный подход, а не причинность по Грэнджеру. С другой стороны, если у меня есть данные шагомера и подключенных к Сети весов, а также информация о полученных калориях и мне нужно спрогнозировать вес, исходя из своих привычек в еде и отношения к физическим упражнениям, придется задавать другие вопросы и применять иной подход. Здесь хорошим выбором может стать байесовская сеть, так как она лучше прогнозирует вероятные значения переменной, исходя из показателей других объектов сети. Но, если бы я хотела узнать, как быстро после интенсивных занятий поднимется уровень сахара в крови, этот метод вряд ли подойдет. Вместо него стоит выбрать тот, который позволит узнать о временном паттерне этой зависимости на основе имеющихся данных.

Главное – причинность скрывает немало того, о чем нам пока неизвестно, и, адаптируя существующие методы под текущие задачи, мы загоняем себя в узкие рамки, упуская важные открытия.

 

Потребность в знании

С появлением новых и лучших методов выявления причин и прогнозирования будущих событий растет искушение автоматизировать все больше процессов, постепенно устраняя из цепочки человеческий фактор. Люди предвзяты, иррациональны и непредсказуемы, а компьютерные программы неуклонно ведут себя одинаково, каждый раз получая одинаковые вводные. Пока, однако, человеческие знания и суждения необходимы на каждом этапе: мы решаем, какие сведения собирать, подготавливаем их, выбираем метод анализа, интерпретируем результаты и, исходя из этого, определяем, как действовать.

Мы уже видели, как уводит в сторону поиск «черного ящика», который безукоризненно выполняет весь процесс от ввода «сырых» данных до причин на выходе, без ошибок и человеческого вмешательства. Но столь же неверно использовать причины аналогичным способом, исключающим человеческие суждения.

Если компания рекламирует продукт, который вам неинтересен, или сайт рекомендует фильм, который вам не нравится, стоимость ошибок в выборе не слишком велика. Но в массе иных случаев, таких как неправильное осуждение Салли Кларк или некорректное употребление каузальности, это приводит к очень серьезным последствиям. Возможно, мы слишком доверяем причинно-следственным выводам в одном сценарии, а в другом использованный алгоритм слишком зависит от общих знаний и не принимает в расчет специфику конкретной ситуации.

Когда доктор говорит, что у вас высокое давление и с этим нужно что-то делать, вы вряд ли обрадуетесь, если он слепо последует шаблонным инструкциям. Конечно, вы захотите, чтобы он принял в расчет другие лекарства, которые вы принимаете (и которые могут взаимодействовать с препаратами, снижающими давление), ваши предпочтения и задачи относительно терапии. Результат, возможно, не будет наилучшим с точки зрения общих рекомендаций по коррекции гипертензии, однако окажется оптимальным именно для вас. Дело в том, что высокое артериальное давление имеет серьезные последствия для состояния организма, но его снижение не единственная задача, и решать ее нужно в контексте других целей. Возможно, вы принимаете лекарства, которые взаимодействуют с предлагаемыми медикаментами, больше подходят для ежедневного приема, а не других временных интервалов или имеют ограничения, не вписывающиеся в вашу медицинскую страховку.

Поскольку на основании известной зависимости на уровне типа мы не можем сделать вывод, что некая вещь служит токен-причиной, информацию на уровне типа не следует использовать, чтобы принимать решения о токен-случаях.

И после того как мы нашли причины, решая, как их использовать (и использовать ли вообще), необходимо принимать в расчет не только валидность конкретной зависимости.

* * *

Как минимум 20 американских штатов приняли форму вынесения приговоров по уголовным делам на основании доказательств, когда при определении наказания рассчитывается риск рецидива. Во многом аналогично тому, как медицина продвигалась от стандартизированных процессов к целостному и качественному лечению, основанному на фактах, а не интуитивных догадках, новый подход предполагает использование более твердых принципов при определении риска, который собой представляет человек, и сокращение возможных искажений из-за особых полномочий или выводов отдельных судей.

С этими принципами и задачами трудно не согласиться. Однако подобные калькуляторы риска учитывают множество характеристик, помимо криминальных досье отдельных лиц (к примеру, финансовое положение и статус занятости), а также факторы вне контроля личности (например, пол). То есть, если два человека совершают одинаковые преступления, риск рецидива в одном случае будет считаться ниже, если обвиняемый имеет постоянную работу или проживает в районе с низким уровнем правонарушений. Расовый признак напрямую в расчет не принимается, но он коррелирует со многими учитываемыми условиями. Суть не в том, есть ли у человека криминальное прошлое и релевантность этого фактора совершенному преступлению. Скорее, этот подход напоминает использование таблиц смертности страховыми компаниями, которые устанавливают стоимость своих продуктов. На самом деле конкретная продолжительность жизни – величина неизвестная, поэтому с помощью таблиц она рассчитывается для индивидуальных клиентов исходя из показателя для соответствующей группы (например, на основе пола и возраста).

Если оставить в стороне вопрос, действительно ли разные сроки наказания снижают вероятность рецидива преступлений, и если не задумываться о корректности показателей, увязывающих последнее значение и число людей с различными характеристиками, следует ли пользоваться подобной информацией, определяя срок наказания по приговору суда?

Нельзя дать положительный ответ только потому, что некую причину можно использовать для более точного прогнозирования или принятия решений. Методы установления причинно-следственных связей могут только сказать, действительно ли среди каких-то групп больше рецидивистов, но умолчат о том, должно ли справедливое общество использовать подобные групповые свойства, чтобы суровее наказывать отдельных граждан.

Одна из опасностей, подстерегающих тех, кто слишком углубляется в большие объемы данных в поисках корреляций, состоит в незнании механизма действия отдельных вещей. При этом выводы о причинности могут применяться в оправдание несправедливых и дискриминационных практик, сохраняя видимость справедливости и объективности.

Ответственное использование причин означает, что необходимо оценивать не только статистическую и методологическую основательность заключений, но также их этический базис и последствия.

Вместо того чтобы все автоматизировать, лучше комбинировать преимущества вдумчивого человеческого суждения с достоинствами компьютеров, которые способны обрабатывать громадные количества данных. Каждый раз, оказавшись лицом к лицу с причинными зависимостями, мы должны не просто выискивать доказательства в их пользу, а подвергать их допросу, словно следователь с подозреваемым.

Не косвенное ли доказательство (как корреляция), прослеживается ли мотив (механистическое объяснение того, почему причина должна произвести следствие)? Имеются ли смягчающие обстоятельства, например общая причина или некоторое искажение данных?

Если затратность и риск, сопутствующие нашим заключениям, возрастают, так же должна расти и весомость доказательств. И если невозможно с достаточной долей достоверности определить причину, нужно быть готовыми учесть эту неопределенность, когда мы просто не знаем, что за причина имела место. И продолжать поиск.