От чего зависит судьба человека или, если хотите, линия его жизни? Давным-давно Аристотель сказал, что привычка – вторая натура. «Нравственные, или этические, добродетели (добродетели характера) рождаются из привычек-нравов: человек действует, приобретает опыт, и на основе этого формируются черты его характера», – писал он. Значит, привычки и определяют нашу судьбу. Можно изобразить это следующим образом:
Мысли → Действия → Привычки → Характер → Судьба
Ваш привычный образ мыслей предопределяет ваши действия. Ваши действия вырабатывают привычки. Другие оценивают вас исходя из того, как вы имеете обыкновение поступать. Наконец, мнение окружающих о вас определенным образом влияет на вашу судьбу. Процесс, в результате которого вы можете стать квалифицированным количественным аналитиком, включает примерно такие же этапы (рис. 6.1).
Рис. 6.1. Как стать квалифицированным количественным аналитиком
Привычка подходить к решению проблем с количественно-аналитической точки зрения формирует ваши навыки. Если вы постоянно работаете с числами, то со временем станете квалифицированным количественным аналитиком. Знания в области количественного анализа постоянно расширяются, поскольку используются в процессе реализации навыков и подходов к нему. Далее мы поговорим о том, какие навыки и подходы к количественному анализу надо освоить, чтобы стать квалифицированным специалистом в этой области, а также о том, какие знания и умения необходимы на каждом из этапов.
Количественный подход
В то время как знание методов количественного анализа, безусловно, полезно при принятии аналитических решений, не менее важно выработать в себе количественный подход к решению проблем, то есть стремление оперировать количественными показателями и находить надежные аргументы в поддержку той или иной гипотезы. Если ваш мозг не выключается при виде цифр или уравнения, то вы сами удивитесь, сколько процедур количественного анализа можно освоить.
Не бойтесь цифр
Мы давно подозревали, что аллергия на цифры поражает многих компетентных и разумных людей. Бывает, что они испытывают непреодолимое отвращение к математике. Это не только печально, но и контрпродуктивно. Тем не менее математика – это не главное для количественного образа мыслей. Хорошего количественного аналитика отличают не столько познания в области чистой математики, сколько подход к классификации количественной информации. Количественно мыслящие люди обладают определенными навыками, способностями и привычками, которые помогают им принимать решения, основываясь на ней. Некоторые специалисты даже утверждают, что полученных в средней школе математических знаний вполне достаточно, чтобы научиться мыслить количественно: «Математические знания и количественное мышление – это разные вещи… Очень важно это понимать, поскольку для того, чтобы стать квалифицированным количественным аналитиком, требуется не так уж много знаний по математике, выходящих за пределы программы средней школы».
Если не верите, вот пример Эмили Роуз. Она в девять лет уже провела эксперимент в духе «сумасшедшего ученого», анализируя концепцию бесконтактного массажа. Ее работа оказалась достаточно сложной и актуальной, чтобы получить право на публикацию в профессиональном журнале Journal of the American Medical Association. Выходящий постоянно с 1883 года, JAMA имеет один из самых крупных тиражей и принадлежит к числу наиболее престижных медицинских журналов в мире. Как научная работа четвероклассницы могла попасть в такой журнал? Эмили видела, как ее мать Линда смотрит видеофильм о набирающем популярность виде медицинских услуг – бесконтактном массаже (БМ). Это неоднозначный способ лечения недомоганий путем управления «энергетическими полями» пациента. Поборники БМ утверждают, что уже более 100 тысяч человек во всем мире овладели его техникой. БМ преподается более чем в ста колледжах и университетах, расположенных в 75 странах. Говорят, что эта процедура получила наибольшее признание среди процедур, практикуемых сторонниками холистической медицины. Во время сеанса врач делает пассы руками в нескольких сантиметрах от тела пациента, чтобы выявить и устранить в его организме «застой энергии», способный послужить причиной различных заболеваний. Эмили предложила своей маме провести эксперимент. Линда, медсестра по профессии, дала дочери полезные советы по его методике. Проведя некоторые изыскания, Линда и Эмили поняли, что еще никто не пытался установить, действительно ли специалист по бесконтактному массажу способен обнаруживать «энергетические поля» человека.
Эмили сосредоточила свои усилия на поиске ответа на этот вопрос. Если практикующие бесконтактный массаж действительно способны делать то, что обещают, то они должны хотя бы чувствовать «энергетическое поле» пациента. Если они на это не способны, тогда медицинская ценность этого способа лечения по меньшей мере сомнительна. Таким образом, если процент правильно выявленных бесконтактным массажистом «энергетических полей» окажется существенно выше уровня, объясняемого случайностью, то заявления о преимуществах этого вида лечения имеют под собой основание.
Изучив газетные объявления и другие источники информации, Эмили обнаружила 25 физиотерапевтов, практикующих бесконтактный массаж в северо-западном Колорадо; двадцать один из них согласился участвовать в эксперименте. Потенциальных участников предупредили, что исследование будет представлено на ярмарке научных проектов школьников. Во время тестирования физиотерапевт располагал руки ладонями вверх на плоской поверхности, примерно в 25–30 сантиметрах друг от друга. Чтобы тестируемый не видел своих рук, перед его лицом размещался овальный непрозрачный экран с вырезами у основания; к экрану крепилось полотенце, покрывавшее его руки. Эмили подбрасывала монетку, чтобы определить, какая рука будет целевой (этот метод известен как рандомизированное распределение по группам в количественном эксперименте). Затем она протягивала правую руку ладонью вниз в восьми-десяти сантиметрах над целью и говорила «Готово!». После этого физиотерапевт говорил, какая его рука находится ближе к руке Эмили. Этот тест повторялся 280 раз при участии 21 физиотерапевта.
Хотя все участники утверждали, что они способны почувствовать руку пациента, лишь в 122 случаях (44 процента) из 280 они правильно ответили на поставленный вопрос. Это даже хуже, чем если бы они отвечали на вопрос просто наугад (см. ), ведь в таком случае процент угаданных правильно ответов составил бы около 50. Эмили сделала вывод, что физиотерапевты не смогли подтвердить наиболее важный навык БМ, что говорит о беспочвенности их заявлений. Дальнейшее использование БМ в медицинских целях, таким образом, неоправданно. В апреле 1998 года одиннадцатилетняя Эмили (учась в шестом классе) опубликовала результаты эксперимента в JAMA. Редактор журнала Джордж Лундберг сказал, что эксперты по статистике были восхищены простотой эксперимента и очевидностью его результатов. Эмили была занесена в Книгу рекордов Гиннесса как самый молодой автор исследования, опубликованного в ведущем научном журнале.
Эмили отнюдь не гений и не вундеркинд; просто она обладает здравым смыслом и ясным количественным мышлением. Наиболее ценный навык квалифицированного количественного аналитика – это умение извлекать информацию из баз данных, что зависит совсем не от математической подготовки, а от количественного мышления. Первый шаг в этом направлении состоит в том, чтобы преодолеть страх перед числами и чувствовать себя комфортно в цифровой среде. Вы можете быть уверенными, что необходимые познания в математике у вас наверняка есть или, в крайнем случае, их можно легко получить. Главная черта квалифицированного количественного аналитика – это умение обращаться с данными и не испытывать перед ними страха.
Даже если вы не демонстрировали особых математических успехов в школе, это никогда не поздно исправить. Кто сказал, что вы до конца жизни обречены плохо разбираться в числах? Если в школе вам не давалась математика, это не значит, что вы не можете ликвидировать этот пробел в дальнейшей карьере. Например, Ди-Джи Патил, придумавший термин «ученый по данным», чтобы описать свою роль в управлении аналитическими исследованиями в интернет-компании LinkedIn, в школьные годы немало пострадал от математики: «Впервые я завалил экзамен по математике в восьмом классе. То же самое периодически случалось в старших классах, поэтому пришлось подать заявку на повторный курс. Но и его я завалил, в результате чего с трудом получил аттестат о среднем образовании. Сразу в университетский колледж с такими баллами поступать было нельзя, поэтому пришлось пойти в местный колледж низшей ступени… Там я записался на курс по математике, благодаря чему смог перейти в университетский колледж. Там стало ясно, что я не понимаю ничего из того, что говорят преподаватели. Я учился в слишком слабом с точки зрения математической подготовки классе. Было очень стыдно, поэтому я пошел в библиотеку».
Патил взял в библиотеке несколько книг и за одни выходные самостоятельно изучил школьный курс математики. В итоге он добился неплохих успехов и был принят в колледж университета в Сан-Диего, где окончил университетский курс математики за три года. Потом он получал степень PhD по прикладной математике в Мэрилендском университете.
Вначале он столкнулся с некоторыми трудностями. «Я получил образование в США, а конкурировать приходилось с русскими, израильтянами и корейцами. На первом экзамене я катастрофически провалился, получив, кажется, второй балл с конца списка. Самый низкий балл был у студента, не явившегося на экзамен». Зато на второй попытке наш герой набрал самые высокие баллы. Окончив докторантуру, Патил начал преподавать в Мэрилендском университете, одновременно занимаясь исследованиями по моделированию погоды. Ему пришлось поработать и на правительственные разведывательные организации. Финансирование в то время было ограниченным, и он уволился, перейдя работать в Skype, а затем в eBay. Потом он стал ведущим аналитиком в LinkedIn, где люди, занимающие эту должность, имеют огромное влияние на процесс разработки продуктов.
Сейчас Патил – «исследователь данных, проживающий по месту службы» (наверно, первый человек, чья должность носит такое название) в венчурной фирме Greylock Partners; он помогает клиентам компании решать проблемы с данными и аналитикой. Возможно, он представляет собой лучший пример человека со скрытыми математическими способностями.
Используйте поиск в интернете для обнаружения неизвестных концепций и понятий, связанных с вашими данными
В эру глобализации экономические и деловые термины мелькают в новостях каждый день. То же можно сказать о повседневных разговорах. Поскольку многие незнакомы с общеупотребительными понятиями и характеристиками, они просто пропускают их мимо ушей. Но если вы собираетесь стать количественным аналитиком, то вам придется запоминать их, записывать, а впоследствии пытаться при помощи Google найти их значение. Большой объем информации такого рода есть в Википедии; существуют онлайновые курсы и электронные учебники по многим предметам. Распечатайте результаты поиска и систематизируйте их в отдельный файл для последующего изучения. Это хороший способ учиться и с течением времени преодолеть страх перед числами. Вероятно, вы не поймете всего, что прочитаете, но тем не менее чему-то научитесь. Если проявлять упорство в течение хотя бы шести месяцев, то вы немало удивитесь, когда узнаете, что ваши коллеги считают вас весьма информированным человеком, особенно в том, что касается чисел.
Проявляйте любопытство
Если вам действительно интересны числа, то со временем вы будете понимать их все лучше и лучше. Например, когда вы слышите, что Усейн Болт самый быстрый человек в мире, у вас возникает вопрос, каково его лучшее время. Несложно выяснить, что на стометровке оно составляет 9,58 секунды. Теперь задайте себе вопрос, чему равна его скорость в пересчете на километры (или мили) в час. Проведя несложные расчеты, вы обнаружите:
9,58 секунды ≈ 10 секунд = 1/6 минуты = 1/360 часа.
100 м = 0,1 км.
Таким образом,
Теперь у вас возникает вопрос, чему равен мировой рекорд в марафоне: 2 часа 3 минуты 59 секунд. Простой расчет показывает, что для этого марафонец должен бежать со скоростью около 20,4 километра в час (12,7 мили в час). Сравнив эти две средние скорости, вы поймете, как быстро может бежать человек на самой короткой и самой длинной олимпийской дистанции. Любопытство во всем, что касается чисел, – вот отличительная черта хорошего количественного аналитика.
Количественный подход ↔ Количественные знания
Чтобы расширить свои познания в количественном анализе, на следующем этапе полезно ознакомиться с начальным курсом статистики для широкого круга читателей. Одна из наиболее популярных книг такого рода – уже упоминавшаяся нами «Как обмануть с помощью статистики» (How to Lie with Statistics) Даррела Хаффа. Это наиболее продаваемая книга по статистике во второй половине XX века. Она представляет собой краткое, увлекательное, иллюстрированное изложение наиболее часто встречающихся ошибок, как намеренных, так и непреднамеренных, имеющих отношение к статистике и способных привести к неверным выводам. Это действительно прекрасная книга, рассказывающая о том, как можно лгать языком статистики и как проверить достоверность статистических данных. Можно порекомендовать также опубликованную в 1974 году книгу Стивена Кемпбелла «Недостатки и заблуждения в статистическом мышлении» (Flaws and Fallacies in Statistical Thinking). С учетом даты выхода это удивительно полезная книга для всех, кто читает газеты и обращает внимание на содержащиеся в них статистические данные. Гораздо более новая книга на ту же тему – «Распространенные ошибки в статистике и как их избежать» (Common Errors in Statistics and How to Avoid Them) Филипа Гуда и Джеймса Хардина. Таких книг множество, почитайте рецензии и купите лучшие.
Мыслить вероятностно
Ключевой аспект количественного мышления – это понимание законов вероятности и случайности. Отсутствие такого понимания – наиболее серьезный недостаток мышления взрослого человека, который, к сожалению, отмечается у большинства. Нассим Николас Талеб считает, что большинство из нас «одурачены случайностью» (такое же название носит его книга), ведь мы придаем огромное значение вещам, которые вполне могут оказаться случайностью. Например, это может быть совпадение дней рождения у кого-то из гостей на вечеринке. Допустим, что на вечеринке присутствуют 23 гостя, и вдруг двое из них обнаруживают, что родились в один день. Они могут задаться вопросом о том, насколько вероятно такое событие. Оказывается, вероятность достаточно велика: более 50 процентов (см. ).
Понимание законов вероятности весьма полезно не только на вечеринке, но и во множестве других случаев. Если вы их не знаете, то не сможете понять, что фондовый рынок не что иное, как прогулка среди случайностей (колебания цен на акции не подчиняются каким-либо закономерностям), и некоторые лидеры по темпам роста в течение нескольких лет подряд могут показывать гораздо лучшие результаты, чем средние компании, но рано или поздно произойдет обвал их показателей. Вам не обязательно понимать феномен возврата к норме: например, если ваш доход намного превышает средний уровень, то доход вашего ребенка, скорее всего, будет ниже, чем ваш. Возможно, то, что вы не знакомы с теорией вероятности, обойдется вам в кругленькую сумму, если вы частый гость в казино Лас-Вегаса. Вам также будет трудно получить работу в страховом бизнесе или решить, стоит ли покупать аннуитет. И конечно, вся статистика основана на вероятности. Короче говоря, теорию вероятности следует понимать не только для того, чтобы стать количественным аналитиком, но и для того, чтобы добиться успеха в жизни.
Конечно, существует много источников информации по теории вероятности. В учебниках обычно она рассматривается вместе с основами статистики, поскольку там требуется умение мыслить вероятностно. Если вы хотите сконцентрироваться именно на теории вероятности, а не на статистике в целом, то лучше выбрать книгу Ричарда Исаака «Удовольствия от вероятностей» (The Pleasures of Probability). Если вы терпеть не можете учебники, то забавное и хорошо написанное введение в статистику для широкой публики содержится в книге The Drunkard’s Walk: How Randomness Rules Our Lives Леонарда Млодинова.
Снова в школу
Если вам трудно разбираться с аналитикой, теорией вероятности и количественным мышлением самостоятельно, то совсем не обязательно это делать. Существует много возможностей дистанционно и очно изучить их. Университеты все чаще размещают учебные материалы в открытом доступе, в том числе и разнообразные курсы по статистике. Например, если вы хотите поучиться в университете, который известен высоким уровнем преподавания и исследовательской работы в области количественного анализа, то зайдите на страничку курса по статистике и теории вероятности на сайте Массачусетского технологического института. Если речь идет о платном дистанционном образовании, то можно приобрести у издательства Harvard Business Publishing курс-самоучитель по количественным методам, разработанный Яном Хаммондом, коллегой Тома Дэвенпорта по Гарвардской школе бизнеса (это стоит чуть больше сотни долларов). Если вы планируете потратить более крупную сумму, можно записаться на дистанционное обучение на степень магистра по предсказательной аналитике в Северо-Западном университете.
Если вы предпочитаете общаться с профессорами лицом к лицу, иметь возможность обсудить с ними проблемы и извлекать пользу из повседневного общения с однокурсниками, то для вас в американских университетах есть все растущее число программ на степень по аналитике, обычно магистерскую. Их прародительница – основанная пять лет назад магистерская программа по аналитике в Университете Северной Каролины, одна из лучших в этой области. Почему именно Северная Каролина? Основатель и генеральный директор компании по разработке аналитического программного обеспечения SAS Джим Гуднайт учился именно в этом университете и любезно пожертвовал деньги, чтобы основать эту программу.
Магистерская программа по аналитике – это программа подготовки профессионалов с глубоким пониманием инструментов, методов, приложений и практического применения. Принципы ее организации, по нашему мнению, в полной мере соответствуют задачам и потребности компаний и бизнеса в целом в количественно ориентированных специалистах.
• Короткая по времени. Десять месяцев интенсивного обучения, разбитых на три семестра (лето, осень и весна). Зачисление производится в июле, выпуск в мае следующего года. Заочной и вечерней формы обучения нет.
• Напряженный график обучения. Обучение в течение полного дня (понедельник – пятница с 9:00 до 17:00) в кампусе. Комплексный учебный план для группы студентов; предусмотрена работа в группах; во внеаудиторное время планируется работа над проектами.
• Широкое и рассчитанное на практическое применение содержание курсов. Комплексный, мультидисциплинарный учебный план (разработанный на основе опыта кафедр и колледжей Северной Каролины) направлен на обучение практическим навыкам, пригодным для решения актуальных проблем в статистике, прикладной математике, компьютерных науках, исследовании операций, финансах и экономике, маркетинге.
• Обучение на собственном опыте. Использование практикумов вместо стандартных форм обучения (студенты работают в группах по пять человек, решая реальные проблемы на основе заданий и данных, предоставленных промышленными спонсорами; напряженная работа в течение семи месяцев завершается отчетом перед спонсором).
Магистерская программа по аналитике Университета Северной Каролины основана на инновационном учебном плане, состоящем из специально разработанных для нее курсов. Они посвящены интеллектуальному поиску данных и анализу текстов, прогнозированию, оптимизационным задачам, базам данных, визуализации данных, безопасности баз данных, финансовой и потребительской аналитике. Студенты приходят в программу с разным базовым образованием и опытом, хотя предпочтительна определенная ориентация на количественные исследования. Средний возраст студентов 27 лет, примерно 26 процентов уже имеют университетское образование. Примерно половина студентов до поступления на программу работала на полную ставку. Несмотря на сложную ситуацию и медленный рост в национальной экономике, выпускники программы 2011 года поставили рекорд по количеству интервью с работодателями – 469 (то есть на каждого выпускника пришлось по 12 интервью; в 2012–2013 годы численность студентов возросла до 80 человек). Все выпускники обеспечены заявками работодателей на пять лет вперед. Учитывая, что спрос работодателей на этих выпускников постоянно растет, вполне понятно, что аналогичные программы открываются и в других университетах. Одно из недавних исследований выяснило, что 59 университетов предлагают программы по деловой аналитике или бизнес-разведке, в том числе 37 магистерских и 22 бакалаврские программы. Школы также начинают предлагать курсы по изучению данных, а в скором времени надо ожидать и программ с выдачей диплома.
Количественные навыки
Количественный подход важен, но не менее важны и количественные навыки. Говорят, что легче привести свои действия в соответствие с новым способом мышления, чем придумать новый образ действий. Если постоянно тренировать количественные навыки, то через некоторое время окажется, что у вас выработался количественный подход.
Требуйте чисел
Хорошие количественные аналитики (а также организации, стремящиеся воспитать их в своем коллективе) всегда должны требовать количественную информацию, когда им представляют идеи, теории и случайные наблюдения. Приучитесь задавать вопрос: «Есть ли у вас данные в поддержку этой гипотезы?» Ну а если вы действительно круты, то периодически вставляйте фразу «Множество слухов – это еще не данные». Требование данных играет большую роль, поскольку позволяет ответить на вопросы: «Как человек мыслит?», «Какие инструменты и процессы помогли обеспечить это направление действий?» В дополнение к глобальным задачам спасения мира попытайтесь бороться с желанием перескакивать сразу к выводам, не требуя представления данных.
То же справедливо при презентации ваших идей. Если никаких данных нет, проведите хотя бы небольшой эксперимент в стиле «сумасшедшего ученого» и соберите их. Постоянно стремитесь собрать как можно больше данных до того, как начнете развивать свои теории. Это поможет поставить их на надежную основу количественного анализа и одновременно увеличит шансы убедить слушателей в правильности ваших идей. Навык опираться на цифры и подтверждать ими свои идеи абсолютно необходим любому, кто хочет стать квалифицированным количественным аналитиком.
Никогда не доверяйте числам
Только что мы писали о том, что аналитик всегда стремится собрать числа и прочие данные в поддержку своих теорий и взглядов на мир. Но сейчас мы хотели бы поговорить о необходимости разумно-скептического подхода к ним. Как и в случае с новым знакомым, не доверяйте данным до тех пор, пока не узнаете о них больше. Никогда не принимайте за чистую монету никакие числа, которые вам представили. Существует несколько причин, по которым данные не заслуживают доверия. Люди (а особенно политики) иногда лгут и мошенничают, прикрываясь цифрами, или в крайнем случае неправильно интерпретируют их, стремясь добиться своих скрытых целей. Шотландский поэт и критик Эндрю Ланг писал: «Он использует статистику, как пьяница использует столб – больше в качестве опоры, а не источника света». Числа могут быть неправильно отобранными, и в таком случае они не отражают состава генеральной совокупности. Критичное отношение к данным оправданно, особенно если они нетипичны и вызывают удивление. Лучший способ получить надежные данные – относиться к ним критично и стараться узнать как можно больше об их происхождении. В частности, скептицизм относительно данных должен включать следующие аспекты.
Релевантность. Представленные данные должны иметь непосредственное отношение к проблеме, для решения которой они собирались. Они должны быть репрезентативными по отношению к той группе или организации, которую они предположительно представляют. Если данные не дают хотя бы некоторых ответов на вопросы, они бесполезны.
Точность. Если данные релевантные, но неточные, их необходимо отбросить. Точность данных можно оценить, изучив вопрос о том, кто и как их готовил. Если данные не проходят эту проверку на точность, они опять-таки бесполезны.
Правильная интерпретация данных. Даже точные данные могут ввести в заблуждение, если их неправильно истолковать. Особенно склонны неверно интерпретировать данные те люди, у которых есть скрытые мотивы и цели. Рассмотрим пример, в котором интерпретация данных способствовала формированию субъективного мнения.
Критик из журнала Newsweek, писавший рецензию на книгу «Лучшая половина» (The Better Half) о первых суфражистках, завершил свой опус несколько провокационно. Он задал риторический вопрос, что сказали бы Сьюзан Энтони и ее подруги, если бы узнали о том, что пятьдесят лет спустя после предоставления американским женщинам политических прав социологи Колумбийского университета обнаружили: лишь одна из двадцати двух женщин голосовала не за того кандидата, за которого голосовал ее муж.
Один из читателей в ответ на это написал: «Я думаю, что суфражистки были бы весьма довольны. Их движение проделало большую работу, если менее чем через пятьдесят лет после предоставления женщинам политических прав только один муж из двадцати двух имел мужество голосовать не так, как его жена» [100] .
Таким образом, всегда стоит задавать себе вопрос, насколько правильна интерпретация данных с учетом проблем и мотивов того лица, которое ее представило.
Особенная осторожность с причинно-следственным аргументами
Стоит с особой осторожностью относиться к аргументации, основанной на причинно-следственных связях: их выявить очень сложно. Как мы уже упоминали во вставке об экспериментах «сумасшедшего ученого», если вы формируете контрольную и целевую группу, случайным образом распределяя в них людей, и эти группы демонстрируют различные результаты, то обычно аналитик приписывает это воздействию тестируемого фактора. Но если вы просто выявили статистическую связь между двумя факторами, вряд ли она окажется причинно-следственной. Возможно, вы слышали фразу «корреляция – еще не причина». Это важно помнить.
Когнитивные психологи Кристофер Чабрис и Даниэль Симонс предложили эффективную процедуру для выявления причинно-следственной связи в книге «Невидимая горилла и другие способы нашей интуиции обмануть нас» (The Invisible Gorilla and Other Ways Our Intuitions Deceive Us): «Когда вы слышите или читаете о наличии связи между двумя факторами, задумайтесь, можно ли говорить о том, что в тестовую группу для их проверки люди отбирались действительно случайно. Если это невозможно, слишком дорого или этически неприемлемо, то проводить эксперимент нельзя и причинно-следственная связь считается неподтвержденной».
Например, вы прочитали в газете: «В ходе десятилетнего эксперимента доказано, что запойное пьянство приводит к раку». Задумайтесь над тем, возможно ли в данном случае случайное распределение участников на тестовую и контрольную группы с последующей просьбой к одним запойно пить, а к другим – соблюдать трезвость в течение десяти лет. Наверно, нет. Куда более вероятно, что исследователь обнаружил корреляционную зависимость между запойным пьянством (по всей видимости, по собственным словам опрашиваемого) и случаями рака в группе населения, которую мониторили в течение десяти лет. Возможно, исследователь учитывал, что выявленная корреляция может объясняться и другими факторами (например, сильно пьющие люди часто курят), но уж репортер точно об этом не задумывался.
Если вы заподозрили, что кто-то в вашей организации является сторонником софизма cum hoc ergo propter hoc (после этого – значит по причине этого), то для предотвращения неправильных выводов следует тщательно следить за разработкой условий экспериментов, хорошо знать статистику и эконометрику. Именно в этом случае лучше пригласить эксперта.
Задавайте вопросы
Задавать вопросы стоит для того, чтобы лучше понять суть проблемы и оценить методику ее решения. Аналогично, если у вас возникли сомнения по поводу представленных данных, следует без колебаний задавать вопросы. Многие стесняются задавать вопросы по поводу чисел, поскольку боятся показаться глупыми. Эти страхи преувеличены. Некоторые идеи по поводу того, какие вопросы лучше задавать, приведены во вставке «Хорошие вопросы о количественном анализе».
Хорошие вопросы о количественном анализе
Перечень приведенных далее вопросов, конечно, не исчерпывающий, но может помочь вам с чего-то начать. Они пригодны практически для любых видов количественного анализа или такого неколичественного, который должен стать количественным.
• Есть ли у вас данные в поддержку вашей гипотезы?
• Что вы можете сказать об источнике данных, использованных в анализе?
• Вы уверены, что выборка репрезентативна для генеральной совокупности?
• Присутствуют ли какие-либо выбросы в распределении данных? Как они влияют на конечный результат?
• Какие предположения вы положили в основу своего анализа?
• Есть ли какие-либо обстоятельства, способные повлиять на достоверность предположений и модели анализа?
• Почему вы выбрали этот подход к анализу?
• Какие преобразования данных вы провели, чтобы добиться соответствия между ними и моделью?
• Рассматривали ли вы какие-либо иные подходы к анализу данных, и если да, то почему от них отказались?
• Насколько вероятно, по вашему мнению, что независимые переменные действительно обусловливают динамику зависимых переменных? Можно ли провести еще какие-либо аналитические процедуры для подтверждения причинно-следственной связи?
Представьте, что кто-то задает вопросы по поводу представленных данных. Такой человек скорее будет выглядеть смелым и заслужит уважение, чем покажется глупым. Поэтому, если вам встретились непонятные числа, отважно задавайте вопросы. Более того, в некоторых случаях вопросы ожидаемы. Например, если вам показывают средние значения, спросите о дисперсии, или распределении, или стандартном отклонении. Вы можете также спросить, присутствуют ли в данных какие-либо выбросы, являющиеся результатом ошибок или экстраординарных событий, а также не пропущены ли данные, которые могут оказаться значимыми. Вы можете спросить, чему равна медиана, если представлены средние значения. Интерпретировать среднее значение, не имея данных о его дисперсии, опасно, поскольку результаты отдельных наблюдений могут существенно отличаться друг от друга. Кроме того, если кто-то говорит о данных из конкретного обследования, следует спросить, кто проводил это обследование, какова его методика и как были сформулированы вопросы. Говорить о результатах обследования, не зная ответы на эти вопросы, нельзя. Коротко говоря, имеет смысл приобрести привычку задавать вопросы и исследовать данные: это очень важно для выработки навыков количественного анализа.
Практика количественного анализа
Подобно молодому человеку, спрашивавшему, как найти Карнеги-Холл в Нью-Йорке, если вы хотите выработать навыки, искусство и дисциплину хорошего аналитика, вам следует практиковаться, практиковаться и еще раз практиковаться. Возможно, достигнуть прогресса удастся не сразу. Но трудности неизбежны в любом обучении, и только преодолевая их, вы сможете усовершенствовать свои навыки количественного аналитика – медленно, но неуклонно. Работу эту можно представить в виде тех же шести шагов решения любой проблемы, о которых мы говорили на протяжении всей книги.
Определение и формулирование проблемы. Вероятно, у вас на работе немало проблем. Определите их приоритет исходя из срочности и применимости методов количественного анализа для их решения. На этапе определения проблемы самое важное понять, в чем суть проблемы и почему необходимо ее решить. Ответы на эти два вопроса не только дают представление о преимуществах решения проблемы, но и помогают спланировать следующие этапы.
Обзор предшествующих исследований. Если проблема определена, то следует изучить все имевшие место попытки ее решить. Хотя, как правило, этот этап требует довольно много времени, но поисковики вроде Google обычно весьма полезны. Поиск относящейся к проблеме информации очень важен для правильной оценки ее масштаба и для подбора определяющих переменных. Если вы глубоко разобрались в наработках предшественников, то получите более ясную картину того, как можно проблему решить. Это можно сформулировать так: «Проблема сформулирована правильно, предыдущие попытки изучены, значит, полдела сделано».
Моделирование (выбор переменных). Если очертить круг определяющих переменных удалось еще на этапе изучения предыдущих поисков, то на этом этапе остается отбросить те переменные, которые не связаны непосредственно с поиском ответа на поставленный вопрос. То, какие переменные отбросить, а какие оставить, зависит главным образом от целей построения модели. Если вы хотите собрать игрушечный поезд, то размеры и пропорции поезда реального имеют большое значение. Если же вы хотите оценить экономическую эффективность поезда, то на первый план выдвигаются такие параметры, как скорость, грузоподъемность, потребление топлива. Практикуясь в сосредоточении внимания на отдельных особенностях реального объекта (как это делает карикатурист), вы постепенно нащупываете решение, а ваши количественные навыки совершенствуются.
Сбор данных (измерение). Прежде чем собирать данные по отобранным переменным, надо проверить: а не делал ли этого кто-либо ранее? Очень часто оказывается, что в соседнем департаменте, а иногда и в вашем собственном такие данные уже собирались. Не исключено, что их можно найти в открытом доступе. Даже если придется их купить, это иногда обходится дешевле, чем собирать самому. Если данных, непосредственно относящихся к вашей проблеме, нет, то следует определиться с методологией их сбора. Если вы решили провести опрос, то содержание анкеты и даже формулировку отдельных вопросов необходимо тщательно изучить. Если решено провести эксперимент, то лучше пригласить специалиста для консультаций по методике его проведения. Получение точных и актуальных данных для анализа имеет огромное значение для конечного результата, поэтому на данном этапе не стоит жалеть времени и усилий.
Анализ данных. Анализ данных заключается в поиске устойчивой модели взаимосвязей между ними или между переменными. Статистические методы для анализа подбирают на этапе определения проблемы: после того как будет определена суть проблемы, выбор наиболее подходящего метода анализа становится очевидным. Если для решения проблемы необходимо провести сравнение между группами данных или показателей, то потребуется соответствующая процедура. Если проблема во взаимной связи переменных, то логично выбрать процедуру регрессионного анализа или ей подобную. Поскольку все эти аналитические процедуры широко используются в самых разных ситуациях, имеет смысл потратить время на овладение их теоретическими и практическими аспектами. Наверняка в вашей организации найдется специалист, способный помочь вам советом в этом деле.
Результаты и необходимые меры. Не пренебрегайте этим важным этапом количественного анализа. Успешные аналитические команды уделяют ему столько же времени и внимания, сколько предыдущим пяти. Попросите коллег в компании поделиться опытом демонстрации результатов анализа, обсудите с ними ваши идеи и проблемы. Освойте язык визуализации статистических исследований, например найдите постоянное место на рабочем столе книгам Эдварда Тафти. А если сам Тафти приедет в ваш город с однодневным семинаром «Представление данных и информации», не упустите случай пойти.
Количественные навыки ↔ Количественные знания и методы
На этом этапе следует ознакомиться с теоретическими основами количественного анализа. В первую очередь стоит обратить внимание на такие курсы, как «Элементарная статистика» и «Методы исследования». Если вы сможете записаться на них дистанционно, это будет прекрасно. Можно поэтапно осваивать их в интернете или с использованием обычных учебников каждый раз, когда появится требующая решения практическая задача. Многие испытывают трудности, осваивая понятия элементарной статистики, поскольку в некоторых учебниках ничего не пишут об их применении в реальном мире. Поэтому следует очень тщательно подходить к выбору учебника, содержащего информацию о прикладных аспектах применения статистических методов в тех или иных реальных ситуациях. Одной теории тут мало. В качестве основного мы рекомендуем учебник Хайнца Кохлера Statistics for Business and Economics. Один из рецензентов так отозвался о нем на Amazon.com:
Лучший учебник по статистике всех времен и народов!
Грядущий экзамен по статистике пугал меня до смерти. Было такое чувство, что освоить все эти понятия и выводы будет невероятно трудно. Но компоновка материала и структура этой книги настолько удобны для изучения… Статистика никогда больше не будет проблемой для меня. Изумительно, как Кохлеру удалось превратить статистику в легкий и очень интересный предмет [103] .
То же самое можно сказать и о методах исследования: по ним написано множество учебников и рецензий. Самое важное в изучении этих базовых курсов – постараться решить приведенные в учебнике примеры. Поскольку большинство задач предназначено для иллюстрации связи теории с практикой, теоретические концепции, закрепленные решением примеров, усваиваются намного прочнее. Если вы прочитаете каждый из выбранных учебников не менее трех раз, то можете считать, что необходимый минимум знаний количественного аналитика вы почти освоили. Теперь остается только практиковаться (практиковаться и еще раз практиковаться).
Количественный аналитик
В бизнесе процедуры количественного анализа осуществляются непрерывно и в социальном контексте. Обычно они охватывают не только саму процедуру анализа, но и подготовку отчета (или проведение презентации), совместную работу в сообществе аналитиков, обмен опытом на семинарах и других подобных мероприятиях, работу с экспертами. Все эти виды деятельности крайне важны для развития аналитических навыков.
Подготовьте отчет
Первый шаг в деле реализации результатов анализа – это подготовка отчета, который расскажет «историю данных». Вы многому научились, читая учебники, но гораздо большему можно научиться, упорно стараясь решить реальную проблему, а затем готовя отчет о результатах. Если вы занялись проблемой, которую многие уже пытались безуспешно решить, то это произведет впечатление; но если это не так, нет причин сожалеть. Уделите пристальное внимание выбору подходящей проблемы, поскольку, как говорил Вольтер, люди оценивают вас по вашим вопросам, а не по ответам. Затем педантично соблюдайте последовательность шести шагов количественного анализа и представьте результаты и предложения в форме отчета. Его подготовка преследует три основные цели:
• вы научитесь чему-то новому и усовершенствуете аналитические навыки, самостоятельно решая реальную проблему;
• вы можете внести серьезный вклад в решение проблемы;
• вы поможете создать атмосферу уважения к аналитике, побудить других мыслить и действовать аналитически.
Не ждите слишком многого от первой же попытки, но убедитесь в том, что в отчете отражены результаты предшествующих исследований, ваши собственные усилия по решению проблемы и доказательства аналитической строгости результатов. Помните о том, что слушатели будут в первую очередь оценивать способ, при помощи которого вы решали проблему, а не только ваши выводы и заключения.
Создайте благоприятную аналитическую среду
Найдите товарища или нескольких коллег и создайте группу количественного анализа. Существует множество причин для создания такой группы: вместе изучать теорию анализа эффективнее, равно как и выполнять аналитические проекты. Группа может более успешно продвигать идеи количественного анализа. В кругу единомышленников можно обсудить приоритет тех или иных аналитических задач, обсуждать проблемы, распределять задания в соответствии с шестишаговой схемой анализа, объяснять суть операций, по очереди проводить презентации. Такие группы – самый надежный и быстрый способ освоить количественный анализ. Как сказал Генри Форд, «собраться вместе – это начало, остаться вместе – это прогресс, работать вместе – это успех». Действительно, небольшая группа людей, обладающих аналитическим мышлением, способна изменить компанию, создав аналитическую атмосферу и мотивируя других думать и действовать аналитически.
Регулярно проводите занятия
Цель таких занятий очевидна: дать возможность представить результаты анализа членам группы, обсудить ход выполнения аналитических проектов и особенности проектов, планируемых к выполнению. Кроме того, занятия помогают поддерживать и развивать атмосферу, способствующую аналитическим изысканиям и принятию решений (на их основе). Многие компании приглашают лекторов со стороны для освещения специальных аналитических проблем. Регулярно проводимый тематический семинар полезен для всех участников с точки зрения получения новой информации, поддержания интереса к аналитическим пробелам, получения дополнительной мотивации к совершенствованию аналитических навыков. Постарайтесь сделать эти семинары доступными для всех желающих, не имеющих технической подготовки.
Количественный аналитик ↔ Количественные знания и методы
На этом этапе главная задача состоит в обучении групп методике анализа на конкретных примерах из практической жизни. Начать можно с деловых ситуаций, приведенных в этой книге. Подготовьте материалы, разработайте методику анализа, установите очередность презентаций и обсудите детали деловых ситуаций в рамках шестишаговой последовательности анализа. Если появляется информация о новом методе количественного анализа, то это удобный случай изучить его всем вместе на конкретном примере. Можно пригласить специалиста с подробным объяснением сути метода, преимуществ и недостатков конкретных процедур – это очень эффективно. Вполне возможно, что такой специалист найдется в вашей компании или хотя бы в местном университете.
Если вы проделали все или большинство процедур, описанных в этой главе, то наверняка продвинулись по пути приобретения навыков хотя бы полупрофессионального количественного аналитика. Это, несомненно, поможет в продвижении по карьерной лестнице и расширит ваш кругозор. Кроме того, вы сможете органично влиться в глобальную трансформацию деловой и корпоративной среды, как раз сейчас охватывающую страны мира.
Пример аналитического мышления: как получить должность преподавателя
В университетском мире конкуренция за получение постоянной должности преподавателя на кафедре все сильнее давит на научных работников, вынуждая их как можно чаще публиковаться. Фраза «публикуйся или погибни» хорошо характеризует степень этого давления, особенно в престижных и ориентированных на научные исследования университетах. Публикации необходимы как для продвижения по карьерной лестнице, так и для сохранения занимаемой должности. Однако подготовка статьи для научного журнала, особенно ведущего в отрасли, дело трудное и отнимает много времени. Сотрудничество с коллегами в процессе подготовки повышает продуктивность работы и постепенно все больше распространяется. Типично и сотрудничество профессоров со студентами старших курсов при подготовке публикаций. Таким образом, получение стипендии на старших курсах зависит от уровня подготовки или наличия достаточных исследовательских способностей, чтобы помогать профессору в его работе.
Джин Хо живет в Южной Корее, а две его дочери учатся в США. По его словам, он не мог себе позволить оплатить обучение обеих дочерей в этой стране, но зато систематически изучал все возможности получения стипендии для обучения в магистратуре. Сейчас девушки учатся в аспирантуре: в Стэнфордском и Мичиганском университетах соответственно. Сначала Джин Хо колебался, стоит ли упоминать о его семейных делах, но решил, что это важно – показать, как хорошее знание основ количественного анализа помогает получить стипендию и как окупается систематическая и осознанная работа над совершенствованием своих количественных навыков.
Когда Нури, старшая дочь Джин Хо, оканчивала колледж, она хотела продолжить образование в США. Девушка прекрасно понимала, что для того, чтобы поехать в эту страну учиться, надо получить стипендию. Но иностранным студентам, специализирующимся в области коммуникаций, очень трудно получить ее. Джин Хо всячески поддерживал Нури, уверяя, что при достаточно высоком уровне подготовки она вполне сможет этого добиться. Нури послушалась его совета и упорно готовилась к подаче заявления на стипендию.
Но каким должен быть уровень подготовки студента, чтобы убедить стипендиальную комиссию в том, что он сможет принимать участие в научных исследованиях и потому заслуживает положительного решения? Вспомним о наших шести шагах количественного анализа и попробуем в этом контексте обсудить ведущую роль профессоров и их сотрудничество со студентами старших курсов (рис. 6.2).
Рис. 6.2. Сможет ли Нури претендовать на стипендию? Шесть шагов количественного анализа
На этапе определения проблемы обычно принимается решение о выборе темы исследования, которая имеет шансы на публикацию в научном журнале. Как правило, ведущую роль в этом играют профессора. На этапе изучения предыдущих поисков следует обосновать актуальность и новизну исследования по сравнению с ранее проводившимися. На этом этапе ведущую роль также играют профессора.
Они же обычно определяют, какие данные следует собрать. Студенты старших курсов помогают в сборе данных и их анализе. Как правило, эти функции поручаются студентам потому, что они требуют много времени и труда. Таким образом, шансов на получение стипендии гораздо больше, если, во-первых, студент способен понять, почему именно эта тема выбрана для исследования и какие методы будут использованы; во-вторых, он может продемонстрировать умение собирать данные и анализировать их под наблюдением профессора. Наконец, профессора обычно пишут статью в журнал на основе собранных студентами данных.
Чтобы подготовиться к подаче заявления на стипендию, Нури записалась на вводный курс по статистике и исследовательским методам. Для углубленного изучения ключевых концепций в этой области Джин Хо и Нури провели сессию вопросов и ответов, а также обсуждение материала каждой главы базовых учебников. Она также прошла интенсивную программу изучения статистической программы SPSS, чтобы получить навыки анализа данных. Наконец, Джин Хо и Нури вместе прочли последние двадцать статей, опубликованных в ведущих научных журналах коммуникационной сферы, затем критично оценили их основные положения, методы исследования, использованные данные, методику проведенного анализа и особенности интерпретации их результатов. Это помогло Нури получить ясное представление, как изученные в ходе трех курсов понятия и концепции применяются в реальном научном исследовании. К концу года Нури настолько овладела исследовательскими навыками, что могла и была готова ассистировать профессору практически в любом исследовании.
Свои цели и уровень подготовки Нури описала в разделе «Цели и задачи обучения» заявления о зачислении на магистерскую программу и выиграла стипендию от Висконсинского университета. Там, благодаря полученной подготовке, Нури работала с несколькими профессорами, готовя статьи к публикации. Позднее она получила приглашение в аспирантуру Стэнфордского университета и сейчас занимается подготовкой диссертации. Младшая дочь Джин Хо – Юнгри пошла по стопам сестры и получила приглашение в аспирантуру Мичиганского университета. Она работает в химико-технологической лаборатории.
Пример аналитического мышления: Дэрил Мори и Шейн Баттье из Houston Rockets
Этот пример посвящен двум менеджерам профессионального баскетбола, овладевшим количественным подходом. Дэрил Мори – генеральный директор баскетбольной команды НБА Houston Rockets. Тем, кто знаком с книгой и одноименным фильмом Moneyball, Мори известен под кличкой Билли Бин профессионального баскетбола. Он окончил колледж по специальности «Статистика и компьютерные науки» на Северо-Западе США, а затем получил степень MBA от Слоановской школы бизнеса при Массачусетском технологическом университете. Он всегда стремился применить идеи Билли Джеймса о бейсбольной статистике к другим видам спорта. Затем он стал старшим вице-президентом по информационным системам и операциям клуба Boston Celtics. В 35 лет он возглавил клуб Houston Rockets и внедрил целый ряд статистических и количественных методов для улучшения результатов команды. Дэрил – председатель ежегодной Конференции по спортивной аналитике в Массачусетском технологическом университете, на которую собираются около двух тысяч участников.
Шейн Баттье – форвард NBA, в настоящее время играет за Miami Heat. В 2006–2011 годы он играл за Houston Rockets. Он отличался выдающимися аналитическими способностями как игрок и занимал седьмую позицию в рейтинге самых интеллектуальных игроков профессионального спорта по версии журнала Sporting News. В статье Moneyball Майкла Левиса Дэрил Мори говорит, что Баттье
…получал специальный подбор данных. «Он единственный игрок, которому мы их предоставляли, – говорит Мори. – Они обрушивались на него, как вода из пожарного шланга, но он ухитрялся фильтровать их и извлекать полезные выводы. Большинство игроков в этом плане напоминают игроков в гольф – вы не хотите, чтобы они двигались, пока не решат, куда ударить». Данные классифицировались по ряду категорий, и рассчитывалась вероятность забрасывания мячей из разных точек поля, при разной степени активности обороны противника, при разных видах взаимодействия с другими игроками: насколько удачно он забрасывает из-за заслона, после обводки игрока соперника, броском сразу после принятия мяча и т. п. Баттье извлек много полезного из данных об игроках, которых должен был опекать на поле [106] .
Тем не менее, полезность Баттье для его команды не была бесспорной, и об этом нам говорит количественный анализ.
Определение и формулирование проблемы. Должна ли Houston Rockets купить такого игрока, как Баттье, даже если его индивидуальная статистика не столь впечатляющая?
Изучение предыдущих поисков решения. Спортивная аналитика получает все большее распространение, и существует множество книг (и еще больше сайтов) на эту тему. Но такой анализ провести намного легче в тех видах спорта, где индивидуальная статистика игрока непосредственно влияет на результат команды. В баскетболе оценить эффективность действий команды в целом и взаимодействие игроков намного сложнее. Баттье имел относительно невысокие индивидуальные показатели (в течение пяти лет выступлений за команду Memphis Grizzlies он в среднем приносил команде 10 очков за игру всего при пяти подборах мяча). Однако его команда и партнеры, казалось, действовали лучше, иногда намного лучше, когда он был на площадке.
Моделирование (выбор переменных). Переменными при решении вопроса о приобретении такого игрока, как Баттье, будут его стоимость (непосредственно или в обмен на других игроков), аванс, который потребуется выплатить вперед, разнообразные показатели индивидуальных действий и, в идеале, некоторые показатели эффективности деятельности команды в то время, когда Баттье находился на площадке, и в то время, когда его не было.
Сбор данных (измерение). Индивидуальную статистику и финансовые аспекты сделки выяснить несложно. Через них можно оценить влияние действий игрока на результаты команды. Статистика rebounds, адаптированная Роландом Бичем из на основе аналогичной статистики в хоккее, позволяет оценить успешность действий команды в то время, когда определенный игрок находится на поле, и в то время, когда он сидит на скамейке.
Анализ данных. Мори и его статистики решили использовать так называемый анализ плюс-минус, чтобы оценить Баттье. Но во время сезона 2006/07, его первого сезона в Houston Rockets, Мори сказал, что Баттье имел показатель –8 по методике плюс-минус. Это означало, что в случае замены Баттье игроком со средними показателями результаты команды снижались на восемь очков. По этому показателю игрок занимал семнадцатую позицию в рейтинге NBA, но при этом получал среднюю по лиге заработную плату, а тот игрок, в обмен на которого его продали, занимал в том же рейтинге лишь 45-ю позицию.
Результаты и необходимые меры. Конечно, Мори принял решение купить Баттье, и это решение оправдалось. В сезоне, предшествовавшем его появлению, Houston Rockets финишировали со счетом 34–48, а уже в следующем сезоне этот показатель составил 52–30. В 2008/09 году был поставлен рекорд – 56–27, и при этом команда продемонстрировала уникальную серию из двадцати двух побед подряд, несмотря на то что несколько ключевых игроков получили травмы. Баттье играл за Houston Rockets пять лет, пока не получил серьезную травму и не был продан обратно в Grizzlies, а затем в Miami Heat. За команду из Майами Баттье также выступал весьма удачно в своей обычной не бросающейся в глаза манере игры, в результате чего команда стала чемпионом NBA в 2012 году.