3.1. Большие данные как стратегический ресурс
В последние годы Большие Данные являются общепризнанным трендом экономического и технологического развития. Им посвящены тысячи публикаций. Они относятся к числу наиболее популярных тем, как в специализированных изданиях, так и в различного рода СМИ, рассчитанных на самую широкую аудиторию. В результате возникло впечатление, что Большие Данные — это нечто само собой разумеющееся, ясное, понятное. Широко распространена иллюзия о повсеместном применении Больших Данных в России.
Между тем, дело обстоит совсем не так. Беспристрастный анализ фактических данных показывает, что наша страна существенно отстает в сфере Больших Данных. Значительная часть компаний только используют термин «Большие Данные» в маркетинговых целях, а по сути, применяют старую, хорошо известную бизнесаналитику, которая заметно отличается от Больших Данных. В стране практически нет спроса на специалистов по Большим Данным. Достаточно посмотреть наиболее популярные порталы работ, чтобы убедиться, что спрос на специалистов по Большим Данным у нас на порядки меньше, чем в США, Европе, Японии, Китае. В то время как во всем мире издаются сотни профессиональных и общедоступных книг по отдельным аспектам Больших Данных, в России только в этом году вышла первая книга по Большим Данным — работа В. Майер-Шенбергера и К. Кукьера «Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим». Да и эта книга носит не профессиональный характер, а написана в жанре нон-фикшн.
Происходящее вызывает особую тревогу в условиях, когда ведущие наднациональные мировые структуры и транснациональные корпорации, правительства ведущих стран мира, бизнес самых различных масштабов, системы управления производственной и социальной инфраструктурой и, конечно же, военноразведывательный комплекс всех основных стран мира уже используют Большие Данные как важнейший стратегический ресурс.
Достаточно парадоксально, что до сих пор при широком использовании технологий Больших Данных нет общеупотребительного их определения. Наиболее часто используется популярное определение Майкла Франклина из Университета в Беркли: «Большие Данные — это любые данные, работа с которыми требует значительных затрат и из которых трудно извлечь информацию». Данное определение кочует из книги в книгу, из работы в работу. Между тем, оно является лучшим подтверждением тезиса о том, что наука о Больших Данные и практические технологии Больших Данных живут в параллельных реальностях. Соответственно, наука о Больших Данных не столько выступает надежным базисом для инженерии данных, сколько намерено или ненамеренно скрывает революционную суть технологий Больших Данных.
В самом деле, определение через большие затраты и трудность обработки может указывать не только на специфические характеристики данных, но и на неэффективность применяемых технологий. По сути, это определение ничего не говорит о том, чем Большие Данные отличаются от просто данных. Казалось бы, штука эта безобидная и носит исключительно академический характер. Однако, на практике это не так. Когда лица, принимающие решения, возможно и не обладающие глубокими профессиональными познаниями, но в подавляющем числе наделенные недюжинным здравым смыслом, встречаются с подобными определениями, у них возникает подозрение, что они имеют дело с очередной маркетинговой уловкой. Суть этой уловки в том, чтобы просто извлечь из организации деньги, заставив ее заплатить за старые решения под новым названием. Несомненно, что непонятность Больших Данных для лиц, принимающих решения, в том числе и у нас, принципиальное отличие технологий Больших Данных от того, что было раньше, стали одними из важных причин, почему Россия и целый ряд других стран, располагающих всеми необходимыми предпосылками для использования этих технологий, на сегодняшний день отстают в гонке цифровых вооружений.
Чтобы разобраться с тем, что такое Большие Данные и в чем принципиальная новизна их технологий, надо для начала отследить время возникновения термина. Сам по себе термин «Большие Данные» появился пять лет назад после публикации специального выпуска ведущего американского научного журнала Nature, целиком посвященного этой теме. Затем тема, как по команде, была растиражирована сначала специализированными IT-изданиями, а затем подхвачена элитными СМИ, типа Foreign Affairs, Wall Street Journal и т. п.
Что же произошло пять лет назад? Есть ли какие-то документальные доказательства, что мы имеем дело с чем-то принципиально новым, а не с хорошо продуманной маркетинговой кампанией по принуждению правительств и корпораций к покупке нового, дорогостоящего софта? Ведь таких примеров в истории IT-индустрии было немало. В данном случае твердые документальные доказательства перехода некоего Рубикона имеют место быть.
Во-первых, он связан с достижением интернетом уровня контентной зрелости и переходом в фазу ярко выраженного экспоненциального развития. Эта фаза получила название «информационный взрыв». Примерно, с 2008 года объем информации, вновь генерируемой в сети, стал удваиваться в течение примерно полуторадвух лет. На сегодняшний день можно привести следующие ключевые характеристики информационного взрыва.
По данным компании Cisco, объем сгенерированных данных в 2012 году составил 2,8 зеттабайт и увеличится до 40 зеттабайт к 2020 г. Примерно треть передаваемых данных составляют автоматически сгенерированные данные, т. е. управляющие сигналы и информация, характеризующие работу машин, оборудования, устройств, присоединенных к интернету, или к интернету вещей. Причем с каждым годом доля интернета вещей или как его сегодня еще называют «интернета всего» растет в общем объеме мировых информационных потоков. На 40 % ежегодно увеличивается объем корпоративной информации, передаваемой и хранящейся в сети интернет.
Число пользователей интернета в мире к концу 2013 года составило 2,7 млрд. человек, или 39 % населения земли, а к 2016 году эта доля составит 65–75 % населения по данным Центра новостей ООН. Как ожидается, количество корпоративных пользователей интернета во всем мире увеличится с 1,6 миллиарда в 2011 году до 2,3 миллиарда в 2016 году.
Во-вторых, примерно в этот период времени появились и стали доступны для корпоративных пользователей принципиально новые IT-решения, позволяющие в режиме реального времени обрабатывать практически безразмерные массивы данных самого различного формата. Причем эти решения сразу же стали реализовываться не только как программные платформы, устанавливаемые на серверы, но и как облачные вычисления, где от организации не требовалось наличия дорогостоящей инфраструктуры компьютерного железа.
В-третьих, к концу нулевых годов западные, прежде всего, американские поведенческие и когнитивные науки, с одной стороны получили широкое признание бизнес-сообщества и государств, а с другой — из фазы исследований и разработок перешли в стадию производства эффективных технологий. Косвенным показателем этого процесса стал тот факт, что в течение нулевых годов три виднейших представителя поведенческих наук: Д. Канеман, Дж. Акерлоф и Р. Шиллер получили Нобелевские премии по экономике. Экономика была выбрана лишь потому, что Нобелевских премий в сфере наук о человеке просто не существует.
Теперь давайте вдумаемся, чем же, по сути, является интернет. Причем без разницы, о каком интернете мы говорим — об интернете людей или об интернете вещей. Не надо обладать глубокими техническими знаниями, чтобы понять, что фактически интернет является хранилищем, своеобразным архивом следов человеческой деятельности. Причем, не только той деятельности, которая реализована в конкретных поступках, действиях, событиях, но и архивом намерений, мнений, мыслей и отношений. Не зря автор знаменитых бестселлеров Маршалл Смит уподобил интернет толще земли, в которой можно обнаружить след доисторического животного, умершего миллионы лет назад. По сути, в интернете ничего не исчезает. Даже популярные в постсноуденов-скую эпоху различного рода сервисы удаления аккаунтов и других следов пребывания в сети, удаляют лишь те следы, которые доступны для наблюдения простыми пользователями, не вооруженными специальными программами, доступными для корпораций и государств.
Соответственно формирование огромного, постоянно пополняющегося архива поведенческой активности самых различных субъектов, от отдельных государств и огромных компаний до небольших групп и отдельных индивидуумов собственно и послужило базисом появления Больших Данных. C тех пор направление Больших Данных стало ведущим в сфере информационных технологий.
Анализ накопленного за последние годы опыта применения технологий Больших Данных позволяет выделить несколько ключевых черт, отличающих Большие Данные от всех других информационных технологий. К ним относятся:
• во-первых, огромные массивы разнородной информации о процессах, явлениях, событиях, объектах, субъектах и т. п., пополняемые непрерывно в режиме он-лайн. Согласно имеющейся статистике 60 % этой информации носит неструктурированный, в основном текстовой характер и 40 % составляет структурированная, или табличная информация. В последние годы в общем объеме Больших Данных постоянно нарастает доля информации структурированного характера, поступающей от вещей, соединенных с интернетом — от холодильника до городской системы регулирования светофоров и т. п.;
• во-вторых, специально спроектированные программные платформы, где Большие Данные любого объема могут храниться в удобном для вычислений виде. Особо надо подчеркнуть, что эти архивы отличаются от привычных баз данных, которые приспособлены только для структурированной или табличной информации. Отличительной чертой этих хранилищ является то, что структурированная и неструктурированная информация могут обрабатываться совместно, как единое целое;
• в-третьих, наличие различного рода математического, прежде всего, статистического инструментария для обработки Больших Данных и получение результатов в виде, понятном для человека. Причем, при анализе Больших Данных используются не только традиционные методы математической статистики, но и алгоритмы распознавания образов, нейронные сети, построенные на основе аналогии с нервной системой и т. п.
По данным различных исследований, не более 0,6 % всей имеющейся сейчас информации подпадает под категорию Больших Данных, т. е. накапливается, хранится и перерабатывается. В этих же исследованиях указывается, что потенциально в качестве Больших Данных может использоваться 23 % всей хранимой в настоящее время информации. Т. е. фактически сейчас из всей этой информации используется как Большие Данные, т. е. обрабатывается, анализируется чуть больше 3 %. Между тем, последние достижения в области создания платформ накопления, хранения и обработки объемов данных всех форматов позволяют увеличить потенциальные Большие Данные с 23 % до примерно 40 % всей передаваемой в сетях информации.
Еще в 2011 году McKinsey Global Institute объявил Большие Данные «следующим рубежом для инноваций, конкуренции и производительности». По данным целого ряда ведущих международных деловых изданий, уже сегодня Большие Данные дают заметный эффект в бизнесе. Например, выяснилось, что в транснациональных компаниях, входящих в список Fortune 500, где, казалось бы, до мелочей отлажены все процедуры и процессы, внедрение технологий Больших Данных на 5–7% увеличило эффективность использования ресурсов — труда, основных производственных фондов, энергии и т. п. и на 7–9% обеспечило рост объемов продаж. Для среднего бизнеса показатели оказались в полтора-два раза выше. Причем, следует отметить, что данные получены в условиях, когда мировая экономика испытывает на себе последствия глубочайшего финансово-экономического кризиса и экономический рост измеряется в лучшем случае 1–2%.
На чем же базируется эффективность Больших Данных? Технологии Больших Данных и прежде всего, методы статистического анализа, компьютерного распознавания образов и т. п., применяемые на огромных, постоянно пополняемых массивах данных позволяют:
• проводить самые различные и сколь угодно подробные классификации той или иной совокупности людей, компаний, иных объектов по самым разнообразным признакам. Такие классификации обеспечивают точное понимание взаимосвязи тех или иных характеристик любого объекта — от человека до компании или организации, с теми или иными его действиями;
• осуществлять многомерный статистический и иной математический анализ. Этот анализ позволяет находить корреляции между самыми различными параметрами, характеристиками, событиями и т. п. Корреляции не отвечают на вопрос — почему. Они показывают вероятность, с которой при изменении одного фактора изменяется и другой. В каком-то смысле Большие Данные представляют собой альтернативный традиционной науке метод. Наука на основе теоретических моделей отвечает на вопрос — почему, а затем, получив ответ, делает рекомендации, как действовать. В случае корреляции стадия поиска причины ликвидируется, а действие происходит в тех случаях, когда факторы тесно взаимосвязаны и на один из факторов легко или возможно осуществить целенаправленное воздействие;
• прогнозировать. На основе классификаций и аналитических выкладок осуществляется прогнозирование. Суть прогнозирования состоит в том, чтобы на основе корреляции определить наиболее легкий способ воздействия для того, чтобы один набор факторов, характеризующих тот или иной объект, лицо, компанию, событие и т. п. был преобразован в другой.
Как любой новый технологический пакет, Большие Данные тут же обросли мифами и заблуждениями. Многие из них постоянно усиливаются как самими производителями программных продуктов в сфере Больших Данных, так и средствами массовой информации, вынужденными адаптировать сложные вопросы информационных технологий для читателей, не обремененных излишними знаниями.
Из всей совокупности мифов стоит выделить три главных. Именно они наносят наибольший вред технологиям Больших Данных и тормозят их практическое применение, в том числе в нашей стране.
Прежде всего, в маркетинговых целях прикладываются немалые усилия, чтобы представить технологии Больших Данных неким новым Святым Граалем. На них необоснованно возлагается роль панацеи от всех бед. Между тем, очевидно, что любой технологический пакет имеет строго определенные условия для своего применения. Касательно Больших Данных таким ограничением является сопоставимость текущей ситуации с ранее наблюдавшимися ситуациями, процессами, периодами времени и т. п. В качестве примера можно привести прогнозирование потребительского поведения. Каждый человек на собственном опыте знает, что в ситуации умеренной инфляции он будет делать одни покупки, а при гиперинфляции его потребительское поведение коренным образом изменится. Если уже имеются Большие Данные как по периоду с низким уровнем инфляции, так и ситуации гиперинфляционного шока, то технологии Больших Данных будут полезны. Они позволят распознать, к какому классу относится текущая ситуация, обратиться к соответствующим поведенческим паттернам, характеризуемым теми или иными параметрами, и позволят дать достаточно достоверный прогноз. А вот если Больших Данных по периоду гиперинфляции нет, а она наступила, то в такой ситуации технологии Больших Данных будут бесполезны. Более того, их применение чревато непоправимыми ошибками. Этот пример показывает: технологический пакет Больших Данных, также как и другие технологические пакеты имеют строгие условия, где его применение эффективно, а где — нет.
Бытует мнение, что Большие Данные могут применяться только государственными структурами и транснациональными корпорациями, и недоступны для других субъектов. Связано это с дороговизной как серверной части, так и программных продуктов, требуемых для работы с Большими Данными. И, наконец, с высокой зарплатой специалистов по Большим Данным. На практике в последние пару лет пользу из Больших Данных извлекают не только гигантские, но и небольшие структуры. Это стало доступным благодаря облачным вычислениям. В этом случае небольшие структуры выступают конечными пользователями технологического пакета, который получают как услугу. Использование этой технологии, как показывает опыт небольшого и среднего бизнеса в США, Западной Европе и Японии дает компаниям неоспоримые конкурентные преимущества по сравнению с бизнесами, которые подобными возможностями не располагают.
Наконец, очень серьезным заблуждением является рассмотрение технологического пакета Больших Данных как чисто машинной технологии. Многие государственные и корпоративные структуры впустую затратили огромные суммы средств только потому, что все ресурсы были направлены на закупку компьютерного железа и программных продуктов. При этом, затраты на кадры формировались по остаточному принципу. Между тем технологии Больших Данных требуют специалистов высочайшего уровня квалификации, как правило, обладающих образованием и профессиональными навыками не только в области информационных, но и гуманитарных наук. Сегодня, например, в США по оценкам экспертов не хватает от 50 до 70 тыс. специалистов по данным (data scientists). Большие Данные представляют собой не машинную, а человеко-машинную технологию.
Это наглядно показал пример любимого детища АНБ, компании П. Тиля Palantir. Одна из версий программы ориентирована на борьбу с мошенничествами в крупных финансовых структурах. Пока действовал чисто машинный вариант, система давала множество ложных срабатываний. При этом полностью выявлялись и реальные случаи хищений, но они были смешаны с неточными выводами. В результате за программу посадили ветеранов служб экономической безопасности в качестве операторов. За короткий срок они обучились работе с программой и, используя человеческий опыт, выбирали из всей совокупности сигналов лишь те, которые указывали на реальные хищения.
По этому поводу руководитель одной из самых перспективных компаний в области прогнозирования Quid, также принадлежащей П. Тилю, Ш. Горли сказал: «Наибольший эффект Большие Данные дают тогда, когда возможности компьютеров в обработке гигантских массивов информации и выявлении нетривиальных связей соединены с человеческим опытом и профессиональной интуицией. А все, что вам рассказывает Р. Курцвейл про искусственный интеллект, это как минимум на ближайшее будущее просто красивые истории и PR-ходы».
Подытоживая суть технологий Больших Данных, можно согласиться с краткой формулировкой консалтинговой компании Forrester: «Большие Данные объединяют техники и технологии, которые извлекают смысл из данных на экстремальном пределе практичности».
Большие Данные в первую очередь были использованы в маркетинге, инвестиционном бизнесе, в продажах и т. п. Т. е. фактически там, где речь идет о косвенном, незаметном управлении поведением. Другой сферой применения Больших Данных стали процессы, описываемые множеством параметров, где за счет изменения режима можно получить экономию того или иного ресурса. В этой связи за пределами маркетинга и продаж самыми активными пользователями Больших Данных стали государственные учреждения и энергетический сектор экономики.
Но это лишь надводная часть айсберга. А подводная часть, как известно, всегда намного больше и, если можно так сказать, серьезнее. Подводной частью айсберга стало использование технологий Больших Данных в таких сферах как разведка и контрразведка, военное дело, геостратегия и то, что традиционно называлось информационными войнами, а фактически представляет собой форму жесткого когнитивного противоборства.
Большие Данные были быстро осознаны такими странами, как Соединенные Штаты, Великобритания и Япония, в качестве важнейшего ресурса стратегического значения. 29 марта 2012 года администрация Б. Обамы выступила с инициативой «Big Data Research and Development Initiative». Инициативой предусматриваются вложение значительных объемов ресурсов и проведение комплексных мероприятий в целях активного использования технологий Больших Данных на ключевых направлениях государственной политики США. В рамках инициативы ежегодно в Вашингтоне проводятся большие конференции «Big Data for government & defense».
В сентябре 2013 года правительство Японии опубликовало информацию о разработке национальной программы по Большим Данным. Летом того же года правительство Австралии заявило, что рассматривает Большие Данные как важнейший национальный стратегический ресурс и выдвинуло задачу стать головной страной в сфере использования технологий Больших Данных как на правительственном уровне, так и на всех других уровнях государственного аппарата в масштабах Британского Содружества Наций.
3.2. Большие Данные в сетевом измерении
Долгие десятилетия в основе политтехнологий, методов жесткого информационного противоборства, конструкторов для проведения государственных переворотов и революций лежала так называемая «теория толпы». Она была разработана усилиями Лебона, Тарда, Конетти, Московичи и проч. Эта теория базировалась на внешнем описании процессов. Как любая описательная теория она исходила частично из наблюдений, частично из картины мира самих исследователей. Тем не менее, теория, так или иначе, работала и построенные на ее основе методы давали определенный эффект. Едва ли не последним представителем школы «теории толпы» был Дж. Шарп с его книгами, включая работу «От диктатуры к демократии». Однако сегодня с уверенностью можно сказать, что «теория толпы» описывает лишь небольшой фрагмент реальности.
В последние годы создана, по сути, новая наука — социодинамика, которая обобщает эмпирические закономерности, полученные в результате применения технологий Больших Данных к огромным массивам информации, содержащейся в архивах крупнейших социальных платформ web 1 и web 2, таких как Google, Facebook, Twitter и т. п.
Эти эмпирические закономерности сегодня используются для отработки практического инструментария внешнего воздействия, управления и манипулирования социальными группами любых масштабов и любого уровня структурированности, а также для сборки и деструкции социальных субъектов. Именно применение Больших Данных к информации, полученной из социальных сетей, позволило осуществить прорыв в отработке инструментария внешнего социального управления поведением.
Как правило, зарубежные работы о Больших Данных можно поделить на две основных группы. Одни заполнены техническими подробностями архитектурных решений и интересны лишь профессионалам-айтишникам. Другие представляют собой набор красивых поучительных историй об эффективности применения Больших Данных для решения тех или иных задач, прежде всего, в бизнесе. Читать такие истории весьма занимательно, но с практической точки зрения абсолютно бесполезно.
Поэтому мы постарались пойти третьим путем. Он заключается в изложении результатов наиболее интересных исследований социодинамики и соответственно описании тех самых, только что выявленных эмпирических закономерностей, которые используются для разработки нового инструментария социального конструирования и разрушения.
Научная группа Facebook с привлечением специалистов из американских университетов, научных центров Европы и Азии провела исследование не только на материалах Facebook, но и ряда других крупнейших сетей. Было установлено, что внутри глобальной сети существуют более-менее устойчивые субсети, или как их называют на английском — паттерны.
Оказалось, что при всем многообразии этих паттернов, в конечном счете, они образуют восемь базовых структур. В основу типологии структур положена внутренняя конфигурация паттерна, плотность связей и структура внешнего взаимодействия паттерна с глобальной сетью или другими паттернами. Под внутренней конфигурацией понимают взаимоотношения внутри паттернов между людьми с различными социальными ролями. Оказалось, и возможно это самое главное, что в каждом из восьми базисных паттернов информация распространяется различным образом и с неодинаковой скоростью. Различаются также по этим паттернам взаимоотношения между онлайн и офлайн поведением. Фактически — это ключевое открытие. Оно позволяет заметно увеличить эффективность внешнего управления групповым и массовым сознанием и поведением.
К. Марлоу, руководитель научной команды Facebook отметил, что им, вместе с исследователями СевероЗападного университета в Чикаго удалось обнаружить, что все сложные сетевые системы, например, такие как интернет, социальные сети, электросети и даже колонии термитов имеют множество сходных черт, характеризующих как динамику, так и статику этих систем. Более того, выяснилось, что во всех этих системах есть своего рода несущие узлы и элементы, которые образуют своего рода «скелет» сети, либо ее устойчивого паттерна. Собственно эти «скелеты» и определяют само существование сетей, паттернов. В значительной степени от них зависит жизненный цикл сети и ее устойчивость к внешним воздействиям.
Решающую роль в этой работе сыграл коллектив профессора А.Э. Барабаши. Еще в 2010 году А. Барабаши подключился к работам созданного на деньги Пентагона центра по исследованию социально-когнитивных сетей (Social Cognitive Network Academic Research Center — SCNARC). Там перед ним была поставлена задача практической проверки разработанных ранее теоретических моделей безмасштабных сетей на больших объемах реальных данных. Результатом работы А. Барабаши стала статья «Достижение социального консенсуса в результате влияния убежденного меньшинства». В работе говорилось, что при достижении в социуме пороговой границы примерно в 10 % убежденных сторонников какой-либо идеи, возникает лавинообразный процесс завоевания этой идеей умов большинства членов социума. Начиная с 30 % процесс становится необратимым. Но всего этого недостаточно. Нужно контролировать от 15 до 25 % драйверов сети. Отличие драйверов в том, что они не просто собирают информацию от разных людей и не просто являются источником информации для других участников сети. Их особенность в том, что они делают и то, и другое, выступая в роли коммуникаторов между группами людей и, как бы являясь информационными мостами, соединяющими изолированные островки микросообществ, из которых обычно состоит любая соцсеть. Поэтому настоящие драйверы — это не чемпионы Facebook по количеству друзей, и не чемпионы Twitter по количеству фолловеров. Это коммуникаторы, получающие информацию от одних групп людей и передающие ее другим группам. Принцип действует и в реале, и в виртуале.
Структура связей между драйверами сети в реале или в виртуале собственно и создает тот самый «скелет» сети, который выявили команды Facebook и Чикагского университета. Соответственно разрушение любой сети или сложного социального субъекта наступает не тогда, когда удается разрушить наиболее плотные связи внутри сети, а когда удается разрушить контакты между драйверами, или «скелет» сети.
Исследователи из Северо-Западного университета в Чикаго в сотрудничестве с группой из Массачусетского технологического института, установили, что для того, чтобы взять сеть или ее устойчивые паттерны под контроль и осуществлять внешнее управление ими достаточно контролировать определенный процент участников сети или паттернов. Этот процент, в зависимости от типа сетей и паттернов, колеблется в интервале от 10 до 80 %. Проценты прямо определяются двумя параметрами — плотностью связей внутри сети или паттернов и степенью однородности элементов, входящих в сеть или паттерн.
Жан Жак Слотин, профессор Массачусетского технологического института отметил в этой связи, что для сетей, где элементами являются люди, т. е. социальных сетей в онлайне и офлайне, показатель контроля составляет от 9 до 15 %. Практически это означает, что если контролируется информационный поток или поведение от 9 до 15 % участников сети, то в значительной степени контролируется и вся сеть или паттерн. Это относится и к небольшим группам, и к социальным сетям максимального размера.
К. Марлоу в своих работах отмечает, что плотность социальных сетей гораздо выше, чем принято думать. Все хорошо знают правило шести рукопожатий. Оно гласит, что любые два человека в мире увязаны через цепочку из шести человек. Это правило растиражировано и в научной, и в популярной литературе, вошло в обиход. А между тем, базируется оно всего на нескольких экспериментах, проведенных в одном городе, а именно в Бостоне во второй половине 70-х годов. Команда Facebook, используя имеющиеся данные, проанализировала сведения на совокупности, составляющей 300 млн. пользователей сети в самых различных странах мира. Выяснилось, что для 98 % пользователей Facebook действует правило не шести рукопожатий, а чуть больше четырех.
К неожиданным результатам привело недавнее исследование под руководством члена научной группы Facebook Э. Бакши. Его осуществляли коллеги из университета штата Мичиган. Эксперимент назывался «Эхокамера». Суть его состояла в том, что исследовались пути распространения мемов и факторы, влияющие на отношение пользователей Facebook к тем или иным лицам, событиям, процессам. Эксперимент проводился на совокупности 80 млн. аккаунтов. С одной стороны был получен весьма ожидаемый результат, что распространение мемов зависит от конфигурации паттернов, а между паттернами решающую роль играет массовость охвата ме-мом участников сети в целом. Гораздо более неожиданным оказался другой вывод. До эксперимента все были уверены, что на отношения участников паттерна решающее влияние оказывает позиция по этому вопросу других его членов, или как еще их называют «близких друзей». Выяснилось, что это не так. Слабые связи, т. е. позиция сети в целом или большого его фрагмента, куда входят несколько паттернов, оказывает большее влияние, чем позиция «близких друзей». Результат был настолько неожиданный, что эксперимент был трижды повторен и дал те же результаты. Не менее удивительным оказался тот факт, что мнение в виртуале может существенно расходиться с поведением в реале. Кроме того, оказалось, что в реале зачастую действуют несколько иные законы, чем в виртуале.
Присцилла Чан, жена Марка Цукерберга попросила его использовать возможности Facebook для увеличения добровольных бесплатных доноров крови в США. Цукерберг попросил научную группу предложить стратегию и практические инструменты реализации этой программы. При анализе результатов программы выяснилось, что при переходе из онлайна в офлайн ситуация меняется. Если на виртуальное мнение более сильное влияние оказывают слабые связи, то на реальное поведение больше воздействуют сильные связи. Фактически технология научной группы была построена на том, чтобы с одной стороны обеспечить максимально быстрое распространение мема «донор — это круто» по сети и создать этому мему климат максимального благоприятствования, а с другой стороны побудить наиболее влиятельных членов паттернов показать пример реальным поступком. Достигнуто это было путем отправления им персональных посланий за подписью Цукерберга, содержащим помимо просьбы не очень значащую, но приятную бесплатную «плюшку».
Недавно вышла публикация центра Беркмана по изучению информации и общества при Гарвардском университете. Исследование проводилось на материале мониторинга веба и непосредственно полевых работ в Тунисе, Египте, Ливии, Йемене. Было выделено три аспекта влияния социальных сетей на политические процессы, прежде всего, в арабском мире, а именно — коммуникационный, мобилизационный и информационный. Исследователи из Гарварда сделали однозначный вывод о том, что мобилизационная роль социальных сетей в событиях в противовес мнению СМИ и блоггеров была весьма невелика. Различного рода виртуальные сообщества не придали сколько-нибудь массового характера выступлениям. Решающей технологией мобилизации стали пятничные молитвы и обращения мулл.
Коммуникационный фактор социальных сетей, безусловно, присутствовал. Более того, как было выявлено и по результатам мониторинга, и по результатам полевых исследований, он нарастал по мере развития событий. Т. е. на первом этапе коммуникация шла в основном вживую и через банальные телефоны, но дальше все чаще стали использоваться платформа Twitter и социальные сети.
Наиболее заметную роль социальные сети сыграли в части информационного освещения событий в арабском мире и во всемирном медийном пространстве. Результаты исследования убедительно показали, что сообщения в Twitter и социальных сетях оставляла ничтожно малая часть участников событий. В их число входили, прежде всего, агитаторы, или ангажированные блоггеры. Кроме того, среди них было немало и тех, кто писал то, что думал, или выкладывал видео, которые реально снимал. При этом именно сообщения ангажированных блоггеров в значительной степени использовались мировыми онлайн СМИ всех форматов и формировали информационные потоки. Частично здесь имел место фактор целенаправленного использования фрагментарной информации в целях манипулирования общественным мнением. Но главным, по мнению исследователей из Гарварда, было то, что именно такая технология формирования новостей встроена в производственные процессы мировых интернет- и офлайн-СМИ. Т. е. так произошло не только потому, что кто-то целенаправленно занимался манипуляциями, но и потому, что это соответствовало отработанным технологиям подачи новостей в режиме нон-стоп.
Широко обсуждаются результаты промежуточных исследований Института анализа социальных и политических конфликтов Джорджтаунского университета. Этот университет является одной из ведущих «фабрик мысли», обслуживающих, прежде всего, Госдепартамент и Совет национальной безопасности. Институт вот уже девять лет ведет тему «Квазитолпа в политических событиях».
Еще в прошлом веке Г. Лебон написал свою знаменитую работу о толпе. В ней сформулировано и классическое понимание толпы, как большого, в каком-то смысле даже избыточного количества людей, оказавшегося в определенное время в конкретном месте. Квазитолпа отличается от толпы тем, что представляет собой толпу, которая собралась не случайно из-за стечения тех или иных обстоятельств, либо объективных процессов, а была собрана сознательно, либо собралась в результате каких-то общественных процессов.
Уникальность этого исследования состоит в том, что феномен квазитолпы изучался не только на материале арабского мира, но и Западной Европы, конкретно, событий в Лондоне, Париже, Берлине в последние годы, США («Оккупай Уолл-стрит»). В результате исследований, которые велись с привлечением специалистов из МТИ и Северо-Западного института, выяснились очень интересные вещи. Для каждой из стран имеется свой критический порог численного состава квазитолпы, когда она начинает играть активную роль в политических, социальных и экономических процессах, прежде всего, на региональном, городском и территориальном уровнях. Этот порог зависит от численности населения в ключевых городах, культурных особенностей, национального темперамента и компьютерной вооруженности населения.
В исследовании установлено, что квазитолпа превращается в своего рода устойчивый субъект действия, способный собираться с определенной периодичностью при выполнении условий, связанных с ее структурным составом. Конкретно речь идет о следующем. Ранее считалось, что в квазитолпе четко выделяются три группы участников. Это «заводилы», выступающие организаторами квазитолпы и первыми выходящие на площади и улицы. Вторая — «регулярные бойцы». Это — участники квазитолпы, склонные к жесткому противодействию с властью и органами правопорядка, как правило, берущие на себя основной удар при попытках сдержать или рассеять квазитолпу. Третья — «примкнувшие». Это те, кто откликается на призыв заводил, и является массовкой для бойцов. Впервые структура квазитолпы была раскрыта исследователями из Лондонской школы экономики на примере анализа движения британских футбольных болельщиков — ультрас в 70-е годы прошлого века.
Проведенные в последние годы исследования заставили посмотреть на квазитолпу несколько по-иному. Квазитолпа понимается не как простое объединение большого числа людей, а как единое целое, состоящее из людей и групп, объединенных сильными, слабыми и очень слабыми связями. Выяснилось, если в квазитолпе не менее 7-15 % людей принадлежат к группам, внутри которых имеются сильные связи, то это необходимый но недостаточный фактор превращения квазитолпы в реальный фактор действия. Что это за группы? Это не организаторы квазитолпы, а люди, которые влились в нее не поодиночке, а группами, которые тесно взаимодействуют в реале и общаются в виртуале. Эти группы становятся центрами притяжения и стабилизации квазитолпы. Они же в значительной степени втягивают в себя понемногу остальных членов квазитолпы. Про эти группы было известно и раньше.
А вот третий компонент квазитолпы четко выделен впервые. Выяснилось, что в квазитолпе, которой удалось стать субъектом действия, обязательно присутствовали микрогруппы, выполняющие роль катализаторов. Их численность должна составлять от 2 до 5 % от общего числа участников квазитолпы. Это люди, которые наиболее активно ведут себя в квазитолпе, а также оказываются первыми при любых конфликтах и столкновениях. Было бы упрощением, как показали результаты исследований, всех их без исключения относить к провокаторам. Конечно, провокаторы в ряде случаев составляют большинство этой группы, но немалая часть людей, попавших в указанную категорию — это участники квазитолпы, которые по своим личностным и социально-психологическим характеристикам, культурным стереотипам и возрастным особенностям склонны к импульсивным действиям, имеют низкий порог сдерживания страхом и т. п. Исследованиям этой категории в России длительное время с успехом занимается д.ф.н. И. Сундиев. Очень интересно, что согласно анализу института, эта группа в значительной степени формируется и рекрутируется в социальных сетях. По численности они ничтожны, но последствия их деятельности очень велики. И это не удивительно, поскольку динамика квазитолпы — это чисто синергетический процесс. При таких процессах даже малые изменения могут привести к очень большим последствиям.
Имеется много свидетельств, что для того, чтобы квазитолпа превратилась в субъект действия, одних процессов самоорганизации недостаточно. Должно присутствовать внешнее управление со стороны тех, кто сам ни в коем случае не участвует в квазитолпе, а обеспечивает своего рода логистику, финансирование и т. п. Проще говоря, каждому кукольному театру нужен свой Карабас-Барабас. Хотя в реальности обычно действует не индивидуальный, а коллективный Карабас.
Значительный интерес вызвала недавняя работа Парижского центра изучения социальных, этнических и межконфессиональных конфликтов о взаимоотношениях виртуальных и реальных социальных сетей и групп в конфликтных ситуациях. Исследование имело целью выяснить вопрос, какие именно виртуальные группы быстрее всего самоорганизуются в конфликтных ситуациях и способны к согласованным действиям. В качестве материалов были использованы данные по беспорядкам в Париже, событиям прошлого года в Тунисе, футбольным беспорядкам в центральной Германии. Было выделено три типа групп: полностью виртуальные группы, которые до событий не имели между собой никаких контактов в реале, смешанные группы, где часть людей взаимодействовала в реале и все взаимодействовали в социальных сетях и, наконец, реальные группы, все члены которых многократно пересекались и взаимодействовали в реальном мире.
К некоторому удивлению исследователей выяснилось, что наибольшей способностью к самоорганизации обладают не реальные, как это предполагалось до сих пор, а смешанные группы. Под самоорганизацией имелась в виду способность людей на месте события быстро идентифицировать себя как единое целое и, кроме того, увеличивать численность группы за счет включения в нее других участников конфликтов или беспорядков. Оказалось, что реальные группы быстрее всех переходят к действиям, но с трудом коммуницируют с толпой на месте конфликтов или беспорядков. В то же время смешанные группы немногим уступали реальным группам в скорости перехода к тем или иным активным действиям, намного превосходят их по способности вбирать в себя неорганизованных участников конфликтов и беспорядков и просто людей, оказавшихся в это время в соответствующем месте.
Далее исследователи выяснили, что во всех странах наблюдения в смешанных группах наиболее авторитетные их члены связаны между собой не только виртуальными, но и реальными взаимодействиями. При этом число участников смешанной группы, имеющих устойчивые реальные взаимодействия, колеблется, как правило, в интервале от 10 до 25 % от общей численности группы.
Международный центр практик краудсорсинга при стихийных бедствиях опубликовал данные аналитики, которую они провели по отражению в социальных сетях и Twitter наводнения в Новом Орлеане, землетрясения на Гаити, катастрофы вокруг Фукусимы и наводнений в результате разливов Красной реки.
Аналитику для центра вели специалисты Университета И. Лойолы, который, кстати, является поставщиком кадров для разведсообщества, при поддержке лаборатории аналитических методов обработки неструктурированный информации Стэндфордского университета. Было выявлено два новых неожиданных и технологически очень интересных обстоятельства.
Во-первых, оказалось, что социальные сети имеют различную пропускную способность в зависимости от оценочной окрашенности информации. Давно и хорошо известно, что наиболее рейтинговыми передачами на телевидении оказываются различного рода шоу, соревнования и т. п., имеющие, несомненно, положительную окрашенность, несущие позитивные эмоции. В социальных сетях, напротив, скорость распространения и широта охвата негативной информации в 2–2,6 раза превышает аналогичные показатели для позитивных новостей и сообщений. Данные цифры получены впервые и естественно в ближайшее время будут осмыслены и с военных, и с политических, и с коммерческих позиций.
Во-вторых, выяснилось, что люди, оказавшиеся в зоне стихийных бедствий, как это не удивительно, используют социальные платформы и социальные сети достаточно неожиданным образом. До проведения исследований и эксперты, и практики были убеждены, что социальные платформы и сети в зонах бедствия и экстраординарных событий используются, прежде всего, для того, чтобы подать призывы о помощи, просигнализировать властям или добровольческим организациям о необходимости предпринять усилия для спасения тех, кто выходит с соответствующими сообщениями. Оказалось, что такие сообщения составляют по различным регионам от 27 до 38 % от общего числа осмысленных сообщений. При этом наибольший удельный вес призывов о помощи имел место на Гаити и при разливах Красной реки. Наименьший — в Японии.
Самыми распространенными сообщениями, на которые приходилось от 40 до 52 % от общего количества осмысленных сообщений составили твиты и записи в социальных сетях, которые имели своей целью сообщить родным и близким о своем местоположении и самочувствии и наладить с ними эффективное взаимодействие. Фактически речь идет о том, что эти сообщения имели своей целью запустить процессы самоорганизации групп, находящихся в зонах стихийных бедствий. Причем, состав этих групп входили люди, как правило, имеющие тесные связи в реале, либо устойчивое взаимодействие в виртуале. В общем, оказалось, что старая и вечно молодая фраза из еще советского фильма: «Спасение утопающих — дело рук самих утопающих» как нельзя лучше отображает реалии вне зависимости от географической локализации. Наконец, третью группу сообщений составила информация о состоянии инфраструктуры в зонах стихийных бедствий. Как показал дальнейший анализ, эта информация по всем проанализированным районам оказалась на порядки более точной, чем передаваемая в то же время в онлайн режиме информация со стороны государственных и других официальных структур.
Недавно известный американский социолог и психолог П. Голвиттцер опубликовал переиздание книги «Символическая самореализация». В ней впервые на суд экспертов и практиков были представлены результаты более чем семилетних экспериментов, характеризующих взаимоотношения между высказанными намерениями и практически реализованными действиями. Исследования охватили почти 50 тыс. человек в Америке, Европе и Азии. Вне зависимости от региона, культурной принадлежности и возраста, выяснилось, что те, кто хранил свои намерения при себе, были более склонны их достигать, чем те, кто оглашал их и при этом получал высокую оценку от других.
Профессор психологии Нью-Йоркского университета П. Голвиттцер выяснил, что намерение, будучи высказанным и оцененным, формирует самооценку человека и снижает побудительные мотивы к практическим последующим действиям. Поскольку профессор начал свои эксперименты еще в 1982 г., в доинтернетную эру, ему удалось посмотреть на динамику расхождений между намерениями и действиями во времени. Он выяснил, что это расхождение стремительно нарастает и строго коррелируется с повышением доступности интернета и распространением социальных сетей. Отсюда П. Гол-виттцер сделал вывод, что социальные сети имеют еще один неожиданный аспект. Для значительной части населения они выступают как своеобразная машина «забалтывания», блокирования действий за счет коммуникации и одобрения со стороны сообщества высказанной точки зрения. Получив одобрение, люди в некоторой степени теряют побудительные мотивы для осуществления практических, подчас связанных с риском или неприятностями действий.
Как явствует из материалов проведенных в последнее время конференций с участием ведущих американских и британских исследователей, политиков, военных, представителей разведывательного сообщества, бизнеса сложилась четкая точка зрения, что любыми социальными сетями, сообществами и группами можно эффективно управлять, если знать закономерности формирования и динамики, а также характеристики групп любых масштабов и структур. На страницах ведущих американских СМИ мелькает применительно к синтезу технологий Больших Данных и сетевых исследований эпитет «новая ракетная наука». На американском политическом сленге «новая ракетная наука» — это сфера науки и технологий, способная обеспечить максимальные разрушительные и созидательные эффекты, а также имеющая двойное применение, и в военной, и в гражданской областях.
В этой связи хотели бы отметить следующее. Вряд ли стоит ожидать в ближайшие годы появления обобщенного труда, типа известных работ Д. Шарпа и Д. Ная. По сути, речь идет о полусекретных разработках. Однако, в силу особенностей финансирования американской науки, практически все значимые результаты исследований публикуются в открытой печати, как правило, в платных научных журналах, размещенных в так называемом «невидимом» интернете. В этой связи важнейшей практической задачей является каждодневный мониторинг таких публикаций, их своевременная оценка, классификация, включение новых методов в общесистемный арсенал цифровых социумных вооружений и опережающая разработка средств борьбы с новыми угрозами.
3.3. Прогностические вооружения и Большие Данные
Прогнозирование в сфере высшей политики, экономики и военного дела всегда имело амбивалентную, а по-русски говоря, двойственную природу. С одной стороны прогнозирование являлось важнейшей стадией разработки ключевых стратегических, тактических и оперативных решений тех или иных проблем и задач, разработки и реализации крупных проектов и военных компаний. С другой стороны, прогнозирование, подкрепленное мощным информационно-пропагандистским аппаратом, само по себе выступало как своеобразный вид вооружения, способ формирования будущего.
После знаменитых экспериментов американского социолога У. Томаса, прогнозы, подкрепленные соответствующим информационным воздействием, сами по себе формируют реальность. Как гласит теорема Томаса: «Если человек определяет ситуацию как реальную, она — реальна по своим последствиям». Другой американский социолог, а по совместительству советник администраций нескольких президентов Р. Мертон на основе теоремы Томаса опубликовал статью «Самоисполняющиеся пророчества». Самоисполняющееся пророчество — это ложное определение ситуации, вызывающее новое поведение, которое превращает первоначально ложное представление в реальность. Таким образом, теорема Томаса вкупе с технологией Мертона позволяют использовать прогнозирование как мощное оружие в социодинамике, психоинжиниринге, военном деле и бизнесе.
Поэтому вполне очевидно, что с развитием интернета и появлением Больших Данных, представляющих собой, в том числе и огромный поведенческий архив, возникло желание максимально использовать открывающиеся возможности для разработки прогностических вооружений.
При этом к началу нулевых годов профессионалам, работающим в этой сфере, были ясны, по меньшей мере, три фундаментальных положения:
• во-первых, используя самые изощренные и эффективные методы, можно прогнозировать процессы, но не события;
• во-вторых, прогнозы с высокой степенью вероятности можно делать в отношении групп различной размерности, но не отдельных индивидуумов;
• в-третьих, знания о действиях групп и индивидуумов в одной ситуации не позволяет давать точные прогнозы о подобных действиях, осуществляемых в другой ситуации.
Соответственно, оказалось, что различного рода прогнозы, базирующиеся на традиционных выборках, построении сценариев, экстраполяции попросту не работают.
Развитие интернета дало возможность оперировать Большими Данными относительно человеческого поведения, намерений, желаний и т. п. В этой связи специалист номер один в мире по интеллектуальному анализу данных Г. Пятецкий-Шапиро писал: «Прогнозирование на основе Больших Данных состоит в извлечении нетривиальных выводов из заранее известных характеристик, признаков и сведений об объектах».
Использование интернета, как огромного, пополняемого в режиме он-лайн поведенческого архива для прогнозирования развивается по трем ключевым направлениям:
• первое — это прямой интеллектуальный анализ общедоступных данных, предоставляемых поисковыми системами и различного рода социальными сетями и платформами;
• второе — это создание рекомендательных систем, которые прогнозируют различного рода выбор субъектов и групп, и на этой основе рекомендуют им что угодно — от книг до кандидатов в президенты;
• третье — это сложные прогностические системы, использующие разнородные данные, получаемые из открытой и закрытой части всемирной сети, обрабатываемые с помощью всего арсенала интеллектуального анализа данных.
Исторически главный упор был сделан на работу с общедоступными интернет-данными из социальных сетей и поисковых машин. Еще два-три года назад никто не мог помыслить о том, что инструменты веб-прогнозирования будут в благожелательном ключе обсуждаться на сайте головного банка ФРС. Но это произошло. Первым делом, как всегда бывает, за дело взялись академические исследователи, которые в Америке очень даже прагматически настроены и заинтересованы в максимально быстром внедрении их научных разработок в практику. В октябре 2010 г. в кругах инвестиционных аналитиков прогремел доклад Johan Bollen, Huina Mao (Indiana Unviersity), Xiao-Jun Zeng (The University of Manchester) «Twitter mood predicts the stock market».
Ими была сделана программа, которая позволяла использовать сообщения Twitter для прогнозирования движения индекса Dow Jones. Алгоритм работал следующим образом — отбирал из всех Twitter сообщений в режиме реального времени сообщения, маркированные определенными словами, затем удалял эмоционально окрашенные сообщения и на основе обработки нейтральных, эмоционально не окрашенных сообщений выдавал прогноз. Выяснилось, что он позволил предсказывать движение индекса на срок от двух до шести дней с точностью почти до 88 %.
Большое признание в последнее время в Америке получили разработки Р. Петерссона, исследователя из Стэндфордского университета. В качестве неструктурированных данных для прогнозирования он использовал не Twitter, а контент социальных СМИ, т. е. платформ, где контент создают сами пользователи. Таких платформ с качественным контентом в англоязычном интернете насчитывается сотни.
Его исследования были восприняты компанией MarketPsych. Был создан прогностический модуль. Он уверенно дает при достаточно консервативной стратегии 30 % прибыли в год. В настоящее время эта компания приобретена крупнейшим информационным провайдером, всемирно известным Thompson Reuters. Соответственно прогнозы получают подписчики Thompson Reuters, интересующиеся инвестиционной и политической тематикой.
Совсем недавно за разработку системы, аккумулирующей информацию Twitter для трейдинга, взялась компания Titan Trading Analytics. В своей системе они используют 1500 ключевых слов и более 600 факторов. Как видим, создание и практическое использование программ прогнозирования, базирующихся на неструктурированных данных web 2 и прежде всего Twitter, стало сегодня повсеместной практикой инвестиционных, макроэкономических и политических аналитиков.
Огромную роль в современном геополитическом, военном и инвестиционном прогнозировании играют общедоступные данные, связанные с частотой поисковых запросов, которые постоянно публикуют главные поисковики мира, прежде всего, Google и Bing. В нынешней реальности любой поисковый запрос представляет собой фиксацию процесса мышления о чем-то. Он показывает нам объект этого мышления, его последовательность и многое другое. Когда интернет с одной стороны стал доступен для подавляющего большинства жителей в развитых странах в режиме онлайн нон-стоп, а с другой, пользователи приучились к интернету, как к источнику мгновенного получения любой интересующей информации, использование поисковиков для прогнозирования стало возможным.
К настоящему времени независимыми группами исследователей, использующих различные методы и алгоритмы обработки поисковых запросов в целях прогнозирования установлено, что особым образом обработанная статистика поисковых запросов может выполнять роль опережающих индикаторов для целого ряда рынков и экономических параметров. В частности, это относится к динамике безработицы в США, Германии, Франции; динамике потребительских расходов на рынках электроники США, странах ЕЭС, Канаде; ценам на недвижимость США и Великобритании; биржевым индексам на «голубые фишки» на Нью-Йоркской и Лондонской биржах и фьючерсам на биржевой индекс китайских акций на Гонконгской бирже.
Уже полгода Министерство здравоохранения США успешно использует систему, построенную на анализе поисковых запросов для опережающего мониторинга и прогнозирования различного рода эпидемий в стране. На сегодняшний день обнаружено более 50 показателей, относительно которых поисковая статистика Google может быть использована как опережающий индикатор.
Вторым, бурно развивающимся направлением прогнозных вооружений, являются так называемые рекомендательные системы. Эти системы базируются на тщательном анализе поведения человека в сети. При этом анализируются не только его желания, высказанные в виде различного рода поисковых запросах, но и поведение на сайтах крупных интернет-магазинов — например, что человек ищет, как долго рассматривает что-либо и т. п. Используется здесь так называемый неявный сбор данных, когда все действия человека в сети протоколируются. Затем, на основе сложных алгоритмов выдаются рекомендации, которые подталкивают человека к тому или иному выбору. Наиболее известные рекомендательные системы созданы Amazon для книг и других товаров, продаваемых на этой универсальной платформе, eBay, Cinemax.com (рекомендации в отношении фильмов, демонстрируемых в кинотеатрах), Videoguide (для потокового видео) и т. п.
Во время последней избирательной кампании команда Б. Обамы, договорившись с крупнейшими рекомендательными платформами, успешно использовала их опыт для рекомендации Б. Обамы в качестве лучшего выбора для выявленных опять же по специальным алгоритмам колеблющихся избирателей и людей, которые вообще не собирались идти на выборы. По оценкам американских экспертов использование этой системы сыграло едва ли не решающую роль в победе Б. Обамы в кампании 2012 года.
Сегодня крупнейшие банки являются клиентами рекомендательной германской компании Kreditech. Гамбургский стартап Kreditech использует во время принятия решений информацию, почерпнутую из Facebook. Людей, претендующих на получение кредита, просят на время предоставить доступ к их учётной записи в Facebook или других социальных сетях. По словам Александра Граубнера-Мюллера, одного из основателей фирмы, список ваших друзей выдаёт немало. Претендент, приятели которого прилично зарабатывают и живут в хороших районах, имеет больше шансов на кредит. Претендент, знакомый которого отказался возвращать деньги, занятые у Kreditech, ничего не получит.
В качестве одного из наиболее ярких примеров сложных прогнозных систем можно привести проект Recorded Future. В январе 2010 года проект Recorded Future был запущен за счет инвестиций Google, инвестиционного фонда американского разведывательного сообщества In-Q-Tel и собственных вложений К. Альберга — основателя проекта, в прошлом шведского разведчика и известного программиста.
Recorded Future базируется на трех основных блоках:
• Встроенном поисковике третьего поколения. В первом поколении были системы типа Yahoo и HotBot. Они искали просто те или иные слова в документах и выдавали документы в произвольном порядке. Поэтому такого рода поисковики сопровождались каталогами, формировавшимися в основном экспертами на основе поисковой выдачи. Нечто подобное можно до сих пор увидеть на первой странице Rambler. Вторым поколением стал Google. Революция Брина-Пейджа состояла в том, что поисковик стал искать не только по документам, но и в значительной степени по связям между документами или сайтами. Третье поколение ищет не только объекты, соответствующие поисковым запросам, не только связи между документами, но и взаимосвязи между объектами, их характеристиками и отношениями, содержащимися в различных документах. Сегодня это главное направление развития поиска. Оно в полной мере реализовано в Recorded Future.
• Разделении информационного поля на составляющие. В Recorded Future выделено три класса сообщений.
Первый — это сообщения о событиях. События — это длящиеся определенный, достаточно небольшой период времени устойчивые конфигурации, которые характеризуются единством времени, места, участников и т. п. К событиям Recorded Future относит то, что может быть интерпретировано как факты, то, что реально произошло или происходит в данный момент. Второй — это мнения. К мнениям относятся любые сообщения относительно прошлых, настоящих или будущих событий, высказанные в авторитетных источниках, либо авторитетными людьми. В системе есть специальные алгоритмы, которые позволяют для каждой области выделить большую выборку таких источников и персон. Наконец, третий — это реакции. Здесь принимаются во внимание любые спонтанные реакции людей на те или иные ожидаемые события, зафиксированные в различного рода текстовых сообщениях. Не обязательно, чтобы эти сообщения были из авторитетных источников. Главное, чтобы они имели отношение к событиям и мнениям, так или иначе рассматриваемым и высказываемым в авторитетных источниках. Такое разделение на три сегмента информационного поля, как выяснилось, позволяет достаточно хорошо улавливать как господствующие тенденции и опережающим образом реагировать на их изменения, так и выявлять слабые сигналы.
• Рассмотрении интернета, как огромной распределенной сетевой базы неструктурированных данных. Еще у древних греков были знаменитые Мойры, которые пряли нити судьбы, образующие ткань реальности. Сестер было три. Первая олицетворяла, как мы теперь говорим, тренды. Вторая — случайности. Третья — неотвратимость последствий поступков и решений. Собственно Recorded Future использует поисковик, работающий в сегментированном информационном пространстве в масштабе огромной сетевой базы данных. В сетевой базе данных разные объекты и их характеристики связаны друг с другом прямыми, обратными и опосредованными связями. Соответственно, такой подход позволяет выявлять не только явные и очевидные связи, но и вести так называемый латентный анализ, т. е. получать неочевидные, а иногда даже и абсолютно не предполагаемые связи и отношения. К тому же обрабатывать огромное количество информации в алгоритмическом режиме. Т. е. оперировать информационными массивами, непосильными для непосредственной обработки человеком.
В настоящее время Recorded Future используется в трех сферах: государственной разведке и безопасности, в бизнесе, и в финансах для разработки инвестиционных стратегий.
Другим ярким примером прогностических систем нового поколения является платформа Quid. Эта система создана известным американским программистом и разработчиков Ш. Горли на деньги знаменитого Питера Тиля, чья разведывательная программа Palantir является любимым инструментом американского разведывательного сообщества.
Quid занимается прежде всего научно-техническим прогнозированием, поиском тех ниш, которые могут дать максимальный эффект с точки зрения развития технологий в любых сферах, включая сферу вооружения. Одновременно система может быть использована как своего рода организационное оружие, поскольку выявляет, образно говоря, технологические дыры в потенциале любой страны мира. В качестве материала для прогнозирования программа использует Большие патентные Данные, т. е. миллионы файлов, входящих в патентные базы по всем странам мира, а также информацию, почерпнутую из научно-технических, технологических журналов и средств массовой информации.
В основе системы лежит простая, но очень эффективная мысль. Впервые она была высказана более 50 лет назад знаменитым польским мыслителем и фантастом С. Лемом. Идея состоит в том, что техника развивается примерно по тем же законам, что и живая природа. Как известно, в живой природе существует такая ключевая единица, как биоценоз, в который входят различного рода живые виды, составляющие пищевые цепочки, системы взаимодействия и в совокупности полностью заполняющими природный ландшафт. С. Лем предположил, что то же самое происходит в технике. И назвал это техноценозом. Система Ш. Горли обнаруживает такие техноценозы, ищет в них пустые, незаполненные места. Именно эти пустые места оказываются точками роста, где появляются наиболее эффективные и одновременно наиболее прибыльные технические и технологические решения. С другой стороны, если это пятно не будет заполнено, то система техноценоза будет уязвимой, неустойчивой и плохо приспособленной к дальнейшему развитию. За 2,5 года работы компании Ш. Горли ее клиентами стали ведущие американские корпорации, разведывательные и военные структуры.
Таким образом, Большие Данные обеспечили появление новых, на порядки более эффективных, чем раньше, методов прогнозирования научно-технических, инженерно-технологических, инвестиционных, политических, социальных и военных процессов. Эти методы в совокупности с методиками глубокого анализа на основе все тех же Больших Данных позволяют говорить о создании принципиально нового вида вооружений, а именно — прогностических вооружений. Они могут быть использованы как обеспечивающий механизм для разработки и применения традиционных вооружений, так и при определенных условиях, о которых расскажем в следующих статьях, как отдельный, принципиально новый вид вооружений. Более того, они становятся своего рода основой Shadow Power или невидимой силы, которая идет на смену мягкой силе.
3.4. Большие Данные, фруктовые салаты и Большой Брат
Американская психология в отличие от направленности этой науки в других странах мира, прежде всего, в континентальной Западной Европе, России, Великобритании, отличалась подчеркнуто практическим характером. Фактически с первых дней существования на американском континенте, психология сразу же была взята на вооружение рекламистами, политическими пропагандистами и маркетологами. Они рассматривали ее как поставщика инструментов для решения каждодневных, практических задач. Инструментальная направленность американской психологии в значительной мере привела к тому, что ведущие университеты старались заполучить к себе уже известных, прежде всего в Европе, исследователей. Цель была не в том, чтобы создавать научные школы, а использовать уже имеющиеся наработки.
Собственно, таким образом родилось едва ли не господствующее направление в американской психологии, так называемый бихевиоризм. В переводе на русский оно означает науку о поведении. Наиболее яркие фигуры бихевиоризма Дж. Уотсон и Б. Скиннер, не скрывали, что их разработки имеют в основе труды российской психофизиологической школы и, прежде всего, И.П. Павлова, И.М. Сеченова и В.М. Бехтерева.
Бихевиористы считали, что с практической точки зрения бессмысленно использовать различного рода тесты, наблюдения за внутренним миром человека и т. п. Они исходили из того, что базироваться можно только на объективных, т. е. наблюдаемых данных, которые к тому же должны иметь количественное выражение. Бихевиористы полагали, что каждому стимулу соответствует строго определенная реакция человека.
На практике дело оказалось, естественно, более сложным. В своем дальнейшем развитии бихевиористская школа стала учитывать не только реакции человека на те или иные стимулы, но и ситуации, в которых он действует. Наряду с этим, благодаря Курту Левину, бихевиоризм обогатился таким важным элементом, как открытие канального, или тоннельного эффекта. Смысл этого эффекта достаточно прост. Оказалось, что для каждой группы людей существуют внешне незначительные факторы, стимулы или другие характеристики, воздействуя на которые можно добиться заметного изменения в поведении, в том числе в отношении значимых его параметров. Этот вывод был проверен на тысячах добровольцев в сотнях экспериментов.
Наконец, с широким развитием так называемых когнитивных исследований в бихевиоризм пришло понимание того, что люди совершенно по-разному думают в зависимости от уровня сложности и непривычности ситуаций, в которых они оказываются. Одновременно выяснилось, что реальный человек не похож на классического рыночного человека, который все выборы осуществляет рационально, на основе соизмерения плюсов и минусов, доходов и затрат. Человек, особенно в простых, привычных ситуациях, действует в соответствии со стереотипами и сложившимися поведенческими моделями, а, отнюдь, не исходя из детальных экономических расчетов. Что же касается сложных ситуаций, то там в основе выбора лежат опять же не расчеты, а прошлый жизненный опыт, ценности и другие трудно считаемые факторы.
В 70-90-е годы поведенческая психология начала активно использоваться в экономических исследованиях. Появилась так называемая поведенческая экономика. Сегодня это одно из главных направлений не только теоретической мысли, но и политике на государственном уровне, принимаемых решений в частном секторе. Одним из первопроходцев применения поведенческой экономики к финансам стал Джордж Сорос. В теоретическом плане за достижения в области поведенческой экономики Нобелевские премии получили Д. Канеман, Дж. Акерлоф и в 2013 году — Р. Шиллер.
Было бы удивительным, если бы поведенческая экономика, ставшая мейнстримом в маркетинге, рекламе, в финансовом и инвестиционном анализе и т. п. не пришла бы в политику. Решающий шаг в создании поведенческой политики был сделан двумя американскими профессорами, Кассом Санстейном и Ричардом Талером. В 2009 году они опубликовали книгу «Подталкивание: как улучшить решения, касающиеся здоровья, достатка и счастья» (Thaler, Sunstein. Nudge: Improving Decisions About Health, Wealth and Happiness).
Ключевое понятие книги, вынесенное в ее заголовок, — «подталкивание» («Надж») — практически мгновенно вошло в лексикон политиков, юристов, психологов, бизнесменов и т. п. Его стали использовать как для обозначения поведенческой политики, так и сформировавшегося на его основе нормативного подхода к государственному регулированию. Смысл нормативного подхода, сформулированного в книге-манифесте, достаточно прост: «Мы знаем, как сделать вашу жизнь счастливее».
Крайне примечательным является то обстоятельство, что авторами книги были не рядовые американские профессора, а ключевые люди из окружений Барака Обамы и Дэвида Камерона. После опубликования книги К. Санстейн весь первый президентский срок Б. Обамы являлся ключевым лицом в его администрации, а в ходе второго срока был назначен в комиссию по реформе АНБ, состоящую всего из пяти человек. Что же касается Р. Талера, то с 2010 года он является советником премьер-министра Великобритании Д. Камерона.
Что же за магическая технология, этот «Надж»? Он является своего рода квинтэссенцией поведенческой политики, или как ее называют в Америке «нового патернализма». В ее основе лежит тривиальная мысль, что человек — не робот и решения принимает не на основе соизмерения затрат и результатов, а под воздействием многих факторов, включая эмоции, настроения, привычки и т. п. Однако К. Санстейн и Р. Талер не остановились на азах поведенческой экономики, а интегрировали их с другими научными и технологическими достижениями.
Прежде всего, они обратились к достижениям нейропсихологии. Нейропсихологам хорошо известно, что масса мозга составляет примерно 2 % от массы тела. Однако он потребляет в спокойном состоянии до 10 % всей энергии организма. Это происходит, когда человек бездумно серфит в интернете, пьет кофе или болтает с друзьями.
Когда человеку необходимо решить задачу, которая требует размышлений, мозг потребляет до 25 % энергии. А если стоит не обычная задача, а сложная проблема, то расход энергии увеличивается до 35 %. Строго говоря, думать — это очень энергозатратное, и с точки зрения биологического функционирования, зачастую неоправданное занятие.
Поэтому подчас желаемым состоянием человека является лень. И лишь при необходимости он вынужден действовать, а уж тем более, напряженно думать. Однако жизнь устроена так, что думать человеку приходится практически всегда. Чтобы разрешить противоречие между энергетически выгодной ленью и необходимостью мыслить для того, чтобы существовать, а иногда и выживать, человек вооружается привычками, стереотипами, шаблонами действий, поведенческими паттернами и прочими автопилотами. Как говорится, живет «на автомате».
Но, живя «на автомате», человек стремится к удовлетворению своих главных потребностей и получению удовольствий. Поэтому поведенческие стереотипы каждого человека формируются так, чтобы как можно чаще получать удовольствия, и как можно реже сталкиваться с неприятностями и опасностями, а также необходимостью решать сложные проблемы.
К. Санстейн и Р. Талер не ограничились при построении своего метода исключительно достижениями психологии и нейронаук. Как раз к моменту написания их книги начался бум Больших Данных. При этом быстро стало понятно, что Большие Данные тем Больше, чем больше характеристик того или иного объекта, субъекта и т. п. они охватывают, чем больше параметров, характеристик содержится в Данных, и чем чаще эти Данные собираются.
Сегодня в Америке имеется несколько провайдеров данных о людях, социальных группах и компаниях. Крупнейший из них, Аcxiom имеет полный набор данных более чем на 500 млн. человек, включая большинство взрослых американцев и жителей других стран. Общее число параметров цифровой личности каждого человека, включенного в базу компании, в среднем составляет в США около 50.
Однако, самый большой провайдер данных — это американское правительство. Официально это — финансовые, налоговые службы, системы медицинского страхования и т. п. В имеющихся у государства и крупнейших частных провайдеров данных содержится практически все. От номеров социального страхования и водительского удостоверения до историй болезни и взаимоотношений с кредитными учреждениями. От девичьей фамилии матери до перечня мелких административных правонарушений. Третьей составляющей технологии К. Санстейна и Р. Талера стало использование Больших Данных в виде поведенческого архива, т. е. интернета. Как сказал уже упоминавшийся автор триллеров Майкл Маршалл Смит: «Цифровые следы, в отличие от следов на земле, остаются навечно».
Фактически интернет, помимо многого другого, является еще и всеобъемлющим цифровым поведенческим архивом, в котором зафиксирована активность людей в Сети за многие годы. При этом в архиве содержатся данные как о практических действиях, включая различного рода поездки, покупки, обращения к врачам и т. п., так и мысли в виде текстов и, наконец, даже намерения и эмоции, материализованные в коротких записях в социальных сетях, в текстах электронных писем и т. п. Этот архив имеет распределенную архитектуру. Его составные блоки имеются у поисковиков, у владельцев социальных сетей, в крупнейших интернет-магазинах, интернет-сервисах и, конечно же, у структур американского правительства, прежде всего, в АНБ.
Наличие огромного всеобъемлющего поведенческого архива позволило компаниям — владельцам Больших Данных использовать их для предсказания поведения. Проиллюстрируем это широко известной в Америке историей. Однажды в магазин крупнейшей торговой сети Target зашел мужчина и потребовал вызвать менеджера. В своих руках он сжимал огромную кипу купонов магазина, полученных его дочерью.
«Моя дочь получила это по почте! — прокричал он. — Она еще в школу ходит, а вы посылаете ей купоны на детскую одежду и памперсы? Да как вы смеете! Вы хотите таким способом побудить школьниц рожать?»
Менеджер посмотрел на пачку купонов на материнскую одежду, детскую мебель — действительно, они были адресованы дочери рассерженного мужчины. Менеджер принес свои извинения.
Через несколько дней он позвонил мужчине, чтобы еще раз извиниться. По телефону голос отца звучал растерянно. «Знаете, я серьезно поговорил с дочерью, и выяснилось, что в моем доме происходило то, о чем я совершенно не догадывался. Она рожает в августе. Примите мои извинения».
Поэтому Target поставил перед отделом прогнозной аналитики задачу: определить, какая из покупательниц ждет ребенка до того, как это станет очевидно. Проанализировав покупательские привычки беременных женщин, аналитиками была разработана система прогнозирования беременности.
Представим себе ситуацию: молодая женщина заходит в магазин и покупает лосьон с кокосовым маслом, сумку для прогулок и ярко-голубой плед. Программное обеспечение в Target выдаст свой вердикт: вероятность беременности этой покупательницы — 87 %. Данные поступают маркетологам, и теперь Target начнет формировать ее привычки и управлять ими: пришлет ей купон со скидкой на детскую кроватку, присыпку, детские бутылочки и т. д. Причем это будет выглядеть ненавязчиво, чтобы не вызвать волну негодования за «шпионаж»: скидки на товары для детей помещаются среди скидок на другие товары.
«Подталкивание» («Надж») представляет собой использование поведенческих стереотипов, психофизиологических реакций и Больших Данных для целенаправленной коррекции поведения тех или иных конкретных социальных, имущественных, возрастных и т. п. групп. Для коррекции поведения используется открытый Куртом Левиным канальный, или тоннельный эффект. Выбор тех или иных факторов воздействия, которые обеспечивают реализацию этого эффекта, осуществляется на основе предсказательной аналитики и Больших Данных. В бизнесе это используется для увеличения продаж. А в политике, например, для прямого воздействия на электоральное поведение, как во время последних президентских выборов в США.
Прежде чем применить свою технологию на государственном уровне, К. Санстейн и Р. Талер опробовали ее в экспериментальном порядке. Известно, что чипсы, булочки и шоколадки вредны для растущего детского организма. Также не секрет, что, в общем и целом, школьники скорее возьмут на обед пакет вредных чипсов, чем полезный овощной салат. И любые прямые запреты окажутся недейственными, и будут обойдены. Между тем, известно, что выбор потребителей зависит от того, как расположены продукты на полках магазина. Попробуйте заставить школьников есть фрукты вместо чипсов. Невозможно? Можно. Главное, правильно использовать лень и поведенческие стереотипы.
Так, почему бы не воспользоваться этим обстоятельством, и не разложить в школьных кафетериях фрукты и салаты на уровне глаз школьников, а чипсы и булочки — в самых дальних углах, на нижних и верхних полках прилавков, куда надо нагибаться и подтягиваться. Когда К. Санстейн и Р. Талер провели массовые эксперименты в школах Вашингтона, Нового Орлеана, Сиэтла и Коламбуса, оказалось, что в поединке между ленью и вожделением в значительном числе случаев победила лень. В течение трех месяцев более половины школьников отказались от чипсов, и перешли на салаты, фрукты и другое полезное питание.
Затем работа была перенесена в онлайн. Р. Талер стал консультантом британского правительства и при помощи «подталкивания» вывел из тупика застопорившуюся пенсионную реформу в стране. Великобритания, подобно другим странам, столкнулась с растущим дефицитом в пенсионной системе и была вынуждена перейти к накопительной системе начисления пенсий. Однако, получив свободу выбора, значительная часть граждан не стала откладывать на старость, и проблема еще больше обострилась. Тогда по предложению созданной правительством поведенческой команды во главе с Р. Талером, после анализа Больших Данных была сформулирована рекомендация. Суть ее состояла в том, что компании должны автоматически включать работников в накопительную пенсионную схему, предоставив им право при желании отказаться от нее. Англичане решали, какой пенсионный план выбрать, при помощи портала пенсионной реформы.
До рекомендаций Р. Талера человек должен был сначала прочитать длинные рекомендации, написанные не всегда понятным для простого человека языком, а затем самостоятельно поставить галочку против выбранного варианта. Р. Талер предложил изменить ситуацию. Место рекомендаций заняли короткие, изложенные ясным слогом разъяснения плюсов и минусов каждого варианта, а галочку человек доложен был ставить, если он отказывался от накопительного варианта и выбирал другой из нескольких предложенных. Накопительный вариант стал выбором по умолчанию. Казалось бы, и в первом, и во втором случае за гражданами оставалась свобода выбора. Но с практической реализацией рекомендаций Р. Талера число граждан, перешедших на накопительную схему, значительно возросло. Лишний раз подтвердилось, что поведение человека зависит не только от самой по себе дилеммы выбора, а и оттого, как она формулируется и в каких условиях реализуется.
Летом 2013 года объявлено, что команды по использованию «Надж» создаются в большинстве министерств США, связанных с социальными вопросами. На них возложена задача «подталкивания» американцев к правильным с точки зрения правительства решениям не на основе объяснений, а путем использования поведенческих стереотипов, привычек и психофизиологических реакций. При этом американские СМИ высказали подозрение, что команды «Надж» создаются и в других, в том числе, разведывательных ведомствах. Однако их финансирование реализуется через секретные статьи бюджета, и поэтому их существование не афишируется.
Профессионалы «Надж», развивая поведенческую политику, исходят из нескольких основных принципов:
1. Для решения своих поведенческих проблем люди нуждаются во вмешательстве третьих лиц. Наилучшим кандидатом на эту роль является государство.
2. Эксперты, изучая то влияние, которое в реальной жизни оказывают на благосостояние те или иные акты выбора, принимают от имени индивидов решения лучше тех, на которые индивиды способны сами.
3. Любые стимулирующие схемы, которые возлагают на людей ответственность за последствия их прошлых действий, неэффективны. Вместо них необходимы схемы, которые немедленно вознаграждают или наказывают людей за будущие последствия их текущих действий — последствия, которые сами они неспособны осознать и учесть.
4. С точки зрения политики то, как люди ощущают себя в обществе, важнее того, что они желают, или того, что они делают.
Фактически, сегодня в Великобритании и США реализуется концепция подлинного Большого Брата. На уровне государственной политики реализуется принцип: правительство лучше знает, что хорошо, а что плохо для людей, и поэтому вправе незаметно подталкивать их к тем решениям, которые оно считает правильными. Ключевую роль в этой технологии играют Большие Данные. Именно Большие Данные позволяют как угодно, в зависимости от поставленной задачи проводить классификацию групп и ситуаций, осуществлять анализ и прогноз, а главное, искать тоннельные или канальные факторы, обеспечивающие нужное поведение целевых групп в конкретных ситуациях. И, наконец, в режиме онлайн отслеживать эффективность подталкивания.
В отличие от многих других технологий, «Надж» не слишком широко рекламируется. Можно говорить о том, что правительства стараются сохранить полную монополию на эту технологию, не допустить ее широкого распространения в коммерческом секторе. Б. Обама как-то даже назвал группу специалистов по «Надж», подготовленную К. Санстейном, бихевиористской командой мечты, способной решать важнейшие государственные задачи. Кстати, эта команда сыграла заметную роль во второй президентской кампании Б. Обамы на выборах 2012 года.
Следует подчеркнуть, что в ходе практического применения технологии «подталкивания», как в Великобритании, так и в США осуществлялась не выборочное, а практически поголовное наблюдение при помощи самого изощренного интернет-инструментария, насколько применение «Надж» осознается населением. Выяснилось, что действие этой технологии практически не осознается.
Стоит отметить, что при наличии соответствующих Больших Данных нет никаких ограничений для использования технологии «Надж» не только в отношении граждан собственной страны, но и населения любых государств мира. При наличии соответствующих Больших Данных «Надж» может рассматриваться как сверхэффективное информационно-психологическое оружие следующего поколения. Хотя, с учетом принципов и технологий, на которых построена система «Надж», более точным является не привычное наименование информационно-психологического оружия, а скорее отнесение технологии «подталкивания» к поведенческому оружию, базирующемуся на Больших Данных, достижениях объективной психологии и нейронауках.
3.5. О чем умолчал Э. Сноуден
В любой спецоперации все прямо и косвенно причастные акторы стремятся реализовать собственные цели. Не является исключением и эпопея Э. Сноудена. Вполне очевидно, что Э. Сноуден хотел раскрыть глаза американскому и мировому общественному мнению на незаконные методы деятельности АНБ, тотальную слежку и прослушку. В то же время нельзя не отметить, что большая часть разоблачений Э. Сноудена, при всей их сенсационности, не открыла чего-то нового для экспертов и специалистов в сфере разведки. Практически все, о чем поведал Э. Сноуден, было известно до него. Хотя и без деталей, подробностей, названий конкретных программ, размеров ассигнованных сумм и т. п. Конечно же, эти детали перевели предположения экспертов из разряда гипотез в сферу конкретных фактов и документированных мнений.
Однако интересно посмотреть, каких разделов коснулись разоблачения Э. Сноудена. В основном речь шла о нарушении приватности не только иностранцев, но и граждан США, прослушивании телефонных разговоров не только рядовых американцев, но и глав стран — союзников США, контроле со стороны АНБ за финансовыми транзакциями, осуществляемым по самым разнообразным потокам, программам развития кибервооружений и т. п. Все это произвело чрезвычайно большое впечатление и имеет до сих пор серьезные последствия как для престижа США, так и для межгосударственных отношений. Несомненно, это сказалось и на доходах компаний, упомянутых в разоблачениях Э. Сноудена.
Тем не менее, есть устойчивое впечатление, что АНБ использовало эпопею Э. Сноудена, уж коль скоро она произошла, как стандартную операцию прикрытия в отношении действительно главной, до сих пор тщательно скрываемой задачи, решаемой Агентством Национальной Безопасности и другими государственными структурами США при его содействии. Речь идет о разработке и практическом использовании технологий управления групповым и массовым поведением в других странах мира, как в странах-союзниках, так и противниках Соединенных Штатов Америки.
Нетрудно заметить, что в материалах Э. Сноудена вообще не содержится информация на эту тему и соответственно может возникнуть предположение, что тезис об управлении групповым поведением сколь угодно большой размерности имеет отношение не к фактическому положению дел, а к конспирологии. Причем, конспирологии, понимаемой не в смысле научного, фактологического расследования, а в традиционной трактовке, как измышления незрелого ума и порождения неустойчивой психики.
На сегодняшний день существует достаточно большое количество имеющихся в открытой печати, а также в специализированных публикациях данных и фактов, подтверждающих высказанный выше тезис о переходе США к скрытому управлению поведением.
Первое. Начать, несомненно, надо с наиболее наглядного, что называется материализованного свидетельства практической постановки задачи управления поведением. Речь идет о только что отстроенном, оснащенном и выводимом на расчетную мощность циклопическом центре АНБ в штате Юта. Понятно, что для целей шпионажа, радиоэлектронной разведки, криптографии и проч. требуется гигантский объем хранилищ данных. Однако, для них не нужно хранилище объемом в один йоттабайт, которое расположено в новом Дата-центре в штате Юта. Чтобы наглядно понять, о чем идет речь, отметим, что весь ежегодный интернет-трафик, включая собственно интернет, интернет вещей и проч. приближается в настоящее время к одному зеттабайту. Тем самым в Юте имеется хранилище для 100-летнего мирового интернет-трафика. Однако размерность сразу уменьшается в том случае, если не просто хранить трафик, т. е. данные всех типов, а обрабатывать их различными способами, для чего представлять данные в виде самых различных классификаций. Иными словами, не для чего иного, как для интеллектуального анализа сверхбольших объемов данных такое хранилище просто не нужно.
Второе. В США, в отличие от других стран, еще в 1994 г. была создана специальная широкополосная сеть для совместного межведомственного использования ресурсов (аппаратных и программных) суперкомпьютеров.
Фактически в Соединенных Штатах в отличие от других стран суперкомпьютерная сеть не разделена ведомственными и корпоративными барьерами, а функционирует как единое целое. Более того, в начале нулевых годов американцы договорились с Великобританией, что к этой сети подключаются и британские суперкомпьютеры. Это весьма важно, поскольку согласно международным оценкам, лидером по эффективности использования суперкомпьютеров в секретных проектах выступает именно Великобритания. Данных по этой сети нигде нет, но различного рода косвенные расчеты позволяют утверждать, что мощность этой сети составит от половины, до двух третей суммарной мощности всех 500 суперкомпьютеров, входящих в настоящее время в мировой рейтинг. Наиболее мощные суперкомпьютеры, входящие в сеть, принадлежат АНБ, Министерству энергетики США, британской разведке и американским университетам, тесно работающим с военно-разведывательным комплексом. С 2014 года общее руководство сети осуществляет Киберкомандование США.
Третье. За последние четыре года Соединенные Штаты истратили несколько сот миллионов долларов на разработку программ интеллектуального анализа не просто Больших, а сверхбольших массивов данных. Примечательно следующее обстоятельство. В коммерческом секторе для анализа Больших Данных в основном используются методы математической статистики. В то же время, анализируя гранты таких агентств, как DARPA и IARPA, можно увидеть, что средства затрачивались на разработку программ по анализу и прогнозированию на основе Больших Данных, базирующихся на принципиально новых разделах математики, типа теории категорий и функторов, на системах распознавания образов, нейронных вычислениях и так называемом глубоком машинном обучении. Все эти методы на порядки превосходят с точки зрения выявления нетривиальных зависимостей и связей, мощности и точности прогнозирования, методы стандартной математической статистики, которые описываются как основной инструмент во всей специализированной литературе по Большим Данным.
Четвертое. Последние годы в США предпринимаются организационные и законодательные меры по обеспечению потребностей разведсообщества Большими Данными. Прежде всего, следует иметь в виду, что само по себе Агентство Национальной Безопасности является обладателем крупнейших массивов Больших Данных, которые оно получает в результате своей шпионской деятельности, о которой мир сегодня неплохо осведомлен благодаря разоблачениям Э. Сноудена.
Гораздо менее известна организация FSD. В переводе на русский она может быть названа Службой Федеральных Данных. Главным ее назначением является концентрация данных об американцах, которые собирают практически все федеральные ведомства, министерства, агентства и т. п. Без преувеличения можно сказать, что не в одной стране мира нет такой подробной базы данных на своих граждан, как в Соединенных Штатах, и содержится эта база не в АНБ, а в неприметной организации с указанным выше названием. При этом надо иметь в виду, что в данную организацию дополнительно стекаются все данные из страховых компаний, банков, пенсионных фондов, авиакомпаний и т. п. под американской юрисдикцией. Соответственно, если те или иные люди застрахованы в американской компании, обслуживаются американскими банками или банками, имеющими корреспондентские счета в американских банках, летали американскими авиалиниями или используют американские кредитные карты, типа Visa, American Express и т. д., то все их данных также попадают в эту организацию, а оттуда — в Центр Больших Данных АНБ.
Э. Сноуден не просто рассказал, а даже показал на слайдах связь с АНБ крупнейших интернет-компаний и телекоммуникационных гигантов. В результате произошел большой скандал. Компании сначала протестовали, затем сообщили, что вносят соответствующие требования в Конгресс США о том, чтобы прекратить практику использования их данных в интересах АНБ. Однако от публики, и даже большинства экспертов укрылось крайне важное обстоятельство. Речь в протестах идет о персональных данных, т. е. данных, по которым можно идентифицировать пользователя как Ивана Ивановича Иванова, либо Джона Смита Третьего и т. п.
Большие же Данные — это не персональные данные. В принципе, персональные данные могут быть Большими Данными, а могут и не быть. Более того, для технологий Больших Данных сама по себе идентификация конкретного человека не важна и не интересна, потому что связи и закономерности, выявляемые при помощи Больших Данных, имеют статистический характер, а не касаются судьбы конкретного индивидуума. Про Большие Данные речь в разоблачениях Э. Сноудена вообще не шла.
Практически все крупнейшие провайдеры Больших Данных, а ими являются Google, Facebook, Twitter, Amazon, eBay и т. п., имеют американскую юрисдикцию. Между тем, в антитеррористическом законе США, именуемом как «Акт 2001 года, сплачивающий и укрепляющий Америку обеспечением надлежащими орудиями, требуемыми для пресечения терроризма и воспрепятствования ему» и Указе № 13603 от 16 марта 2012 г. подписанном Президентом Б. Обамой, озаглавленном «О готовности ресурсов национальной обороны» четко прописаны обязанности американских компаний с точки зрения национальной обороны.
В число этих обязанностей входит предоставление данных, потребных для выполнения задач национальной обороны. Известно, что Большие Данные подпадают под юрисдикцию этих указов. Причем, если в отношении персональных данных вообще и американцев в частности предусмотрены некоторые ограничения, связанные с необходимостью решений Секретного Суда для получения таких данных, то Большие обезличенные Данные должны предоставляться что называется в рабочем порядке по требованию.
Важно, что такие данные должны предоставлять не только американские компании — провайдеры Больших Данных, либо брокеры данных, но и компании, которые котируются на американском биржевом рынке. Последние два обстоятельства нуждаются в некотором пояснении. В Соединенных Штатах существует целый ряд крупнейших компаний, которые покупают данные по всему миру у других, как правило, у торговых компаний и перепродают их транснациональным корпорациям для целевого, или как его еще называют таргетированного маркетинга, и т. п. В их числе Acxiom, Experian, Epsilon и т. п.
Кроме того, практически все крупные международные интернет-компании котируются на NYSE, либо на Nasdaq. Соответственно, и эти компании при получении запроса под угрозой лишения листинга также должны передавать обезличенные Большие Данные американскому правительству, а иными словами АНБ. При этом то, что они могут иметь иную юрисдикцию и действовать в далеких от Америки регионах, не является препятствием для этих обязательств.
Подытоживая можно сказать, что АНБ сегодня имеет доступ к подавляющему большинству Больших Данных, имеющихся в мире. Некоторые высказывают точку зрения, что исключением является Китай. Однако другая часть специалистов не без основания полагает, что и китайские Большие Данные в немалой степени оказываются в США через американских и британских брокеров данных.
Пятое. В течение последних полутора лет в Соединенных Штатах прошел целый ряд научных конференций, круглых столов и заседаний, инициированных теми или иными «думающими танками», среди которых выделяется Институт сложности в Санта-Фе. В этих мероприятиях участвовали ведущие исследователи и разработчики в сфере Больших Данных, руководители департаментов поведенческого маркетинга и таргетированной рекламы, специалисты в сфере прогнозирования на основе Больших Данных — с одной стороны, и высокопоставленные правительственные чиновники, представители разведывательного сообщества и члены британской и американской правительственных программ «Надж» — с другой. Например, на одной из такого рода конференций с основным докладом Strategic potential of big data for National Security выступила исполнительный директор IARPA Катарина Марш.
Как правило, в большинстве такого рода мероприятий принимали участие один из ближайших советников Б. Обамы, участник группы по реформе АНБ Касс Санстейн, Ричард Талер, его соавтор по книге «Надж» и Алекс Пентланд. Алекс Пентланд недавно включен журналом «Форбс» в число семи самых влиятельных исследователей в области информационных технологий. Он руководит несколькими лабораториями в знаменитом МТИ, входит в число советников нескольких компаний из списка Форчун-500, консультирует правительство США.
Чтобы понять, о чем шла речь на этих мероприятиях, достаточно процитировать одну из статей Алекса Пент-ланда. «Я уверен, что значение Больших Данных состоит в том, что они дают информацию о поведении людей, а не об их убеждениях… Понятие Больших Данных и наука о сетях находятся за гранью обычных подходов к проектированию социальных структур… Адам Смит и Карл Маркс ошибались, или, по меньшей мере, предлагали только половинчатые решения. Почему? Потому что они строили свои теории на основе усредненных понятий рынка и классов. И хотя, безусловно, рассуждение в таких терминах тоже может быть полезным, однако очевидно, что социальные феномены на деле состоят из миллионов мелких транзакций между индивидами. Существуют отдельные примеры межличностных взаимодействий, которые не просто не укладываются в усредненные параметры, а являются причиной социальных вспышек и потрясений, таких как Арабская весна. Придется снизойти до этих мельчайших примеров, этих микропримеров, потому что они позволяют понять социальное устройство вне усредненных показателей. Мы вступаем в новую эру социальной физики, где решающий исход будет зависеть от самых мелких деталей, от таких мелочей, как ты да я… Сам факт того, что мы теперь сможем отслеживать динамику социальных взаимодействий и их происхождение, что мы больше не будем ограничены усредненными показателями, такими как рыночные индексы, вызывает во мне трепет. Мы будем способны предсказывать и управлять поведением рынков и возникновением революций».
На этих конференциях родился пока еще не получивший широкого признания термин hidden power, или «невидимая сила».
Вполне очевидно, что представленные факты носят комплиментарный, т. е. дополняющий друг друга характер и показывают целостную картину завершающего этапа создания технологической системы управления групповым и массовым поведением любой размерности в иностранных государствах для реализации интересов США или наднациональной финансово-корпоратократической элиты.
Итогом такого управления должно стать превращение субъектов мировой политики, экономики и т. п. в объекты, находящиеся под внешним, невоспринимаемым руководящим воздействием. Для того, чтобы этого не случилось, необходимо в крайне сжатые сроки осуществить комплекс весьма интеллектуалоемких, высокотехнологичных мер, подкрепленных целым рядом обеспечивающих мероприятий, требующих затрат ресурсов и принятия новых юридических актов на государственном уровне.
3.6. Большие Данные в России: императивы ситуации
В течение последнего года практически ежемесячно, а то и чаще в стране проводятся различного рода конференции по Большим Данным. О чем же идет речь на подобных конференциях? Так на Global Entrepreneurship Congress 2014 «Большие возможности Больших Данных», как сообщают электронные СМИ «участники дискуссии привели многочисленные примеры использования технологий Big Data и связанной с этим серьезной экономии средств компаний. Среди таких примеров — система анализа поведения оборудования самолетов, предсказание сбоев и поломок и упредительная замена изношенных частей в аэропорту, в который направляется конкретное воздушное судно; анализ открытых спутниковых данных для оптимального планирования парковок; управление показами рекламных баннеров на сайте в зависимости от того, какую именно покупку совершает пользователь с помощью своей кредитной карты; сервис, информирующий автовладельцев о планах городских властей произвести ремонт или уборку улицы в том месте, где они оставили припаркованный автомобиль; прогнозирование спроса на отдельные наименования товаров и управление складами онлайн-магазинов; использование беспилотных аппаратов для сбора информации о состоянии линий электропередач в отдаленных районах, которое приводит к исключению ненужных дальних поездок сервисных бригад; наконец, использование сенсоров на лопастях ветряных мельниц, данные с которых помогают спрогнозировать, откуда именно поступит электроэнергия в следующую минуту (поскольку цены на электроэнергию на глобальном рынке меняются ежеминутно, экономия измеряется миллионами долларов».
Конечно обсуждение «ветряных мельниц» и рекламных баннеров на сайтах впечатляет, но куда важнее следующие обстоятельства:
во-первых, на всех подобных конференциях речь идет о Больших Данных в их вчерашнем, а то и позавчерашнем понимании. Большие Данные, как правило, связываются исключительно с бизнес-аналитикой и с возрастанием объемов, многообразия и скорости передачи данных. Так понимали Большие Данные в США, Европе, Японии три-пять лет назад, когда собственно и появился этот термин;
во-вторых, на конференциях рассуждают, как правило, о будущем времени. По мнению большинства участников, например, одного из руководителей компании Форс — Центра внедрения Oracle О. Горчинской, «Практически нет проблем с наличием и доступностью технологий Больших Данных, готовностью поставщиков и интеграторов к их внедрению. Но в большинстве своем российские организации пока еще только присматриваются к таким решениям»;
в-третьих, ключевыми докладчиками, а то и организаторами таких конференций выступают, прежде всего, зарубежные компании, в первую очередь IBM, Oracle, SAP и т. п. Безусловно, взаимовыгодное, многостороннее сотрудничество с транснациональными гигантами IT-индустрии весьма полезно и выгодно как для российской экономики, так и для российских разработчиков. Углубление такого сотрудничества соответствует интересам бизнеса, способствует оптимальному углублению разделения труда в IT-сфере в глобальном масштабе.
Однако, в нынешней непростой геополитической обстановке нельзя закрывать глаза на одно неочевидное обстоятельство. Сегодня все зарубежные СМИ полны аналитическими статьями об использовании Россией энергетических ресурсов в качестве своеобразного геополитического оружия и средства достижения национальных целей. В этой связи вполне закономерно и логично предположить, что США, являющиеся бесспорными лидерами в сфере информационных технологий, также рассматривают их как своего рода технологическое оружие и средство научно-технического, экономического и геополитического давления.
Зарубежные специалисты полагают, что рынок в сфере Больших Данных в России достаточно ограничен с точки зрения готовности российских потребителей к использованию кластера этих технологий. Однако представляется, что подобная ограниченность не является единственной причиной повестки дня конференций. Другая, непроговариваемая причина состоит в том, что, по сути, зарубежные производители программных продуктов, связанных с Большими Данными, навязывают российскому рынку своего рода «консервирующую динамику». Эта динамика закрепляет отставание российской экономики вообще, и IT-отрасли в частности от зарубежных конкурентов и поддерживает господство зарубежных производителей на этом стратегическом сегменте IT-рынка.
Любой профессионал в сфере Больших Данных на вопрос, какие темы сегодня обсуждаются на конференциях по Большим Данным за рубежом, ответит, что там речь идет, в первую очередь, о так называемой «предсказательной» аналитике, поведенческом маркетинге на основе Больших Данных, экспертных системах, базирующихся на когнитивных вычислениях Больших Данных и т. п. Ни о чем подобном в практическом плане на российских конференциях, организованных транснациональными IT-компаниями, речи не ведется.
Как же быть в сложившейся ситуации?
Представляется, что начинать сегодня наверстывать упущенное и повторять уже пройденный путь вряд ли целесообразно. В подобном случае российский IT-сегмент Больших Данных, обслуживающий, в том числе, не только интересы бизнеса, но и государственного управления, включая вопросы национальной безопасности, окажется вечно отстающем. Видимо, есть смысл сразу задуматься о реализации решений завтрашнего дня. Тем более, предпосылки в виде отечественной математической и программистской школ, кадрового потенциала, финансовых ресурсов и т. п. в нашей стране имеется.
Что же будет выступать завтрашним днем Больших Данных? Чтобы ответить на этот вопрос, необходимо внимательно присмотреться к наиболее динамично развивающимся направлениям сегодняшнего дня. Среди них выделяются:
• Третья производственная революция с массовой роботизацией, автоматизацией производства, внедрением 3D-печати, базирующаяся на информационных технологиях и Больших Данных, как на несущей конструкции;
• повсеместное распространение «интернета вещей» и ускоренный переход от «интернета вещей» к «интернету всего». «Интернет всего» предполагает, что к всемирной сети будут подключены практически все устройства, предметы и инфраструктуры во всех сферах жизнедеятельности социума и отдельного человека;
• широкое распространение автоматизированных систем поддержки и принятия решений на основе Больших Данных. Наиболее значительным прорывом в этой сфере на сегодняшний день стали системы высокочастотного, полностью роботизированного трейдинга. Ежедневно эти системы при минимальном участии человека или без оного, осуществляют торговые сделки, измеряемые сотнями миллиардов долларов. Ширится мнение, что на высокочастотном трейдинге отрабатываются человеко-машинные и автоматизированные системы принятия решений для сложных и сверхсложных систем.
Все три магистральных направления развития информационных технологий ведут к появлению в ближайшем будущем распределенных самообучающихся систем когнитивных вычислений. Поясним, о чем идет речь на самом простом примере. Всем хорошо известно, что Google активнейшим образом развивает программу полностью автоматизированных автомобилей, способных к нормальной эксплуатации в напряженной городской среде. В рамках этой программы реализуется следующий важнейший принцип. Каждый автомобиль снабжен как автономным бортовым компьютером со встроенной программой машинного обучения, так и подключением к общей базе сверхбольших Данных для всех эксплуатируемых автомобилей. Т. е. на каждой дорожной ситуации, на каждом ЧП, в которое попадает машина, программа учится, находит имеющиеся в ней ошибки, устраняет их с тем, чтобы в последующем не попадать в подобные ситуации. В этом смысле машина, пускай грубо, но имитирует принцип жизнедеятельности человека, который, как известно, учится на собственных ошибках. Одновременно программа сообщает о найденной ошибке, ее решении в общую распределенную базу сверхбольших Данных, к которой подключены все автомобили. Тем самым, каждая машина учится не только на собственных ошибках, но и на ошибках, которые совершаются другими автомобилями. Более того, найденное программой одного автомобиля удачное программное решение становится достоянием всех. Фактически мы имеем дело со своего рода стаей, соединенной тесными связями взаимного обучения. Применительно к производственным роботам подобная программа сейчас реализуется в Германии. К роботам, занимающимся уборкой домов — в Японии.
О чем это все говорит? Мы видим, что повсеместно Большие Данные используются для коллективного обучения и выработки все более эффективных решений.
Фактически это, по сути, является имитацией памяти и логического мышления. Ведь память тоже аккумулирует знания о прошлом, о том, что удалось и не удалось, закрепляет удачные образцы, которые в дальнейшем и используются в поведении и, как открыл П. Анохин, в опережающем реагировании на изменения внешней среды.
Сначала человек использовал только возможности своего физического тела и соответственно своей психофизиологической памяти. Всем хорошо известно, что помнит человек практически все, но вот использовать все, что находится в памяти, не может по многим причинам.
В дальнейшем, с появлением развитых языков и письменности, человек, по сути, выстроил вторую, коллективную память, где фиксировались индивидуальные и групповые успехи и неудачи, к которым мог иметь доступ любой участник социума. В этом смысле тексты, фильмы, аудиозаписи и т. п. представляют собой память «второго рода».
Несложно заметить, что Большие Данные есть не что иное, как память «третьего рода», ориентированная на эксплуатацию человеко-машинными системами. Эта память имеет распределенный характер, в ней ничего не забывается, к ней постоянно открыт доступ, она используется в режиме 24/7 и построена так, чтобы быть удобной для применения мощнейших средств интеллектуального, прежде всего, математического анализа. Наконец, мощность этой памяти и возможность обработки хранящейся в ней информации при помощи самых различных методов значительно превышает мощность любого индивидуального интеллекта.
В этом смысле создание действующих систем хранения, обработки и восприятия Больших Данных, как памяти «третьего рода» является прорывом, сравнимым с появлением самих по себе компьютеров, а также других эпохальных технических решений. При этом в данном случае речь идет не только о чисто техническом, но о социотехническом решении, которое затрагивает все стороны практической жизни людей. Также понятно, что создание и эксплуатация памяти «третьего рода» становится одним из решающих преимуществ, обеспечивающих ее обладателям доминирование в любых сферах жизнедеятельности.
В этой связи с особой остротой встает тема, которую в течение последнего года активнейшим образом разрабатывает один из самых известных людей в российской IT-индустрии Игорь Ашманов. Это тема информационного суверенитета.
Информационный суверенитет — это «возможность государства управлять информацией». Информационный, или цифровой суверенитет, как справедливо отмечает И. Ашманов, включает несколько компонентов. Это и техническая инфраструктура, и программные продукты, и собственные поисковые системы, и социальные сети и т. п.
В ближайшем будущем несущей конструкцией и ключевым ресурсом, определяющим цифровой суверенитет, становятся Большие Данные, как «третий вид памяти». Именно Большие Данные аккумулируют в себе архивы поисковых систем, социальных сетей, торговых платформ, бизнес- и государственные базы самого различного рода и т. п.
Особо проблема цифрового суверенитета обостряется в современном мире. Не секрет, что сегодня происходит не только слом однополярной мировой системы, но и де-факто мир прощается с Потсдамской системой мироустройства. Реальностью становится тот факт, что все большую роль в международных отношениях начинает играть не право, а сила.
Собственно, процесс этот начался давно. Наиболее ярко он проявил себя в конце 90-х г. в связи с распадом бывшей Югославии и событиями в Косово. Сегодня же мы являемся свидетелями конца монополии на односторонний демонтаж прежнего миропорядка. Прекрасно отдавая себе отчет в возрастании значения силового компонента, Соединенные Штаты и их союзники одновременно не испытывают иллюзий относительно возможностей применения наиболее разрушительных видов вооружения. По мнению большинства экспертов ни Соединенные Штаты, ни Западная Европа не технически, не организационно, не, главное, ментально, не готовы к серьезной «горячей» войне.
В этой связи последние 30 лет, прежде всего, в США и Великобритании ведется неустанный поиск новых видов вооружений, которые позволяют реализовать Оруэлли-анскую концепцию: «мир — это война, свобода — это рабство». Первыми в ряду этих вооружений были кажущиеся сегодня простыми информационно-психологические вооружения, базирующиеся на традиционной пропаганде и достижениях классической психологии. Затем стали использоваться более изощренные технологии программирования деструктивных действий в виде «цветных» революций и т. п.
Не секрет, что до сих пор наиболее обсуждаемыми темами среди российского экспертного сообщества остаются темы «цветных» революций, так называемого «управляемого хаоса» и т. п. Между тем, эти темы всерьез уже перестали рассматриваться западным военноразведывательным сообществом как последние, и наиболее совершенные военные технологии. При этом в США, Великобритании и т. п. продолжают активно издаваться книги по «цветным» революциям, управляемому хаосу, деструктивным восстаниям и т. п. Проводятся соответствующие конференции. Однако ничего принципиально нового на них не появляется. Детальный анализ участников конференций и авторов книг, а также конструктивное рассмотрение их содержания показывает, что последние полтора-два года подобные мероприятия выполняют скорее отвлекающую роль. Фактически есть основания полагать, что эта работа в немалой степени стала элементом большой операции прикрытия и дезинформации, направленной на отвлечение интеллектуальных усилий цивилизационного противника.
На практике же главные усилия сосредоточены на разработке принципиально нового поколения вооружений, так называемых «поведенческих» вооружений. Поведенческие вооружения базируются на трех китах: во-первых, Больших Данных, как памяти «третьего рода», во-вторых, когнитивных вычислениях, объединяющих мощь математических методов с пусть грубой, но уже имитацией работы человеческого мозга и, в-третьих, аккумуляции и использовании достижений поведенческой психологии.
Как показывает анализ видимого и невидимого сегментов интернета, подавляющая часть публикаций на эту тему засекречена. Можно найти лишь отдельные фрагменты, куски работ или исследований, касающихся этих тем, но прямо не связанных с военно-разведывательной тематикой. Тем не менее, недавно появились прямые доказательства разработки, по крайней мере, в США и Великобритании, поведенческих вооружений, ориентированных на скрытое управление групповым поведением коллективов различной размерности. Так, в конце прошлого года Институт оборонного анализа, финансируемый Пентагоном, разведывательным сообществом и Государственным Департаментом опубликовал документ «Pathways to Cooperation between the Intelligence Community and the Social and Behavioral Science Communities». В нем упоминается, что в 2013 году было проведено большое совещание по программе «Minerva Research Initiative». Это закрытая программа IARPA в области управления групповым поведением на основе Больших Данных, которая получила статус стратегической важности с точки зрения национальной безопасности США.
В подготовленном в прошлом году министерством обороны Великобритании докладе «Global Strategic Trends out to 2040» в качестве одной из целей ближнего прицела также выделено скрытое управление групповым поведением на основе Больших Данных. Этот доклад в определенной степени стал осмыслением британского военного бестселлера последнего года, книги бывшего командующего британскими подразделениями в Северной Ирландии, Косово, Ираке, Ливане и Афганистане генерал-майора Э. Маккея и коммандера С. Тота-ма «Поведенческий конфликт» (Behavioural Conflict: Why Understanding People and Their Motives Will Prove Decisive in Future Conflict). Выводом книги стали следующие слова: «Наша способность понять и незаметно изменять поведение групп людей станет определяющей характеристикой вооруженных конфликтов нового типа».
Нет сомнений, что в современной сложной геополитической ситуации Большие Данные являются стратегическим ресурсом и приоритетом не только развития экономики и социума, но и важнейшим вопросом обеспечения национальной безопасности. В этой связи представляется целесообразным:
во-первых, сориентировать Фонд развития интернетинициатив, Фонд Сколково и Фонд перспективных исследований на государственное и негосударственное финансирование стартапов и отечественных разработок в сфере Больших Данных, нацеленных в первую очередь на межотраслевое использование, а также решение задач в области охраны правопорядка и решения задач национальной безопасности;
во-вторых, организовать в ведущих университетах страны с мощными математическими школами и кафедрами по программированию, системному анализу, лингвистике и т. п. кафедры Data science (наука о данных). В оперативном режиме открыть при кафедрах магистратуры и группы ускоренного обучения Data science и когнитивным вычислениям. Организовать перевод на русский язык имеющихся онлайн видеокурсов по Большим Данным, когнитивным вычислениям и поведенческому анализу;
в-третьих, провести научно-практическое совещание по использованию Больших Данных, когнитивных вычислений и поведенческих наук для прогнозирования и противодействию скрытому управлению поведением. В рамах подготовки к совещанию осуществить инвентаризацию отечественных разработок и имеющихся кадров по указанному направлению;
в-четвертых, организовать с привлечением лучших вне зависимости от академических званий и занимаемых должностей специалистов межотраслевые и вневедомственные коллективы по разработке методологии, математического аппарата и программных решений по прогнозированию сложных социальных систем и противодействию скрытому управлению групповым поведением;
в-пятых, инициировать разработку пакета нормативных документов, связанных с вопросами государственного регулирования Больших Данных, включая их сбор, накопление, использование и возможность трансграничной передачи. При необходимости проработать вопрос о подготовке государственной концепции в сфере Больших Данных.