В мае 2000 года я вдруг получил электронное послание с приятным и заманчивым названием I Love You. К счастью, меня уже предупредили, что письмо с таким названием содержит вовсе не признание в любви, а всего лишь подлый компьютерный вирус, способный испортить массу ценных для меня файлов. Такие компьютерные вирусы не несут (пока) смертельной угрозы, но уже доставляют множество неприятностей с ощутимыми финансовыми потерями. Тот же вирус I Love You сумел на какое-то время нарушить систему электронной почты Сената США, палаты общин английского парламента и множества других правительственных и финансовых организаций. По некоторым оценкам, другой вирус под названием Love Bug нанес в 2000 году экономический ущерб порядка 6,7 миллиарда долларов.
Компьютерный «червь» Slammer в начале 2003 года нанес серьезный урон экономике Южной Кореи, после чего новые варианты и виды компьютерных вредителей стали появляться регулярно, превращаясь в подобие средневековых эпидемий. Эта ситуация только подчеркивает роль и значение Интернета и связанной с ним сети WWW (World Wide Web) в социальной структуре современного общества. Наша экономика все в большей степени начинает зависеть от электронных систем, причем не столько от самого оборудования, сколько от программного обеспечения. Уже сейчас многие правительственные службы работают на основе систем и программ, обеспечивающих выполнение множества функций, от распределения продуктов по школьным буфетам до полицейских обязанностей. Ларри Ирвинг, руководитель Отдела телекоммуникаций и информации в Министерстве торговли США, говорит по этому поводу: «За этим скрывается новая инфраструктура, от которой мы зависим гораздо сильнее, чем планировали когда-то»'.
Требуется совсем немного воображения, чтобы увидеть в особенностях Интернета и веб-сети характерные черты гоббсовского Левиафана, чудовищного правителя, тело которого составлено не из множества его подданных, а из кремниевых микросхем, жестких дисков и светящихся экранов, объединенных километрами проводов и оптических волокон. Известный итальянский писатель Примо Леви когда-то написал рассказ Ради высокой цели о таком научном чудовище — автоматизированной телефонной системе, которая благодаря своей неимоверной сложности вдруг обретает сознание. В какой-то момент она даже начинает действовать по собственному плану, переключая телефонные соединения, но ее соединения кажутся людям случайными и вызывают только массовый хаос и потрясения.
Естественно, нас должен интересовать вопрос, насколько здоровым и крепким является электронный Левиафан, это гоббсовское кибернетическое государство, воплощенное в новейших технических достижениях? Сам Гоббс писал:
Разумеется, все созданное смертными созданиями тоже смертно, но люди должны использовать свой разум, чтобы оградить создаваемое Государство хотя бы от того, что можно назвать внутренними болезнями... К ним прежде всего следует отнести те, которые проистекают из неправильной организации системы управления, расстройство которых напоминает привычные болезни обычного человека 2 .
Это, кстати, чрезвычайно точно описывает воздействие электронных вирусов и «червей» на электронный «организм» Интернета и сети WWW, так что биологические обозначения этих агентов вполне разумны и обоснованны. Собственно говоря, Интернет страдает теми же болезнями, что и обычный человеческий организм, поэтому очень легко найти аналогии всем проблемам, связанным с его работой. Любой медик заметит, например, перегруженность, ошибочные реакции, локальные нарушения типа сужения сосудов (связанные с вечной технической проблемой «узкого места») и, наконец, заболевания, вызываемые вторжением внешних агентов или веществ, нарушающих нормальную жизнедеятельность. Инструкция Гоббса означает, что при развитии и эксплуатации сети Интернет мы должны следовать общим правилам медицины, чтобы поддерживать этого Левиафана в здоровой и правильной форме. Из материала этой главы, посвященной проблемам Сети, читатель сможет убедиться, что
Интернет действительно имеет какие-то «биологические» характеристики, хотя, естественно, никто из его создателей не закладывал такие представления в его основу. С одной стороны, эти биологические черты придают Интернету значительную устойчивость и эффективность, но с другой — они же являются его ахиллесовой пятой, слабостью к некоторым типам внешнего воздействия. Правильная оценка таких слабостей становится исключительно важной в наши дни, когда кибертерроризм фактически не только уже присутствует в Сети, но и энергично развивается, постоянно создавая новые угрозы обществу, которое становится все более зависимым от компьютерных систем.
Интернет представляет собой еще один вариант описанных в предыдущей главе многочисленных сетевых связей, которые пронизывают общество и обеспечивают объединение бесчисленных групп и индивидуальных агентов в поразительно малый мир. Только сейчас мы начинаем понимать, как возникают и самопроизвольно развиваются такие сети связей на основе локальных запросов и частных проблем агентов, перерастающих в некие глобальные закономерности и потребности.
Нам жизненно необходимо разобраться в том, что представляет собой «сетевое общество», ведь Интернет буквально у нас на глазах формирует новые культурные и социальные формы. Социолог Мануэль Кастелс считает, что электронная паутина уже опутала мир (он называет это галактикой Интернета) и создала новые способы осуществления деловых операций и проведения досуга. По его мнению, децентрализованная, неиерархическая «география» сети Интернет может привести к изменению характера многих видов человеческой деятельности: «Подобно тому как новые методы производства и распределения энергии сделали возможным создание фабрик и больших корпораций как организационных форм индустриального общества, так и Интернет является основой организационных форм следующего за ним информационного общества»3.
Темпы роста мировой электронной сети превзошли все ожидания и были настолько стремительны, что никому не удалось разумным образом оценить его последствия или потенциальные возможности. Начало широкого использования Сети можно отнести к 1995 году, в конце которого она насчитывала около 16 миллионов пользователей, к началу 2001 года число пользователей перевалило через 400 миллионов, а в 2005 году эта цифра превысила 1 миллиард, по некоторым прогнозам, в 2010 году она достигнет 2 миллиардов.
Благодаря новой физике сетей мы имеем теперь возможность проследить, как структура Интернета отражает пристрастия и повадки тех, кто его создавал, — как сказал Кастелс, «культура производителей формирует среду»4. Другими словами, только сеть, которая растет «органично», без генерального плана, в соответствии со свободным доступом и меритократическим выбором, позволяет создать структуру, подобную Интернету, со всеми ее сильными и слабыми сторонами.
Возникшая на этой основе культура «информационной свободы» вовсе не означает достижения обществом некой утопии. Хотя Интернет свободен для доступа, доступен он далеко не всем. Почти половина его пользователей относится к жителям Северной Америки и Европы, а большая часть оставшихся пользователей проживает в Азиатско-Тихоокеанском регионе. По мере роста возможностей Интернета все большая часть населения планеты начинает чувствовать себя обделенной и бесправной (например, из-за отсутствия инфраструктуры, денег, образования и т. п.). Возникает «цифровое» или информационное неравенство, причем не только между отдельными странами (развитые — развивающиеся страны), но и между отдельными секторами социальной и экономической структуры в одной стране с единой культурой. С другой стороны, нельзя не замечать, что Интернет уже сейчас создает огромные возможности для развития преступности и создания новых форм незаконного бизнеса. Глупые «шалуны» и неуравновешенные (или просто недовольные) личности открывают для себя в Сети поразительные варианты для саботажа и вредительства. Что уж говорить о рекламных агентствах, которые готовы забросать любого пользователя Сети грудой никому не нужных объявлений и предложений.
Все эти соображения заставляют нас все серьезнее относиться к анатомии и механизму работы созданной нами же гигантской информационной машины. Очень скоро, независимо от желания многих из нас, ее щупальца достигнут каждого. Мне хочется закончить этот раздел предостережением Кастелса:
Мне легко представить себе человека, который раздраженно говорит: «Оставьте меня в покое с вашим Интернетом, с технологической цивилизацией и сетевым обществом! Я не желаю слышать об этом и хочу продолжать жить нормальной человеческой жизнью!» Мне жаль таких людей, так как их позиция обречена на поражение. Если они сами не свяжутся с Сетью, то Сеть свяжется с ними, независимо от их желания. В наши дни никто не может жить вне сетевого общества 5 .
СЕТЬ УЖЕ ЗАБРОШЕНА
Член Верховного суда США Стюард Дальцелл еще в 1996 году писал:
Без преувеличения можно сказать, что Интернет уже стал и дальше будет оставаться самым массовым форумом выражения гражданских идей в нашей стране и даже во всем мире... В дебатах принимают участие множество людей. Федералисты и антифедералисты сейчас выражают свое мнение о государственных проблемах не в статьях и выступлениях, а в ночных беседах в так называемых чатах и ныос-центрах. Современные Лютеры уже не должны прибивать свои тезисы к дверям церкви в Виттенберге, а могут спокойно рассылать их по всему миру по электронной почте. В Сети возникают и вполне бытовые беседы... диалоги честолюбивых художников, поклонников французской кухни, собаководов и любителей рыбной ловли 6 .
В этом выступлении ключевыми словами являются массовость и участие. Западные политики любят говорить о глобализации, но обходят молчанием ограниченные возможности большинства развивающихся стран. В противоположность этому Интернет не предполагает элитарности. Каждый человек, имеющий доступ к компьютеру, может бесплатно получить электронный адрес и посылать электронные послания любому другому человеку в любую точку земного шара. Приведенное высказывание судьи Дальцелла представляет собой отрывок из его выступления, в котором он отвергал попытки ограничить определенными рамками содержание посланий, передаваемых по Интернету как антиконституционные. Его мнение было однозначным: «Говоря строго и справедливо, следует признать, что Интернет необходимо рассматривать только в качестве непрерывной, общемировой беседы... Правительство не имеет права каким-либо образом... прерывать такую беседу»7.
Есть некая усмешка истории в том, что возможность такого всеобщего открытого разговора возникла на основе сети для совершенно секретных переговоров, созданной в Министерстве обороны США в начале 1960-х годы. Название задуманной военными сети связи ARPANET содержало аббревиатуру весьма известной организации ARPA (Advanced Research Projects Agency), созданной для разработки наиболее важных и засекреченных научных проектов, имеющих военное значение. Сеть предназначалась для пересылки различных документов, однако в процессе ее разработки и эксплуатации неожиданно выяснилось, что она чрезвычайно удобна для быстрого обмена короткими посланиями. Разработчики просто обменивались такими посланиями в процессе работы, пока не сообразили, что это может стать основной функцией системы. Очень скоро ARPANET стали использовать гражданские, академические и промышленные круги, пересылавшие по сети связи разнообразные кодированные документы в пределах США, а затем и по всему миру. Для этих целей была создана вспомогательная сеть Usenet, в рамках которой неожиданно для создателей зародилась анархическая по своей сути философия, ставшая основой создания сети Интернет, выросшей из объединения многочисленных мелких сетей, обслуживаемых изолированными серверами.
Иногда термины «Интернет» и «Сеть WWW» (сокращенно Net и Web) считают просто синонимами, хотя речь идет о разных структурах. Net представляет собой коммуникационную сеть, a Web — банк информации. Считается, что создателем Web стал известный английский компьютерщик Тим Бернерс-Ли, работавший в Европейской лаборатории физики частиц в Женеве, где он занимался методикой сбора, обработки и хранения получаемой физиками информации. В 1980 году он разработал собственную концепцию и создал программу (шутливо названную индивидуальным заменителем памяти), которая, по его мнению, должна была «позволить собрать обрывки информации и связать родственные обрывки каким-либо образом. Желающий получить требуемую информацию должен просто пройти по цепочке этих связей шаг за шагом»8.
В 1989 году Бернере-Л и придумал метод, позволяющий применить предложенную схему к электронным информационным системам любого размера. Основную роль в его теории играло представление о гипертексте, в котором каждое появляющееся на экране компьютера слово снабжается набором маркеров (выделенных цветом или другим способом), позволяющим потребителю немедленно перейти к другим документам, содержащим относящуюся к теме информацию. Такие гиперссылки могут вводиться как в процессе составления самого документа, так и при его последующей обработке, причем содержание этих ссылок может постоянно обновляться.
Предложенная Бернерс-Ли система стала очень популярной среди сотрудников женевской лаборатории, и они стали широко использовать ее при обработке массы других сведений, не связанных непосредственно с их профессиональной деятельностью. Затем и сама сеть переросла рамки лаборатории. В 1990 году зашла речь о создании сети WWW, позволяющей получать доступ к множеству массивов электронной информации по всему миру, а также к материалам, постоянно создаваемым ныос-группами в сети Интернет. Для ориентации в столь сложном и обширном пространстве данных был необходим специальный проводник или навигатор, который и появился в форме браузера, позволяющего разыскивать данные методами, «дружественными потребителю». Наиболее известными программами такого типа являются Netscape (принадлежащая в настоящее время компании AOL, America Online) и Internet Explorer компании «Майкрософт».
По оценке на конец 2002 года, сеть Web обеспечивает доступ примерно к 3 миллиардам документов, причем каждый день к этому числу добавляется несколько миллионов веб-страниц. Разумеется, наличие таких обширных библиотек потребовало разработки новых методов поиска требуемой информации, в результате чего возникла проблема создания так называемых поисковых машин, т. е. программ, способных автоматически просматривать множество архивных документов Сети и находить нужную информацию по заданным ключевым словам. Масштабы и сложность Сети в настоящее время возросли настолько, что даже лучшие программы такого типа способны просмотреть лишь небольшую часть документов.
Разумеется, создателей Интернета с самого начала интересовала проблема топологии Сети, причем сложности были связаны главным образом не с математическими, а с технологическими вопросами. Читатели старшего поколения наверняка помнят времена, когда электронно-вычислительные комплексы представляли собой центральный процессор, соединенный с серией терминалов, которые не обладали никакой автономностью, а являлись как бы придатками центрального устройства. Предшественник Интернета — сеть ARPANET создавалась в те времена, когда не существовало даже концепции автономного, независимого, персонального компьютера. Поэтому в 1960-х годах «очевидная» топология электронной сети была высокоцентрализованной, когда все послания передаются через центральное устройство (рис. 16, а).
Американский инженер Пол Баран, специалист по коммуникационным системам, первым обратил внимание на то, что такая система весьма уязвима, поскольку в случае военных действий противник сможет вывести ее из строя всего лишь одним точным ударом, нанесенным по центральному узлу связи. Баран работал в известной РЭНД Корпорейшн — организации, созданной в 1946 году правительством США для анализа стратегических действий и выработки государственной политики в области ядерной обороны. В разгар «холодной войны» руководители США жили в постоянном ожидании ядер- ного нападения со стороны СССР, которое могло вывести из строя систему коммуникаций и тем самым предотвратить нанесение ответного «удара возмездия». В связи с этим военные и потребовали создать сеть, способную пережить такую ядерную атаку.
Одним из напрашивающихся вариантов было использование слабоцентрализованных сетей, составленных из большого числа сравнительно небольших кластеров, связанных друг с другом более длинными связями (рис. 16, б). Очевидным недостатком такой системы выступала изолированность ее компонентов, что позволяло противнику легко нарушать связь, нанося удары по вытянутым линиям связи или ребрам графа (очевидно, что описываемые системы относятся к графам). Наиболее эффективным и радикальным решением оказалось создание «распределенной» сети с высокой степенью связности, в которой каждый узел (вершина графа) соединен с несколькими другими (рис. 16.1, в). Такая топология обладает так называемой избыточностью, которая и обеспечивает много маршрутов связи вершин друг с другом, гарантируя надежность работы. Разрушение в такой коммуникационной системе большого числа связей не приводит к изоляции какой-либо части сети. По оценкам Барана, всего трех связей на каждой вершине было достаточно для обеспечения требуемой устойчивости системы.
Предложенный Бараном проект безнадежно увяз в бюрократических согласованиях и не был реализован, но его идеи были реанимированы при создании сети ARPANET. Этот проект уже не был связан с отражением возможной ядерной атаки, а касался исключительно проблем повышения эффективности передачи данных между университетами, работавшими по проектам ARPA. В те времена, напомню, в каждом университете, институте или отдельной крупной лаборатории был центральный компьютер, согласно первоначальному плану при создании сети их намеревались соединить каждый с каждым.
Но в 1967 году компьютерщик Весли Кларк показал, что такая «максимально связная» сеть будет исключительно сложной и быстро станет неработоспособной. Даже при указанных трех связях на вершину число связей для десяти вершин оказывается равным 45 (как показано на рис. 16.1, г), а затем возрастает значительно быстрее, чем количество центров. Такая ситуация будет означать нарастание нагрузки на центральные компьютеры, в результате чего потоки информации в сети, образно говоря, будут «замерзать». Кларк предложил связать центральные компьютеры с подсетью более мелких и связанных друг с другом компьютеров, занятых, как говорят компьютерщики, маршрутизацией информации (стоит заметить, что эта схема требовала унификации языков программирования). В результате работ Барана, Кларка и ряда других исследователей возникла сеть, сочетающая в себе эффективность связи и надежность работы. "
Этим и завершилось топологическое планирование Интернета, который в дальнейшем стал развиваться независимо от первоначальных целей, не подвергаясь государственному регулированию и не имея заданной общей архитектуры. Рост Интернета можно уподобить естественному процессу развития городов (см. гл. 6) или даже формообразованию в живой природе. Многие исследователи относятся к последнему утверждению совершенно серьезно, рассматривая Интернет как некую экосистему, уже сопоставимую по сложности с природными аналогами. В настоящее время не имеет смысла даже пытаться нарисовать исчерпывающую карту его соединений, так как структура в целом слишком велика и сложна для анализа.
Тем не менее сейчас структура Интернета, по-видимому, приближается к предсказанной Бараном сети с высокой избыточностью. Блоки данных, передаваемые по сети, проходят по весьма сложным маршрутам (иногда даже в противоположных направлениях) и лишь затем объединяются на заданном сайте. Именно эта избыточность позволяет Интернету обеспечивать протекание огромных потоков информации, так как при блокировке или занятости любого маршрута поток устремляется по многим другим.
С другой стороны, мы знаем, что топология Интернета не может соответствовать структуре рис. 16.1, в, напоминающей описанные в гл. 15 регулярные решетки, хотя число связей на вершину в них и непостоянно, а меняется от четырех до шести. В такой сети не может быть быстрых и коротких путей, попасть из одной вершины в другую можно только за счет длинной серии коротких прыжков.
Так на что похож Интернет в действительности? Это принципиальный вопрос, связанный с проблемами обеспечения более надежной пересылки электронной почты, борьбы с помехами и локальными нарушениями, поиска новых путей соединения пользователей, а также с тем, может ли сеть Интернета расти бесконечно или нам следует ожидать достижения некоторой точки насыщения, после которой развитие остановится. Важность этих проблем подчеркивает также огромное и постоянно возрастающее экономическое значение сети. Ежегодный оборот в системе электронной торговли (e-commerce) только в США сейчас составляет от 100 до 200 миллиардов долларов, не говоря уже о том, что современная экономика фактически уже давно работает на основе электронных коммуникационных сетей.
Интернет представляет собой некую физическую сущность, подобную лондонскому метро. Мы можем представить его в виде огромного графа, узлы или вершины которого соответствуют отдельным компьютерам, а связи или ребра — линиям связи и побочным каналам. Гораздо сложнее дать точное определение сети WWW (или Паутины). Ее разбросанные по всему миру вершины состоят из страниц документов, а ребра представляют собой гиперссылки или адреса URL (Uniform Resource Locator), позволяющие соединить одну страницу с другой на другом веб-сайте на каком-то другом компьютере. Передача данных происходит по тем же физическим линиям, которые использует Интернет, однако эти линии связи вовсе не являются элементами Паутины. Одна линия передачи способна в принципе связывать миллион веб-страниц с миллионом других в чудовищном лабиринте, образуемом системой URL.
Проблема точного определения структур Интернета и Паутины остается открытой. Можно ли описать эти структуры случайными графами?
Будут ли они похожи на рассмотренные в предыдущей главе сети малых миров? Или их можно уподобить ветвящимся иерархическим деревьям, напоминающим строение наших легких? Или они представляют собой нечто другое?
МАСШТАБ НЕ ИМЕЕТ СМЫСЛА
Создание карты всемирной Паутины напоминает построение схемы лабиринта. Такую карту легко нарисовать, разглядывая строение лабиринта откуда-то сверху, например из гондолы воздушного шара, однако Паутина существует не в физическом, а в абстрактном киберпространстве, так что рассмотреть ее с высоты птичьего полета не удастся, мы должны войти в нее и ощупью продвигаться вперед, отмечая по дороге все тупики и разветвления.
Затея странная, но что нам остается еще делать? Мы создали Сеть, но не можем точно сказать, что же мы, собственно, создали. Самый простой метод изучения лабиринта состоит в его постепенном и методическом исследовании методом «ощупывания», и именно такую попытку в 1999 году предприняла группа ученых из университета Нотр-Дам штата Индиана (Река Альберт, Хавонг Джинг и Альберт-Ласло Барабаши). Для решения этой формально картографической задачи они просто запустили в лабиринт «робота», поручив ему составить схему всех замкнутых маршрутов по Паутине. Разумеется, робот тоже был виртуальным, т. е. представлял собой компьютерную программу, которая позволяла входить на все сайты и проверять все гиперссылки. На каждом сайте робот получал набор новых сайтов и продолжал свою работу, переходя все к большему числу сайтов. После каждого такого «налета» на сайт робот информировал своих создателей о числе обнаруженных гиперссылок по каждой из веб-страниц.
Понятно, что анализ фантастического количества документов в Паутине не под силу роботу с самой совершенной программой, поэтому исследователи поручили ему изучить только связи домена, относящегося непосредственно к университету Нотр-Дам (). При этом было выявлено 325 729 документов HTML (HTML — стандартный гипертекстовый язык написания документов, придуманный Тимом Бернерсом-Ли), связанных посредством примерно 1,5 миллиона связей-ссылок. Разработчики программы попытались на основе этой довольно обширной и репрезентативной базы данных определить некоторые характеристики сети в целом.
Прежде всего Альберт и ее коллеги оценили распределение вероятностей входящих и исходящих ссылок и показали, что оно описывается степенным законом (рис. 16.2). Часть веб-страниц имеет огромное количество ссылок, многие — всего несколько, но общая тенденция остается неизменной, так что, например, при удвоении числа ссылок число соответствующих веб-стра- ниц уменьшается в постоянное число раз. Удивляет не уменьшение числа веб-страниц с большим числом ссылок (именно такого результата и следовало ожидать), а строгое совпадение со степенным законом распределения. Этот факт вовсе не выглядит очевидным, скорее естественным было бы гауссовское, колоколообразное распределение со средним значением около 3-4 ссылок. Степенной закон распределения, как уже отмечалось, является характерной особенностью безмасштабных систем.
Проблема заключается в том, что степенной закон распределения не предопределен условиями формирования системы. Каждый человек может свободно создать собственную веб-страницу в университете Нотр-Дам (как и в любом другом домене) и независимым образом решает, каким числом гиперссылок следует снабдить свою страницу. (Разумеется, никто не может заранее определить число возможных входящих ссылок для своей страницы.) Удивительным образом полученная на основе этой вольности принятия решений обширная статистика вдруг оказывается строго соответствующей степенному закону в широком интервале количества ссылок — от одной до тысячи и более. Напомним, что такое же распределение было описано для физических систем, соответствующих критическим состояниям осыпающихся песчаных куч с очень непростым механизмом самоорганизующейся критичности (см. гл. 12).
Распределение по степенному закону прежде всего свидетельствует о том, что Сеть нельзя рассматривать в качестве аналога сетей, предложенных Стивеном Строгацем и Дунканом Ваттсом для описания «малых миров» (гл. 12). В их математических расчетах переключения связей внутри графов приводили к некоторым предпочтениям в связности структур, вследствие чего функция распределения вероятностей числа связей на отдельную вершину возрастала до некоторого значения, а затем начинала уменьшаться. С другой стороны, Сеть в целом вовсе не похожа и на очень большой случайный граф, для которого характерно совершенно иное распределение вероятностей. В частности, при возрастании числа связей степенной закон (рис. 16.2) обеспечивает значительно большее число связей на вершину, чем в случайных графах или в промежуточных графах для малых миров, построенных Строгацем и Ваттсом, подобно тому как степенной закон распределения флуктуаций рыночных показателей увеличивает вероятность больших отклонений.
Означает ли сказанное, что Паутина не относится к малым мирам? Такое утверждение было бы слишком категоричным, мы лишь можем констатировать, что Паутина не принадлежит к тому классу малых миров, который придумали Строгац и Ватте. Альберт и ее коллеги пытались выявить в статистических данных одну из важных особенностей малых миров — сочетание сравнительно низкого значения среднего (характеристического) пути между вершинами с высоким коэффициентом кластеризации самих вершин. При этом они установили, что в Сети рост числа вершин сопровождается лишь очень незначительным увеличением характеристической длины (математически это сводится к тому, что характеристическая длина оказывается пропорциональной логарифму числа вершин). Исследователи показали, что граф, характеризующийся степенным законом распределения связей, действительно демонстрирует такое поведение.
Таким образом, сеть WWW все же может бьггь отнесена к малым мирам, но со специфической топологией, характеризующейся степенным законом распределения, из чего вытекает свойство безмаспггабной связности. Альберт и ее группа подсчитали, что если увеличить домен университета Нотр-Дам до размеров всей Сети, сохранив при этом его структуру, то любые две веб-страницы будут разделены в среднем 19 ссылками, при предполагаемом дальнейшем росте числа веб-страниц в 10 раз среднее число таких ссылок увеличится всего на две. То есть сама структура Сети гарантированно обеспечивает возможность достижения нужного сайта посредством всего нескольких соединений.
На первый взгляд представляется даже странным, почему эти простые закономерности не были обнаружены сразу? По мнению большинства пользователей и исследователей Сети, сложность анализа ее работы обусловлена чудовищным объемом циркулирующей в Сети бесполезной информации. Поисковые программы затрачивают массу времени, пробираясь через завалы «мусора», поскольку не существует возможности выделить только полезные ссылки. Возникает парадоксальная ситуация, при которой каждый важный документ можно действительно найти через 19 переключений, но при этом приходится просматривать массу ненужных документов, так что поразительная связность Сети автоматически снижает эффективность работы поисковых программ. Кроме того, огромные сложности для поиска информации создает непрерывное изменение размеров и параметров Сети, что заставляет любые поисковые программы тратить время на регистрацию и индексацию гигантского количества появляющихся новых страниц, а также их «привязки» к уже существующим документам. По оценкам специалистов, даже лучшие поисковые программы могут просматривать не более трети содержания Сети, а большинство программ оперируют примерно лишь с '/ш ее объема
Ладе Адамик, специалисту из исследовательского центра фирмы «Ксерокс» (Пало-Альто, Калифорния), удалось показать, что присущие Сети особенности малых миров могут быть использованы для создания более эффективных поисковых программ. Она предложила воспользоваться высокой степенью кластеризации веб-страниц, относящихся к связанным тематикам. Топология таких крупных кластеров отличается от топологии случайных графов. «Умная» поисковая машина могла бы воспользоваться этой кластеризацией для ограничения области запросов и тем самым повысить скорость и эффективность поиска. Такое осмысленное поведение представляет собой значительный шаг вперед по сравнению со случайным блужданием программ по лабиринту Сети.
Степенной закон распределения, по-видимому, является лейтмотивом Сети. Именно это распределение Адамик и ее коллега Бернардо Губерман обнаружили при анализе числа страниц на веб-сайтах. Более того, оказалось, что статистика пользователей Паутиной в 1998 году, которые прибегали при поиске информации к так называемому серфингу, тоже подчиняется показательному распределению. Серфингом называют стандартную процедуру поиска, следуя которой вы проверяете сайты по интересующей теме, а затем, пользуясь гиперссылками, двигаетесь дальше, пока не найдете нужной информации или не откажетесь от поиска.
Многие пользователи при серфинге переходят не от страницы к странице, а непосредственно от сайта к сайту. Однако группа Губермана и Адамик ограничилась анализом серфинга внутри отдельных сайтов. Их интересовала «глубина» поиска пользователей — среднее число «кликов», осуществляемых до момента выхода из сайта. Изучив весьма солидные массивы данных (поведение более 23 тысяч зарегистрированных пользователей провайдера AOL и всех посетителей веб-сайта фирмы «Ксерокс»), исследователи показали, что функция распределения вероятностей для числа «кликов» внутри сайта подчиняется степенному закону или по крайней мере очень близка к нему. Такая информация, безусловно, должна быть полезна создателям сайтов, которые могут заранее оценивать число возможных посетителей каждой веб-страницы.
Рис. 16.3. Случайные графы (а) кажутся довольно однородными по сравнению с безмасштабными сетями (б), «присоединенными» к небольшому числу вершин с высокой связностью.
На что похожа описываемая безмасштабная сеть? Некоторое представление читатель, возможно, получит, сравнивая представленные на рис. 16.3 структуры. В случайных графах (а ) большинство вершин имеет примерно одинаковое число ребер, в результате чего общая структура выглядит довольно однородной. В безмасштабной сети (б) большая часть вершин имеет лишь одну или две связи. В то же время небольшое число вершин в такой сети обладает очень большим числом соединений, что делает структуру чрезвычайно неоднородной, т. е. очень плотной в одних местах, но очень разреженной — в других. Эти высокоплотные узлы обеспечивают «короткие связи», которые делают сеть малым миром.
Интернет в целом (подобно Паутине) также обладает безмасштабной топологией, для которой распределение числа связей между узлами подчиняется степенному распределению (рис. 16.4), и именно в этом заключены его сила и фантастические возможности. Упомянутая группа Альберт, Джинга и Барабаши изучила устойчивость работы безмасштабных систем по отношению к повреждению отдельных узлов связи по сравнению с двумя другими типами сетей: случайными и сетями малых миров Строгаца и Ваттса специального типа (так называемых малых миров с доминирующей размерностью). Оба упомянутых типа сетей характеризуются тем, что вероятность образования высокосвязных узлов быстро (экспоненциально) уменьшается с ростом числа узлов и связей.
Рис. 16.4. Структура небольшого участка Интернета, построенная по кратчайшим маршрутам передачи сообщений от одного центрального компьютера к множеству других. Структуры такого типа широко представлены на сайте www.cybergeography.org/atlas/topology . Html.
Расчеты показали явное преимущество безмасштабных сетей, которые продолжают спокойно работать при потере 5% узлов, практически без изменений характеристической длины пути передачи сообщения. В противоположность этому в обоих типах описанных «экспоненциальных» сетей повреждение даже небольшого числа узлов приводило к заметному снижению коммуникационных характеристик системы. Кроме того, экспоненциальные сети при повреждениях проявляли тенденцию к распаду на изолированные кластеры в тех случаях, когда доля «мертвых» узлов доходила до 28%, т.е. теряли способность передавать информацию на значительные расстояния. В отличие от них безмасштабные сети даже при значительных повреждениях не распадались на части, а продолжали работать, лишь постепенно снижая эффективность связи. Такая надежность работы объясняется тем, что в безмасштабных сетях большая часть узлов имеет лишь одну или две связи, вследствие чего повреждение связи приводит лишь к частичной или временной изоляции конкретного узла (рис. 16.5).
Таким образом, топология Интернета действительно обеспечивает удивительную надежность его работы даже при отключении некоторой доли узлов. Отметим, кстати, что отключение узла не обязательно означает разрушение или повреждение, так как узел может временно перестать функционировать из-за перегрузки, т.е. из-за слишком большого объема передаваемой информации. В таких случаях безмасштабная структура быстро обеспечивает выработку нового кратчайшего маршрута передачи. Этому способствует и то, что в реальных условиях около 3% узлов на всех маршрутах Интернета остаются свободными.
Самое удивительное — то, что такая надежная и удобная сеть возникла без предварительного плана . Более того, если бы при создании Сети кто-то мог диктовать условия ее формирования и топологию, то любое выбранное решение с большой долей вероятности оказалось бы менее надежным (одна из таких топологий, предлагавшаяся Полом Бараном, приведена на рис. 16.1, в). Из этого следует вывод, что в некоторых случаях разумнее всего предоставить технологии развиваться и организовываться по собственным законам. Конечно, интересно понять также, почему Интернет образовал именно такую структуру? Я попробую ответить на этот вопрос в конце главы, а сейчас нам предстоит задуматься об очень сложной и неприятной проблеме защиты Интернета, надежность которого определяется не только структурой, но и уязвимостью к нападению извне.
КИБЕРАТАКА
Ирония судьбы: Интернет, рожденный для обеспечения безопасности коммуникационных каналов страны при вражеской агрессии, представляет собой сейчас чрезвычайно уязвимый объект, от работы которого зависит безопасность и жизнедеятельность США. В 1996 году президент Билл Клинтон поручил Комиссии по защите особо важных инфраструктур разработать меры и составить план действий, предназначенных для защиты электрических, коммуникационных и информационных сетей от атаки возможного противника. Возможное нападение на Сеть сегодня может принять форму, отличную от той войны, к которой готовились создатели Сети. Для атаки вовсе не требуются ракеты, самолеты и пушки. Нападающие могут не покидать своих домов и не должны длительно готовиться к нападению, тайно наращивая мощь на границах. В современном мире сложилась ситуация, когда один человек, обладающий персональным компьютером и достаточными техническими навыками, может действительно поставить на колени целую страну. Современная система государственного и финансового управления настолько компьютеризована, что один удачливый кибертеррорист может обрушить американскую экономику. Страшно даже подумать о последствиях масштабных нарушений работы компьютерных систем, автоматически управляющих, например, системами электроснабжения, подачи газа и т.д.
ФБР (Федеральное бюро расследований США) определяет терроризм как «незаконное использование силы или угрозы против людей или имущества с целью запугать и заставить правительство и гражданское население действовать определенным образом для достижения поставленных террористами политических или социальных целей»9. Кибертерроризм означает именно такие действия, осуществляемые с помощью электронных информационных сетей. Эта угроза реальна, и многие политики опасаются кибертерроризма не меньше, чем атомной бомбы. Уже сейчас США уделяют этой проблеме огромное внимание: штаб Центра информационной войны в ЦРУ составляет более тысячи человек, а большинство крупных ведомств (ФБР, секретные службы, военно-воздушные силы и т.д.) уже завели собственные подразделения для борьбы с электронным терроризмом.
Образно говоря, в наши дни терроризм «призраком бродит по цивилизации», и страх перед ним вовсе не является свидетельством слабости или паранойи. Опасность кибертерроризма обусловлена многими факторами: это дешевое средство борьбы, его применение не подвергает непосредственной опасности жизнь исполнителей, и он может быть чрезвычайно эффективным. В свое время компьютерная система Пентагона уже была «атакована» во время военных учений Eligible Receiver, когда сотрудники Агентства национальной безопасности применили против Пентагона коммерчески доступные программы, что позволило им отключить Американскую систему электроснабжения и получить частичный контроль над Тихоокеанским флотом. Причем большинство этих «кракеров» искусно замели следы, так что их не удалось идентифицировать.
На самом деле такие «умные» покушения на работу Сети составляют лишь часть проблемы, возможно, не самую значимую. Гораздо более простым и, вероятно, более эффективным является «тупой» подход — остановка работы Сети.
Безмасштабная топология Интернета гарантирует достаточную надежность работы системы при случайных поражениях отдельных узлов связи, поскольку структура сама обеспечивает достаточно быстрое формирование новых связей, позволяющих обходить поврежденный участок. Поэтому кибертеррористы скорее всего даже не будут пытаться пробовать разрушать участки Сети, а придумают новые методы, связанные, например, с особенностями Сети. Уже отмечалось, что в экспоненциальных сетях факт наличия некоторого значения для характеристической длины пути означает, что узлы такой сети равноценны. В то же время в безмасштабных сетях некоторые узлы «более равноценны», чем другие, причем именно наличие некоторого количества таких узлов высокой связности обеспечивает эффективность и надежность работы. Идентификация и повреждение таких важных узлов гораздо более эффективное средство террора, чем разрушение большого числа узлов случайным образом. Другими словами, при правильно выбранной стратегии нападения, учитывающей характерные особенности безмасштабных сетей, террористы могут нанести существенный вред немногочисленными, но направленными ударами. Интересно, что для экспоненциальных сетей обе стратегии — случайного или направленного поражения узлов — приводят приблизительно к идентичным результатам. Так что при направленных ударах экспоненциальные сети оказываются даже более устойчивыми, чем безмасштабные. В последних удаление каждого двадцатого узла высокой связности увеличивает характеристическую длину вдвое — очень резкое снижение эффективности передачи данных. Таким образом, кибертеррористам для эффективной атаки необходимо лишь идентифицировать небольшое количество узлов высокой связности. С другой стороны, эти же особенности Сети диктуют стратегию защиты — наиболее «высокие» барьеры необходимо возводить именно вокруг таких узлов.
Легко заметить, что топологическая структура Интернета делает его похожим на природные, естественные объекты. Чаще всего переработку информации в Интернете уподобляют работе мозга, и это сравнение вовсе не метафора, так как Строгац и Ватте показали, что характерные особенности обнаруженных ими «сетей малых миров» действительно имеют аналогии в живой природе. В частности, им удалось доказать, что нейронная сеть нервной системы червя Caenorhabditis elegans (паразитная нематода) имеет именно такую топологию и отличается высокой степенью кластеризации при малых значениях характеристической длины пути между нейронами. Гипотеза о некоторой «естественности» Интернета подтверждается и результатами исследований группы Альберт—Барабаши, продемонстрировавших удивительные аналогии между безмасштабной сетью Интернета и реальными сетями жизнеобеспечения в клетках многих организмов.
Возможно, важнейшей основой жизни является метаболизм, т. е. способность организмов превращать вещества, поступающие из окружающей среды, в энергию и молекулы, необходимые для жизнедеятельности клеток. Например, клеткам человеческого организма необходимы аминокислоты, жиры и сахара, которые мы получаем из продуктов питания, а также витамины, микроэлементы, вода, кислород и многие другие вещества. С помощью ферментов они превращают поступающие извне вещества в новые ферменты, нуклеиновые кислоты, гормоны, высокоэнергетические молекулы и т. п. Последовательности реакций, преобразующих поступающие извне вещества в требуемые организму молекулярные формы, биохимики называют метаболическими цепочками.
Все без исключения такие цепочки являются не линейными, а разветвленными и взаимосвязанными. Поступающее в организм «сырье», например, глюкоза, может быть переработано и использовано во множестве метаболических реакций и процессов, причем высокоэнергетические молекулы, созданные в результате расщепления этого сахара, сами затем используются в качестве источника энергии в других метаболических цепочках. Процессы метаболизма в организме объединяются в сеть химических превращений, где конкретное химическое соединение соответствует вершине графа, а реакции (протекающие в основном с участием ферментов) — ребрам графа, связывающим его вершины друг с другом (рис. 16.6).
Группа Барабаши изучила такие сети метаболизма для 43 самых различных типов живых организмов, от бактерий через растения к высшим формам типа червей, и обнаружила, что во всех случаях функция распределения числа связей является безмасштабной, т. е. вероятность обнаружения узлов с заданным числом связей описывается степенным законом. Это означает, что в сети метаболизма существуют особые центры повышенной связности, играющие принципиальную роль в организации процессов в целом. Молекулы, связанные с такими центрами, и их относительная важность в сети метаболизма оказались одними и теми же для всех живых организмов, что является отражением единства всего процесса эволюции.
Безмасштабная структура метаболических сетей имеет вполне разумное объяснение в рамках эволюционной теории, так как она делает метаболизм относительно нечувствительным к небольшим нарушениям или случайным флуктуациям. Предположим, что в организме произошел сбой в работе одного или двух ферментов, вызванный, например, генетическими дефектами, в результате чего затрудняются или становятся невозможными некоторые важные реакции в сети метаболизма и возникает угроза существованию всего организма в целом. Наличие безмасштабной структуры в такой ситуации позволяет обойти эту сложность и выработать требуемые организму вещества в другой последовательности реакций, что можно считать очень удачным «инженерным» решением природы проблемы «проб и ошибок» в естественном отборе.
С другой стороны, слабость безмасштабных сетей состоит в их чувствительности к хорошо «спланированным» нападениям, целью которых являются узлы сети с высокой связностью, чья гибель приводит к распаду сети. Именно на этом основано действие большинства бактерий. Но это же свойство может быть использовано при разработке лекарств для отражения бактериальной инфекции. Определив «слабые места» бактерий, мы можем направить на них атаку лекарств. Понимание структуры сети метаболизма бактерий станет первым шагом к определению подходящих целей. В этом сценарии мы выступаем в роли цитотеррористов (цито — клетка) и наши намерения, конечно, с нашей, человеческой точки зрения, совершенно оправданны и благи.
В связи со сказанным возникает еще один вопрос: а не являлись ли массовые отключения энергетических сетей, например, в США и Италии в 2003 году следствием топологических неувязок в этих весьма сложных структурах? Хотя, строго говоря, пока никто не задавался вопросом, имеют ли сети электроэнергетики безмасштабную топологию. Барабаши считает, что это предположение имеет право на существование, и пишет по этому поводу: «[Августовские] отключения энергии нельзя объяснить просто сбоями в работе оборудования, небрежностью персонала или ошибками проектирования. Возможно, такие сбои энергетической системы можно связать лишь с тем, что мы не понимаем последствий объединения и глобализации энергосистем в мировом масштабе, то есть игнорируем возможные последствия развития внутренней связности в столь сложных системах»10. Барабаши отмечает, что энергетические сети подвержены каскадным процессам, когда нарушение в одном месте направляет электроэнергию на другие линии, приводя к усилению перегрузки и новым отключениям. «Каскадные отключения характерны для большинства сложных систем».11
РАСПРОСТРАНЕНИЕ ВО ВСЕ СТОРОНЫ
Существованию и функционированию социальных сетей угрожают не только намеренное вредительство и аварийные отключения узлов. Размножившиеся в последние годы компьютерные вирусы представляют собой для электронных коммуникаций не меньшую опасность, чем атаки кибертеррористов, поскольку их деятельность менее заметна и ведет не к разрушению Сети, а к захвату наиболее важных узлов связи с последующим «опустошением». В этом случае мы вновь вынуждены констатировать, что достоинства топологии Сети оборачиваются против нее.
Обычно компьютерные вирусы распространяются пересылкой по электронной почте посланий от одного компьютера к другому, аналогично процессу передачи биологических вирусов от одного человека к другому при непосредственном контакте. Установление любой связи между двумя пользователями Сети становится источником потенциальной опасности заражения.
Процессами распространения болезней столетиями занимается огромная область медицины, называемая эпидемиологией, поэтому компьютерщики взяли на вооружение математические модели этой области науки, пытаясь понять механизм распространения компьютерных вирусов. В стандартной эпидемиологической модели все вовлеченные в процесс агенты (личности) в каждый конкретный момент времени могут быть разделены на два класса: здоровые и инфицированные. Здоровые агенты восприимчивы к заражению при контакте, т.е. их общение с больными может приводить к заболеванию с некоторой заданной в модели вероятностью. Одновременно инфицированные агенты могут вновь становиться здоровыми, что не исключает нового заражения. В такой модели можно рассчитать скорость распространения эпидемии, которая определяется отношением вероятностей передачи инфекции и выздоровления.
Эта простая модель (ее обычно обозначают аббревиатурой SIS) позволяет вычислить так называемый эпидемиологический порог. Если скорость распространения инфекции превышает эту величину, то болезнь распространяется среди населения, доля больных какое-то время находится на постоянном уровне. Если же эпидемиологический порог не превышен, то волна заболеваний быстро сходит на нет. Представление об эпидемиологическом пороге весьма существенно при выработке программ вакцинации, поскольку при вакцинации части населения скорость распространения инфекции поддерживается ниже этого порога, препятствуя тем самым эпидемии.
Позднее Дункан Ватте в сотрудничестве с Марком Ньюманом из института Санта-Фе (Нью-Мексико) сумел доказать, что в сетях малых миров (предложенных ранее им же со Стивеном Строгацем) также существуют некоторые пороговые значения параметров для распространения нарушений, «болезней» структуры. Другими словами, если аналогия между Сетью и социальными сетями справедлива, то мы действительно можем учитывать богатый опыт, накопленный в эпидемиологии.
С другой стороны, следует помнить, что топология Интернета в отличие от малых миров Строгаца—Ваттса безмасштабна. Возглавляемая Стефаном Борнхольдом группа в Кильском университете, проанализировав статистику электронных посланий через университетский сервер, показала, что структура сети посланий также безмасштабна. То есть не только сам Интернет (рассматриваемый как совокупность узлов и связей между ними) физически безмасштабен, но и «сеть знакомств», возникающая на его базе, имеет аналогичную топологию.
Физики Ромуальдо Пастор-Саторрас и Алессандро Веспиньяни (из Барселоны и Триеста соответственно) обнаружили, что указанная разница в структурах Интернета и малых миров может приводить к значительным изменениям в механизме распространения компьютерных вирусов по коммуникационным системам. Компьютерное моделирование показало, что главный вывод модели SIS о наличии эпидемиологического порога в безмасштабных сетях не действует, т. е. независимо от скорости все вирусы могут распространяться по изучаемой системе, заражая определенную долю узлов. Благодаря введенной в модель возможности «лечения» узлов антивирусными программами эпидемия может быть подавлена полностью, однако процесс в целом может носить очень затяжной характер. Действительно, на практике соответствующие антивирусные программы появляются в течение нескольких дней, в крайнем случае недель после первого зарегистрированного случая появления нового вируса, но тот продолжает циркулировать в Сети долгие месяцы или даже годы. Исследователи тщательно изучили статистические данные о вирусах, обнаруженных с 1996 по 2000 год, и установили, что, хотя вероятность заражения вирусом резко падает за несколько первых месяцев его существования, низкий уровень заражения сохраняется очень долго. Например, чрезвычайно опасный вирус Love Bug, считавшийся окончательно уничтоженным, по-прежнему занимает седьмое место в списке наиболее распространенных вирусов.
Такое поведение выглядит необычным для классической эпидемиологии, где стандартные модели предсказывают вирусной инфекции либо бурное развитие в виде эпидемии, либо быструю гибель. Однако для интересующих нас безмасштабных сетей наиболее характерным оказалось именно замедленное, затяжное развитие болезни без явного эпидемиологического порога. Этот факт является одновременно обнадеживающим и разочаровывающим. Конечно, распространение вредного вируса в системе крайне неприятно, даже если оно протекает очень медленно и слабо, однако доля зараженных узлов не становится большой, и Сеть благодаря своей топологии справляется с этой напастью. В то же время это показывает, что методы обычной эпидемиологии недостаточны для выработки средств борьбы с компьютерными вирусами.
Сказанное заставляет задуматься о еще одной проблеме. Дело в том, что мы до сих пор не знаем точно, относятся ли сети социального общения к безмасштабным. Положительный ответ на этот вопрос будет означать, что человечеству следует пересмотреть представления о механизмах распространения реальных болезней. Составление соответствующих графов, как отмечалось, представляет собой очень трудную задачу. Группа социологов из Стокгольмского университета, объединившись с физиками Дженом Стэнли и Луисом Нуньесом Амаралом из Бостона, взялась за эту сложную проблему и построила сеть сексуальных контактов для случайно подобранной группы из 3 тысяч шведов в возрасте от 18 до 74 лет. Обнаружилось, что распределение числа партнеров (в течение года до момента исследования) подчиняется степенному закону, т. е. сеть социальных контактов безмасштабна.
Результаты этого исследования (разумеется, если их можно считать репрезентативными и надежными) заставляют более трезво оценивать стратегии борьбы с болезнями, распространяющимися половым путем, в особенности со СПИДом. В безмасштабных сетях часть популяции всегда остается зараженной, несмотря на низкую скорость распространения болезни и предпринимаемые меры борьбы, поэтому даже после создания вакцины массовая, но случайная вакцинация не может гарантировать полного уничтожения вируса.
Мрачность этого прогноза смягчается, если мы вспомним об «ахиллесовой пяте» всех безмасштабных сетей, а именно — их повышенной зависимости от состояния относительно небольшого числа узлов с высокой связностью. Такие сети могут разрушиться при разрыве связей основных узлов, вследствие чего Пастор-Саторрас и Веспиньяни даже предложили программу иммунизации, рассчитанную именно на контингент людей с беспорядочными половыми связями, которые и являются основным источником распространения таких болезней, принимающих сейчас характер эпидемии. В этой связи можно особо отметить, что «иммунизация» всего 10% сайтов с высокой связностью способна предотвратить распространение любого компьютерного вируса.
Разумеется, в некоторых сетях (типа описанных сетей сексуальных контактов) практически очень трудно выделить, т. е. идентифицировать наиболее опасных для распространения агентов, однако Барабаши и его студент Золтан Дезо сумели доказать, что даже довольно ограниченные меры иммунизации могут приводить к принципиальному результату: эпидемиологический порог в безмасштабных сетях становится отличным от нуля. Другими словами, даже воздействие на ограниченное число важных узлов сети может повысить степень ее сопротивляемости внешней инфекции. В случае со СПИДом выявление наиболее активных членов сексуальной сети делает борьбу с этим страшным заболеванием более эффективной. Учитывая ограниченность возможностей борьбы с этим заболеванием, нам следовало бы по крайней мере сосредоточить внимание именно на выявлении таких отдельных личностей, а не на попытках иммунизации случайных групп населения в надежде на улучшение общей обстановки.
МИР ПАУТИНЫ
Безмасштабные сети могут быть куда более распространенными формами малых миров, чем «переключательные» сети Строгаца и Ваттса. Барабаши и Альберт попытались внести ясность в этот вопрос, еще раз тщательно изучив структуры, которыми с самого начала занимались Строгац и Ватте, а именно сеть связей в мире киноактеров и энергетическую сеть Западного побережья США. Для самих Строгаца и Ваттса единственным признаком принадлежности изучаемой системы к малому миру, как уже неоднократно отмечалось, являлось сочетание высокой степени кластеризации узлов с малой характеристической длиной. Проблема заключается в том, что эти критерии не позволяют однозначно отнести любую исследуемую сеть к определенному классу, поскольку им удовлетворяют одновременно как безмасштабные сети, так и переключательные сети Строгаца — Ваттса. Так, для сети киноактеров понятие «среднего» значения числа связей теряет всякий смысл, поскольку число связей плавно меняется по степенному закону от знаменитого Рода Стайгера до никому не известного актера, снявшегося в эпизоде в давно забытом фильме.
Вообще говоря, сеть связей в мире кинематографа оказалась наиболее полным описанием профессионального содружества, и его характеристики свидетельствуют о безмасштабной топологии таких структур. Это подтверждается и многочисленными аналогичными сетями для других социальных сообществ или объединений — числа Эрдеша для математиков, структуры в других научных дисциплинах, данные о связях джазовых музыкантов на заре джаза, описанная сеть сексуальных контактов в Швеции и т.д.
Основываясь на этом выводе, группа Рикардо Альберика из университета Мальорки (Испания, Балеарские острова) предложила считать безмасштабность пробным камнем, позволяющим четко различать реальность и выдумку. Проанализировав сеть друзей Человека-Паука, известного героя кинофильмов и комиксов, они установили, что она далека от реальности.
Затем исследователи развили свой подход, проанализировав статистику, относящуюся к известнейшей в США серии комиксов Марвел Комикс (издание которой началось еще в 1939 году под названием Таймли Комикс ). Серия представляет несомненный интерес для рассматриваемой нами проблемы, поскольку создававшие ее художники за несколько десятилетий выпустили множество книг (часть из которых перешла в мультфильмы), в результате чего возник целый мир рисованных персонажей. Многие из них стали исключительно популярными в США, так что миллионы американцев прекрасно знают Капитана Америку, Фантастическую Четверку, Х-мена и сотни других героев комиксов. Эти герои зачастую переходили из одной книги в другую, сотрудничали друг с другом, их приключения переплетались, так что сеть персонажей Марвела насчитывает около 6500 персон (узлов), участвовавших каким-то образом примерно в 13 тысячах комиксов. Именно для этого придуманного сообщества исследователи построили и проанализировали полную сеть социальных связей, пытаясь ответить на основной вопрос: совпадают ли топологические особенности сети виртуальных существ с особенностями сети реальных киноактеров?
Оказалось, что вероятность того, что в данном комиксе действует определенное число персонажей, описывается степенным законом. С этой точки зрения сеть персонажей Марвела выглядит вполне реалистической. Однако, как отметили социологи, сеть «не смогла скрыть своего искусственного происхождения», что проявилось в степени кластеризации , которая оказалась существенно ниже, чем в безмасштабных сетях и сетях малых миров, но одновременно значительно выше, чем в случайных графах. Напомним, что кластеризация характеризует связи внутри узкого «дружеского круга», так что ее высокое значение означает лишь привычную для человеческого общения ситуацию, когда вероятность для двух знакомых иметь общего друга значительно выше, чем для случайно выбранных членов сети в целом. Малая степень кластеризации мира персонажей Марвела явно демонстрирует неестественность механизма его создания и, кстати, показывает, насколько трудно сконструировать некое социальное сообщество.
Если вдуматься, то это не покажется столь уж удивительным. В конце концов, создатели мира Марвела ничего не знали о структуре социальных сетей, да и не пытались создать нечто, напоминающее реальный мир. Они просто объединяли судьбы персонажей в придуманных ими историях и сочетаниях, которые казались им самим интересными. Конечно, реальные социальные структуры тоже возникают и развиваются без четкого плана, однако легко заметить принципиальную разницу между процессами роста, например, сети друзей Человека-Паука и сети общения любого обычного человека, включая автора и читателей этой книги. Мы не можем пока определить точно, как возникают эти различия, однако осознание этого принципиального отличия, возможно, позволит нам лучше постичь механизмы образования социальных связей в реальном мире.
Безмасштабные социальные сети, образуемые людьми в разных сферах деятельности (глобальные торговые сети, железнодорожная система Индии, торговля по системе eBay в режиме он-лайн, китайская сеть авиалиний и т.д.), представляются сейчас настолько фундаментальной характеристикой человеческой культуры, что мы вправе удивляться, не обнаружив ее в каких-либо общественных явлениях. Во множестве структур мы сталкиваемся со степенным распределением, хотя часто его использование требует оговорок (об этом сказано далее). Например, при анализе общественных отношений методом игры меньшинства (гл. 13) в системе устанавливается безмасштабная иерархия и возникают руководящие структуры, при этом очень небольшое число людей приобретает значительную власть и большое влияние.
Иногда даже кажется, что, как только люди начинают взаимодействовать и устанавливать связи, всеобъемлющее гауссовское распределение, которое буквально завораживало ученых-статистиков прошлых веков, вдруг исчезает, и ему на смену приходит безмасштабное распределение.
ВСЕГДА ЛИ БОГАТЫЕ ПРОДОЛЖАЮТ БОГАТЕТЬ?
Сталкиваясь с одинаковым поведением разных систем, внешне не имеющих между собой ничего общего, ученые, естественно, начинают искать общий принцип, определяющий это поведение и позволяющий найти теоретическое объяснение, не связанное с конкретными особенностями изучаемых процессов. Например, мы уже не раз обсуждали проблему резких фазовых переходов в многочастичных системах, которые всегда оказывались связаны с конкуренцией сил, стремящихся упорядочить систему или перевести ее в состояние хаоса. Поэтому мы должны задуматься о существовании общего принципа, на основе которого в столь разных социальных системах мы сталкиваемся с возникновением безмасштабных сетей. Как может быть сформулирован этот принцип?
Мы начинали рассмотрение со случайных графов, изученных Эрдешем и Реньи, и малых миров, возникающих при переключении связей в круговом графе по методу Строгаца и Ваттса. Вспомним, что эти системы основаны и возникают по принципу чистой случайности. Анализируя социальные сети, Барабаши и Альберт заметили, что их рост носит не совсем случайный характер, например, при переключении связей некоторым предпочтением обладают узлы с большей связностью. Это хорошо иллюстрирует сеть связей киноактеров, поскольку новые актеры, естественно, стремятся сниматься с уже известными звездами, а не с подобными себе новичками. Чем выше известность и слава члена (узла) социальной сети, тем более привлекательным становится соседство с ним. С математической точки зрения это означает повышение вероятности создания новых связей в сети.
Легко заметить, что такой же «магнетизм славы» действует и в Паутине, и в сети, образуемой научными ссылками (кстати, это еще один пример безмасштабной системы). Понятно, что веб-страницы, уже содержащие большое количество входящих гиперссылок, становятся хорошо известными и привлекают еще больше ссылок. Люди чаще читают статьи, на которые чаще ссылаются коллеги, и в свою очередь ссылаются на прочитанные статьи и т.д. Другими словами, слава порождает новую славу.
Кто-то может заключить, что в основе этого лежит некий меритократи- ческий принцип, т. е. большее количество цитирования, большее число посещений сайта или более частое появление актера на экране свидетельствуют лишь о том, что именно эта научная статья, сайт или актер действительно являются хорошими. Но это далеко не всегда так. Слава притягивает, но сама слава бывает хорошей или дурной, обе в равной степени привлекательны. Думаю, читатели не затруднятся поиском собственных примеров этого.
Возвращаясь к научной стороне вопроса, отметим, что если бы каждый растущий граф имел тенденцию только к увеличению числа связей на уже самых связных вершинах, то рост должен был бы закончиться вовсе не безмасштабной сетью, а централизацией всех связей на одной-единственной вершине. Однако это практически никогда не происходит в растущих без плана сетях, что и наводит на мысль о еще каком-то механизме регулирования. Например, можно сразу отметить, что в очень больших, разросшихся графах ситуация изменяется, поскольку новой вершине очень трудно «найти» наиболее связную вершину, вследствие чего повышается вероятность связи с одной из менее загруженных вершин. Это обстоятельство прекрасно иллюстрируется ситуацией в мире кино: самые известные звезды не в состоянии сниматься подряд во всех новых фильмах. Таким образом, стремление к созданию связей с наиболее связной вершиной сети выступает не правилом, а лишь тенденцией, вероятностным смещением развития в определенную сторону.
Барабаши и Альберт смогли показать, что эта тенденция — лишь одна из особенностей роста безмасштабных сетей. Они предложили рассмотреть граф, растущий за счет добавления новых вершин, каждая из которых связывается с уже имеющимися вершинами случайным образом, но с некоторым предпочтением, которое отдается при этом более связным вершинам. Как оказалось, при этом образуется безмасштабная сеть. Рост многих финансовых и общественных организаций происходит по принципу «богатые всегда становятся еще богаче». Например, более крупные фирмы с большей вероятностью (хотя и не всегда) привлекут новых клиентов, что, кстати, частично объясняется и тем, что они могут обеспечить себе лучшую рекламу, т.е. создать больше «славы».
Аналогия станет яснее, если учесть, что в некоторых случаях число связей вершины может быть непосредственно связано с «богатством», например, если рассматривать связность вершины в качестве показателя числа связанных с фирмой клиентов. Если в обществе существует свобода выбора, а возможности фирмы привлечь новых клиентов зависят от числа уже имеющихся клиентов, то степенное распределение неравенства станет весьма вероятным исходом. Конечно, на любом свободном рынке имеются различия, например, в доступности ресурсов для разных торговцев, но процесс безмасштабного роста будет быстрее усиливать неравенство участников по сравнению со случайным распределением богатства. Результатом такого развития может стать заметное число «особых случаев» — очень богатых индивидов или чудовищных по размеру компаний. Социолог Джордж Кингсли Ципф еще в 1930-х годах указывал, что почти всегда в общественных явлениях мы наблюдаем действие степенного закона распределения по размеру компаний (гл. 11), городов и доходов (гл. 10).
Из этого не следует, что степенной закон неравенства неизбежен при свободном рынке. Но если мы сочтем такое неравенство нежелательным, нам скорее всего придется несколько ограничить те самые свободы, на которых построена деятельность рынка.
Следует, однако, отметить, что подобный рост сетей далеко не всегда приводит к такому большому неравенству. Джен Стэнли из университета Бостона, изучив роль и возможности безмасштабных сетей, описанных Бара- баши и Альберт, обнаружил ограниченность их применимости. Возьмем для примера уже привычную сеть киноактеров. Степенной закон распределения предсказывает наличие нескольких знаменитостей с огромным количеством связей, однако это не так, количество связей даже наиболее востребованных актеров заметно ниже предсказанного теорией (рис. 16.7).
Рис. 16.7. Киноактеры с наибольшим количеством связей не вписываются в степенную зависимость, характеризующую всех прочих актеров, — те из них, кто имеет более трехсот совместных работ, обладают существенно меньшим количеством связей, чем предсказывает степенной закон. Другими словами, существует верхний предел совместных работ, в которых может принимать участие актер.
Что ограничивает применимость степенного распределения вероятностей? Стэнли и его сотрудники уверены, что ограничения связаны с реальными жизненными обстоятельствами, лимитирующими предельные проявления такого распределения. Даже самый талантливый и трудолюбивый актер за короткий срок человеческой жизни не может сняться, например, в тысяче фильмов. Аналогично старые научные статьи, даже самые значимые, рано или поздно перестают упоминаться, это вовсе не означает истинного забвения, просто современные ученые не читают старые работы, а ссылаются на последние обзоры или учебники. Ограничена пропускная способность аэропортов, а цены и локальная демография кладут предел росту самих аэропортов. Если вершины имеют некоторый предел насыщения по связям или их способность образовывать новые связи уменьшается со временем (аналог возраста), то безмасштабность структуры перестает действовать для наиболее связных вершин.
При некоторых других ограничениях степенное распределение вообще отходит на второй план, так как определенные социальные обстоятельства делают ничтожной вероятность возникновения суперсвязных центров. В качестве примера можно привести энергосеть южной Калифорнии или мировую сеть аэропортов, связанных маршрутами авиационных перелетов. Более того, Стэнли и его коллеги показали, что аналогичная ситуация обнаруживается и при анализе некоторых реальных социальных сетей типа группы из 43 близких друзей, принадлежащих к секте мормонов в штате Юта (где такие связи имеют прочную и давнюю традицию), или нескольких сотен студентов университета Мэдисон в штате Висконсин. Все такие социальные сети описываются гауссовским распределением, т. е. обладают некоторым «усредненным» значением связности. Но одновременно они являются и сетями малых миров, так как им присущ свойственный таким сетям медленный рост характеристической длины пути при увеличении числа узлов.
Обобщая сказанное, можно констатировать, что мы имеем дело с несколькими типами объектов, объединенных общим названием малых миров. С самого начала придуманные Строгацем и Ваттсом малые миры обладали только «одним масштабом», связанным с предпочтительным значением средней связности узлов и резким падением числа узлов с высокой связностью. В качестве противоположного варианта образования таких систем появились предложенные группой Барабаши безмасштабные сети, в которых «жадные» или «неразборчивые в связях» узлы не имеют пределов роста, и могут образовываться узлы с очень большой связностью. Как говорил сам Барабаши, между этими двумя крайностями возник и развился «целый зоопарк различных типов социальных сетей»12. Независимо от точной топологии, сети малых миров почти никогда не формируются по плану или программе, а возникают сами собой в результате задаваемых законов соединения возникающих узлов с уже существующими.
Интересный взгляд на проблему предложили Ниш Матиас и Венкатеш Гопал из университета в Бангалоре (Индия), которые считают, что любая сеть такого типа представляет особый интерес с инженерной точки зрения, поскольку она всегда является некоторым идеальным компромиссом между двумя противоположными требованиями: максимизации количества связей между вершинами и минимизации общей длины этих связей. В общем случае соединение двух вершин в сети имеет вполне конкретное стоимостное выражение, понятно, что стоимость соединительного кабеля, трубопровода и т. п. растет пропорционально длине. Также очевидно, что наиболее эффективная связь в сети реализуется в том случае, если все вершины напрямую связаны друг с другом, но такое соединение оказывается чрезвычайно сложным и дорогим. Поэтому создатели сетей всегда предпочитают создавать систему с меньшим числом соединений, имеющих кратчайшую длину, в то время как пользователи систем всегда предпочитают иметь дело с большим числом соединений, имеющих большую длину (обеспечивающих, кстати, «короткие» пути). Матиас и Гопал показали, что первый набор требований лучше всего удовлетворяется в структурах, напоминающих регулярные решетки, а второй — в случайных сетях. Сети малых миров позволяют нам заменить очень дороіую и громоздкую регулярную решетку на более дешевую систему, обеспечивающую надежную связь на больших расстояниях.
Несмотря на то что физика сетей — совсем молодая наука, она уже позволила выявить ряд ценных закономерностей функционирования социальных структур. В настоящее время ученые только приступают к исследованию топологических особенностей сетей, которые соответствуют, например, распространению эпидемических заболеваний, культурных норм и т. д. В экономике становится все более очевидным, что именно анализ торговых сетей должен стать ключом к пониманию сложной динамики рыночных отношений. В заявлении организаторов семинара по эконофизике (институт Сан- та-Фе, 1996) отмечалось, что «функционирование рынков осуществляется сетями торговцев, поэтому события на рынке могут отражать структуру этих сетей, которая, в свою очередь, зависит от того, как эти сети возникли»13.
Появление теории сетей можно рассматривать в качестве естественного этапа в развитии статистической физики. С теоретической точки зрения новая теория представляет собой лишь вариант описания классической многочастичной системы, в которой сталкивающиеся частицы не разлетаются подобно бильярдным шарам, а образуют некие постоянные, упругие связи. Тем самым в структуре сети, в частности Интернета, отражается история ее создания. В сетях предыстория имеет значение, прошлое, образно говоря, «вморожено» в существующие формы и влияет на настоящее. Такие сети могут служить образом самой человеческой жизни, которая сплетается из огромного количества почти непонятных для нас самих нитей причин и следствий.