Виртуальные приключения Фаины и Файки

(Продолжение. Начало в № 3 за 2001 г.)

Рубрику ведет Дмитрий УСЕНКОВ , старший научный сотрудник Института информатизации Образования РАО

Художник В.Губанов

Перед девочками снова расстилалось пестрое одеяло Великого Базара.

На этот раз Микки привела и ко входу в нечто вроде банковской конторы. Внутри за стойкой дежурил робот — совсем такой, каких Фаина видела на картинках в Детской энциклопедии.

— Справочная слушает, — полупропел робот хорошо смазанным металлическим голосом. — Что вы хотите найти?

— Windows! — наугад сказала Фаина.

— Пожалуйста! — ответил робот и через несколько секунд протянул девочкам длиннющий список названий, каждое из которых сопровождалось небольшой аннотацией.

— Как много! — изумилась Фаина. — Да здесь понадобится несколько дней, чтобы посмотреть все эти ссылки!

— Тогда уточни запрос, — посоветовала Файка, мельком взглянув на список. — Попроси поискать не просто слово «Windows», а что-то более конкретное.

— Ладно, — ответила Фаина. И, обращаясь к роботу, сказала: — Найдите нам, пожалуйста, все про Рабочий стол Windows.

— Пожалуйста! — охотно откликнулся робот все той же стандартной фразой. На этот раз список был существенно короче, хотя и занимал несколько страниц.

— Смотри-ка! — Фаина потянула подружку за рукав. — Я хотела найти информацию про компьютерную операционную систему, а тут есть даже ссылки на странички столярных фабрик! Вот, например: «Предлагаем окна, двери, рабочие столы, стулья и прочие изделия из натуральной древесины».

— Правильно! — ответила Файка. — Сейчас большинство поисковых серверов такого типа выполняют автоматический перевод заданного ключевого слова или фразы на несколько языков. Ты задала для поиска ключевую фразу, в которой было английское слово «Windows» и русские «Рабочий стол», и робот произвел поиск по всем возможным вариантам их значений на русском и английском. Ведь здесь, в отличие от каталога, все делается автоматически. Сбор информации о различных сайтах, формирование из нее базы данных, обработка заданного тобой ключевого слова или фразы, поиск в базе данных и выдача результирующего списка ссылок — все это делает специальная программа, работающая на поисковом сервере, без вмешательства людей. А программы пока еще только учатся понимать смысл текста, они чаще всего только проверяют факт наличия в тексте заданного тобой слова. Поэтому и список, полученный в результате такого поиска, гораздо менее четкий, чем каталог ресурсов. Но зато автоматическая программа может обработать и включить в свою базу данных сведения о гораздо большем количестве сайтов.

— А как производится этот сбор сведений? — полюбопытствовала Фаина.

— Если хочешь, давай посмотрим! — предложила та. — У меня как раз есть адресок одной новой странички, которая наверняка этому «поисковику» еще не известна. И нам интересно, и ему будет польза.

— У меня есть новая страничка! — сказала Файка, обращаясь к роботу.

— Введите адрес! — оживился тот и выдвинул из-под крышки стола клавиатуру. Файка быстро настучала на клавишах требуемое.

— Информация принята! — ответил робот. — Высылаю «паука».

Дверь в стене комнаты раскрылась, и из нее выполз, разминая суставчатые лапы, грозного вида «паук» ростом с хорошую собаку.

— Ой! — испуганно зашептала Фаина. — Какой страшный! Он нас не съест?

— Не бойся! — рассмеялась Файка. — Это поисковый «паук». Ведь Интернет часто называют Всемирной паутиной, значит, и ее коренными обитателями должны быть «пауки». Не правда ли?

«Паук» важно кивнул в ответ и указал передними лапами себе на спину.

— Вы нас приглашаете в путешествие? — спросила Фаина.

«Паук» снова кивнул и опустился пониже, чтобы девочки могли вскарабкаться на его широкую спину. Мягкое и теплое тельце «паука» оказалось удобным, как спинка кресла.

«Паук» приподнялся и поспешил наружу, переставляя лапы и слегка покачиваясь на ходу.

— Не спи! Мы уже приехали! — легонько подтолкнула Файка задремавшую было подругу. Действительно, «паук» уже протискивался в двери новенького, ярко раскрашенного клуба любителей фантастики. Любители, среди которых были не только люди, но и пришельцы с других планет, учтиво расступались, пропуская их внутрь. «Шкурки», — шепнула Файка на ушко подруге, — как в чате». Та кивнула, вспомнив, что посетители подобных заведений могут при желании принимать любой облик, какой выберут сами.

Несколько минут «паук» внимательно осматривал окружающее, задумчиво шевеля челюстями, словно бормотал что-то себе под нос. Затем из его головы выдвинулась короткая антенна. «Передает собранную информацию на поисковый сервер», — прокомментировала Файка. А когда антенна спряталась, «паук» вдруг приподнялся повыше на своих лапах и выпустил из-под брюшка несколько «паучат», точно таких же, как он сам. только меньше росточком. «Паучата» помахали на прощание передними лапками и резво разбежались по одним им известным направлениям, на ходу вырастая до «взрослых» размеров. А сам «паук»-родитель заколыхался и бесследно исчез, как будто его и не было.

— Все, цикл сбора информации завершен, — сказала Файка. — Наш «паук» выполнил сбор и первичную обработку информации о новом сайте, передал ее на поисковый сервер, где робот включит ее в состав базы данных и выработает соответствующий набор ключевых слов. Попутно «паук» обнаружил здесь несколько ссылок на другие сайты и разослал к ним свои копии, чтобы проанализировать их, а завершив свою миссию, самоликвидировался. Ведь это тоже всего лишь программа, хотя и способная автономно действовать на других серверах.

Команда «Найти»

Девочки снова оказались дома, перед компьютером. На этот раз на экране дисплея светилась страничка поискового сайта «Яндекс».

— Вот это прямоугольное поле и служит для ввода ключевого слова или фразы. — Файка навела на него курсор «мыши» и набрала: «Windows». — Когда введешь его, щелкаешь «мышью» на кнопке «Найти», вот так. — Картинка на экране сменилась на список. — Видишь, в каждой строчке списка дано название странички или ее адрес, и такая строчка является ссылкой на саму эту страничку. Под ней дана аннотация — обычно это первые несколько строчек текста.

Щелкнешь «мышью» на ссылке — откроется еще одно окно браузера, в которое загрузится соответствующая страничка.

Прокручивая список вверх-вниз, можно просмотреть его весь, если он не умещается на экране целиком. Но это — только его первый лист! Видишь, внизу есть такая строчка: «Страницы: [<<] 1|2|3|4|5|6|7|8|9 | Еще >>? В ней цифры означают номера листов списка, одна из них обычная — это номер того листа, который сейчас открыт. А другие — это ссылки, если щелкнуть «мышью» на любую из них, взамен текущего откроется другой лист списка. Можно щелкнуть «мышью» на расположенных по бокам «стрелкам» вправо или влево, тогда будет открыт следующий по порядку или предыдущий лист списка. А если одной из «стрелок» (или их обеих) нет, значит, данный лист последний, первый или единственный, соответственно. Если список слишком велик, можно повторить поиск, введя более точную ключевую фразу в такое же поле ввода, как и в первый раз, — вот оно, вверху списка. Можно также сузить диапазон поиска. Видишь, рядом с кнопкой «Поиск» в прямоугольном окошке (рис. 1) написано «Весь Интернет»? Если щелкнуть «мышью» по маленькой серой кнопочке справа от этого окошка, то раскроется список, и в нем можно выбрать другую строчку, например, «Рунет», — тогда поиск будет вестись только в русскоязычной части сети. Есть здесь и еще несколько режимов, управляющих флажков и специальных ссылочек вроде «Показать найденные слова» или «Похожие документы», но мы их пока использовать не будем, чтобы не запутаться. Поняла? — Файка наконец перевела дух.

— В общем-то да, — кивнула Фаина. — А еще какие-нибудь способы ориентироваться в Интернете есть?

Великое кольцо

Вместо ответа Файка взмахнула рукой, и перед девочками выплыла из синевы целая стена, состоящая из множества дверей с вывеской над каждой из них: «Новости», «Спорт», «Погода». «Телепрограмма», «Курс доллара»… Посредине располагалась гораздо более крупная и ярче разукрашенная дверь под большой вывеской: «Мегаэнциклопедия».

— Это — мультипортал на сайте «Энциклопедия Кирилла и Мефодия», — обвела рукой все это великолепие Файка. — Во-первых, здесь размещается компьютерная энциклопедия, а вернее — больше десятка их по различным тематикам, объединенные вместе, так что поиск для заданной тобой ключевой фразы производится по всем энциклопедиям сразу. А во-вторых, здесь же размещается подборка ссылок на сведения, которые требуются чаще всего большинству пользователей Интернета. То есть мультипортал (или просто портал) — это что-то вроде каталога ресурсов, но маленького по объему, сформированного по принципу популярности ссылок и выполненного чаще всего без иерархической структуры: здесь не требуется проходить по «дереву разделов», а просто содержатся переходы на соответствующие сайты или даже на другие странички того же портала.

— А еще? — Фаине этого было явно мало.

— Ну, если нужно «еще»… — Файка потянула ее за руку куда-то ввысь. — Смотри!

В черноте ночного неба, среди звезд, протянулось множество ярких белых нитей, образуя огромное, как Млечный Путь, туманное кольцо. Файка выбрала одну из нитей и устремилась вдоль нее в пустоту. Впрочем, полет был недолгим, и вскоре впереди показалась красивая зелено-голубая планетка, нанизанная на нить, словно бусинка ожерелья. Со свистом пронизав атмосферу, девочки приземлились в парке какого-то большого города. На полянке широко раскинул ветви огромный дуб, явно выделявшийся среди других деревьев, как Дядька Черномор — на фоне своего морского воинства.

— Привет! — Файка помахала рукой пестрой компании, проезжавшей мимо в странного вида мобиле, напоминающем помесь пылесоса, вентилятора и роликового конька. Машина круто затормозила, и пассажиры резво повыпрыгивали наружу, радостно приветствуя Файку: два бурундучка в кожанке и красной с желтым рисунком рубашке, коренастый мышь, рядом с которым кружился зеленый мушонок, и очаровательная белая мышка — водительница странного экипажа, в сиреневом рабочем комбинезоне и летных очках-«консервах», надетых на лоб поверх подсолнухово-желтых густых волос.

— Это же Rescue Rangers из мультика! — теребила Фаина Файкин рукав, заметив на борту мобиля эмблему с молнией и двумя переплетенными «R». — Чип, Дейл, Рокфор с Вжиком и, конечно же, Гаечка!

— Правильно, — ответила Файка. — Это мои давние друзья!

После церемонии знакомства Фаины с каждым из Спасателей, выполнявшейся по всем правилам этикета к великой забаве всех ее участников, и неторопливого обмена новостями Гайка поинтересовалась, не нужна ли помощь ее новой подруге.

— Ну, разве что рассказать ей о Великом Кольце, — улыбнувшись, ответила Файка, посмотрев на немного растерявшуюся Фаину.

— Это нетрудно! — улыбнулась мышка. — Ты когда-нибудь слышала о параллельных вселенных?

Фаина неуверенно помотала головой. Что-то подобное ей как-то раз встретилось в одной из фантастических книжек, но, о чем там шла речь, она точно не помнила.

— Есть такая теория, что наша Вселенная не единственна, — терпеливо начала объяснять Гайка. — И что, кроме нее, есть еще множество других вселенных, в некоторых из них существует такой же мир, как и у нас. Ну, или почти такой же. Например, там есть такой же город, как этот, такой же дуб… и команда Спасателей, почти таких же, как мы. Вообще-то происходящее в этих вселенных совершенно независимо друг от друга — ну хотя бы здесь, в нашем мире, вы приехали к нам в гости, а в других мирах — нет. Но для миров, существующих в Интернете, есть способ связи между ними, называемый Великим Кольцом, или более строго — WebRing. Все эти миры нанизаны на Кольцо, как четки на шнурок, и ты можешь перелетать с одной планеты на другую по порядку вперед или назад и никогда не заблудишься…

В грамм добыча, в год труды…

Перед Фаиной снова возник дисплей, на экране которого красовался групповой портрет героев мультика «Чип и Дейл спешат на помощь». Файка задумчиво водила курсором «мыши» вблизи строчки из нескольких ссылок на английском языке, располагавшихся внизу страницы.

— Это Кольцо специально посвящено Rescue Rangers, — продолжила прерванное объяснение Файка. — Но есть и еще множество самых разных колец WebRing, каждое из которых посвящено какой-то одной тематике. Кольцо связывает в единую замкнутую цепочку множество сайтов по этой теме, и на каждой из головных страниц этих сайтов есть такой вот набор ссылок: «Next» и «Prev» позволяют двигаться по кольцу в одном из двух возможных направлений, «Random» — перепрыгнуть на один из входящих в кольцо сайтов, выбранный случайным образом, «List Sites» выдает на экран весь список названий входящих в кольцо сайтов, а «Next 5» — список следующих пяти. И для всех этих колец есть единый сервер WebRing, где можно отыскать перечень тем, для которых существуют такие кольца. А поскольку войти в такое кольцо — честь для разработчика сайта, а для получения статуса «участника кольца» нужно соответствовать целому ряду требований, ну хотя бы «чистоты темы», то WebRing объединяет в себе четкое соответствие тематике, присущее каталогам ресурсов, и полноту информации, почти такую же, как для поиска по ключевым словам, — ведь здесь инициатива принадлежит энтузиастам, знатокам своей тематики, а не группке экспертов, вынужденных быть в этом смысле «универсалами».

— И все-таки найти что-нибудь в Интернете ничуть не легче, чем иголку в большом стоге сена! — подвела итог путешествию Фаина.

— Точно! — отозвалась Файка. — Здесь еще можно вспомнить стихи Маяковского, помнишь: «…та же добыча радия. В грамм добыча, в год труды». Пока перероешь весь выданный «поисковиком» список, да еще списки, полученные с других поисковых сайтов, — ведь далеко не всегда какая-то редкая страничка есть в базе данных «Яндекса» или «Апорта», — иной раз не один день пройдет. Это как промывка золота: приходится собирать крупинку к крупинке, иногда повезет — и попадется сколько-нибудь большой самородок, но чаще перемываешь пустую породу.

— Ну, может быть, в будущем придумают что-нибудь новое, чтобы облегчить эту работу? — неуверенно спросила Фаина.

— Может быть, — эхом отозвалась Файка. — Например, будут наконец-то созданы компьютерные системы с искусственным интеллектом, которые не только смогут автоматически просматривать сайты и вести поиск формального вхождения в базу данных ключевых слов, но и смогут понимать смысл содержащейся на этих сайтах информации. Возможно, такая система будет понимать речь и отвечать голосом вслух или даже самостоятельно отвечать на заданные тобой вопросы, проанализировав всю имеющуюся в Интернете информацию по этой теме. А может быть, все закончится тем, как описывает одно инопланетное общество писатель Станислав Лем в повести «Осмотр на месте», где главной задачей науки стало не исследование нового, а поиск того, что было изучено по этому вопросу ранее, так что весь Интернет придется превратить в одну гигантскую поисковую службу. Что ж, доживем — увидим! — немного грустно улыбнулась она Фаине на прощание.

И на этом вечер чудес благополучно закончился…

ИНТЕРНЕТ-СЛОВАРИК

• Поиск по ключевому слову — автоматизированная технология, основанная на поиске вхождения в информационные «выжимки», хранящиеся для каждого сайта из числа включенных в базу данных поискового сервера, заданного пользователем слова (слов) или фразы. Ключевое слово/фраза вводится в специально отведенном поле. После подтверждения ввода (щелчком «мышью» на имеющейся экранной кнопке или нажатием клавиши Enter) поисковый сервер возвращает Web-страницу, содержащую список, в котором для найденных сайтов даны их названия (обычно являющиеся ссылками на сами сайты) и короткие аннотации (обычно несколько первых строк содержащегося на странице текста).

Информационное наполнение (база данных) обычно создается автоматически работающей на данном сервере программой, рассылающей по сети автономные модули — «пауки», выполняющие сбор, первичный анализ и пересылку на поисковый сервер информации об обрабатываемых сайтах.

Преимущества: значительно больший, чем для каталогов, охват имеющейся в Интернете информации.

Недостатки: значительное количество «информационного шума» в результирующем списке (ссылок на сайты, в содержимом которых заданное ключевое слово употреблено лишь формально).

Пример: поисковая служба «Яндекс» (рис. 1).

Рис. 1

• «Пауки» — автономные программные модули, рассылаемые поисковым сервером на анализируемые сайты. Обычно «паук» выполняет сбор информации об анализируемом сайте, ее первичную обработку (создание «информационной выжимки») и пересылку на поисковый сервер, где основная программа добавляет эти сведения в базу данных. При обнаружении на анализируемом сайте ссылок на другие сайты «паук» может отправлять на них свои копии. После завершения работы «паук» самоуничтожается.

Технология «пауков» позволяет включить в сферу поиска максимально возможное количество сайтов, но у многих специалистов вызывает опасение тот факт, что способность этих программных модулей к автономной работе на других серверах (точнее, заложенное в системах безопасности этих серверов разрешение на допуск «паука» к информации и его запуск на исполнение) может стать «лазейкой» для создателей компьютерных вирусов и каких-либо разрушительных действий.

• Логика построения поискового запроса — правила, позволяющие формировать правильную ключевую фразу из набора ключевых слов. В зависимости от поставленной поисковой задачи возможны следующие ситуации:

— точное соответствие, когда в искомом тексте должна присутствовать именно эта фраза и никакая иная (пример: компьютерная мышь);

— в искомом тексте должны находиться все заданные ключевые слова (пример: мопеды И мотоциклы);

— достаточно, если в искомом тексте присутствует хотя бы одно ключевое слово (пример: самолет ИЛИ вертолет);

— одно или несколько ключевых слов не должно входить в искомый текст (скажем, чтобы отсечь большой массив «ложных» ссылок; пример: локомотив НЕ футбол).

Иногда отдельно рассматривается ситуация, когда еще заданные ключевые слова должны не только присутствовать в тексте, но и располагаться рядом, например, в пределах одного абзаца. Важным часто является и регистр букв (строчной или прописной), например, ключевое слово «лебедь» позволяет найти и птицу, и генерала, а «Лебедь» — только фамилию.

Современные поисковые серверы, как правило, предоставляют возможность ввода ключевой фразы в свободной форме и автоматически выполняют ее смысловую предобработку: выделение ключевых слов с отсечением незначащих (предлогов, местоимений и пр.), вариации окончаний слов, иногда автоматический перевод фразы на другие языки (например, заданная пользователем фраза «книги по программированию на Бейсике» автоматически превращается в запрос типа: (книга ИЛИ книге ИЛИ книгу ИЛИ книги ИЛИ книг ИЛИ book ИЛИ books) И (программирование ИЛИ программированию ИЛИ программирования ИЛИ programming) И (Бейсик ИЛИ Бейсике ИЛИ Бейсика ИЛИ Бейсику ИЛИ Basic ИЛИ BASIC). Кроме того, при задании нескольких ключевых слов в результирующий список могут включаться и сайты, в которых содержатся не все эти ключевые слова (на поисковом сервере «Яндекс» в этом случае после аннотации, помещенной в результирующий список, делается примечание: «Нестрогое соответствие»). Дополнительно предусматривается сортировка найденных ссылок в списке по «релевантности» — этот термин подразумевает максимальное соответствие найденных страниц заданному ключу поиска, которое программа определяет на основе анализа количества вхождений ключевых слов в текст, место, в котором они обнаружены (наиболее подходящими, например, считаются страницы, где ключевые слова обнаружены в заголовке документа), благодаря использованию алгоритмов «искусственного интеллекта» (хотя они пока еще далеко не совершенны). Соответственно, в результирующем списке наиболее подходящие ссылки выдаются первыми.

Конкретные правила записи (синтаксис) поискового запроса на конкретном поисковом сервере могут несколько отличаться от остальных (обычно на головной странице «поисковика» можно найти ссылку на описание этих правил). Чаще всего операция И обозначается символом «&» или «+» (а иногда подразумевается по умолчанию, если слова записаны друг за другом через пробелы), ИЛИ — символом «|», НЕ — «~» (либо знаком «минус» перед ключевым словом), а фраза, которая должна присутствовать как образец, должна целиком заключаться в кавычки.

• Портал, мультипортал — сайт, содержащий подборку ссылок на информацию, чаще всего требуемую большинству пользователей Интернета, не являющихся профессионалами в области компьютики: сведения о погоде, курсе валюты, новости, программы телевидения, спортивные события и пр.

• WebRing — технология объединения в единую тематическую подборку различных сайтов, при которой формируется замкнутый в кольцо массив ссылок на них, а на каждом из этих сайтов содержатся типовые ссылки «Next» (переход на следующий сайт в кольце), «Prev» (переход на предыдущий сайт в кольце), «Random» (переход на случайно выбранный сайт кольца), «List Sites» (переход на полный список сайтов, входящих в кольцо) и «Next 5» (выдача списка следующих пяти сайтов). Поддержка всех подобных колец осуществляется централизованно на сервере WebRing.

Пример: модуль на сайте Russian Project «Chip & Dale — Rescue Rangers» (рис. 2).

Рис. 2

Адресная книга

Поисковые серверы:

— Яндекс —

— Rambler —

— AltaVista —

— Yahoo —

Мультипортал «Кирилл и Мефодий» —

Сервер WebRing —

Файкина анкета

Ребята! Давайте познакомимся поближе! Я приготовила для вас несколько вопросов. Чтобы ответить на них, пометьте ответ или ответы, с которыми вы согласны, — если слева от ответов стоят кружочки, то выбрать можно только один ответ из имеющихся, если квадратики — можно выбрать несколько ответов, а иногда нужно будет вписать свой ответ в отведенную графу. Заполнив анкету, пришлите ее в редакцию по адресу: 125015, Москва, А-15, Новодмитровская ул., 5а . Или же по электронной почте: [email protected] .