3.1.3. Лаборатория виртуальных специалистов
Понятно, что все-таки люди больше доверяют людям, способным, в отличие от робота, принимать решения в нестандартных ситуациях и оперативно действовать согласно им. Чтобы создать интеллектуального робота, требуется время и другие затраты на его подготовку для проведения специальных действий в ходе информационной операции. Поэтому надежными исполнителями по-прежнему остаются специально нанятые посетители, которые за определенную плату или по идейным соображениям периодически заходят на заданное множество сайтов и выполняют оговоренные с заказчиком действия. Они регистрируются под несколькими никами и массово продвигают определенную идею.
В Сети рекрутинговые интернет-ресурсы для троллей содержат типовые объявления:
«На постоянную работу требуется специалист по работе в социальных медиа (фейсбук, вконтакте, твиттер, ЖЖ и др. блоги). График работы гибкий/свобод-ный. Оформление по ТК. Обязанности: работа в комментариях — требуется оперативная реакция на изменяющуюся ситуацию в блогах, способность поддержания дискуссии и перенаправление ее в требуемое русло; создание виртуалов, написание постов от их имени, раскрутка; мониторинг социальных медиа. Требования: опыт использования социальных сетей и блогов как продвижение чего-либо, понимание механизма их работы и психологии пользователей. Знание популярных блогеров, их основных позиций приветствуется».
Рнтересно, что такой СЃРїРѕСЃРѕР± используется даже РЅР° государственном СѓСЂРѕРІРЅРµ. РћРЅ С…РѕСЂРѕС€ тем, что позволяет довольно быстро собрать эффективно действующую армию информационных бойцов.
Например, РІ 2010 РіРѕРґСѓ Рзраиль РѕР±СЉСЏРІРёР» призыв добровольцев РІ своеобразную «армию блоггеров», которой предстоит выйти РЅР° поля интернет-сражений для Р±РѕСЂСЊР±С‹ СЃ антисионизмом. Р СѓРєРѕРІРѕРґРёС‚ проектом министерство абсорбции Рзраиля. Согласно опубликованному министерством объявлению, РѕРЅРѕ приглашает израильтян, владеющих каким-либо иностранным языком, представлять Рзраиль РІ антисионистских блогах РЅР° английском, французском, испанском Рё немецком языках. Также представляют интерес блоггеры, пишущие РЅР° СЂСѓСЃСЃРєРѕРј Рё португальском.
Более того, «Всемирный совет еврейского студенчества (World Union of Jewish Students, WUJS) нашел СЃРїРѕСЃРѕР± организовать эффективную Р±РѕСЂСЊР±Сѓ Р·Р° РјРёСЂРѕРІРѕРµ общественное мнение РІ Рнтернете. Р’ начале РІРѕР№РЅС‹ СЃ «Хезболлой», РєРѕРіРґР° Рзраиль, как всегда РІ таких случаях, начал проигрывать информационную РІРѕР№РЅСѓ, WUJS выступил СЃ РЅРѕРІРѕР№ инициативой: создать РІ интернете активное произраильское сообщество, которое могло Р±С‹ РІ режиме реального времени реагировать РЅР° появляющиеся РІ сети антиизраильские материалы. Рнициативу поддержал отдел РїРѕ СЃРІСЏР·СЏРј СЃ общественностью израильского РњРР”, Р° техническое средство реализации идеи обеспечила израильская компания РїРѕ разработке программного обеспечения: была создана программа РїРѕРґ названием В«Рнтернет-мегафон», позволяющая быстро оповестить всех желающих Рѕ появляющихся РІ сети онлайновых опросах, статьях Рё форумах, связанных СЃ Рзраилем. Добровольцы WUJS ежедневно ведут мониторинг Рё сообщают РѕР±Рѕ всех интернет-публикациях, которые, РїРѕ РёС… мнению, требуют реакции израильской публики. Отныне внести СЃРІРѕР№ вклад РІ информационную РІРѕР№РЅСѓ Р·Р° интересы Рзраиля может любой желающий В».
Соединенные Штаты РІ РЅРѕСЏР±СЂРµ 2009 РіРѕРґР° сформировали аналогичное интернет-подразделение — «Команда РїРѕ цифровым внешним контактам». Данное подразделение предназначено для противодействия антиамериканской дезинформации РІ Рнтернете Р·Р° рубежом. Р’ ее задачу РІС…РѕРґРёС‚ присутствовать РІ Рнтернете — РІ чатах, РЅР° популярных интернет-сайтах Рё РІ блогах, рассказывая РѕР± американской политике, исправлять ошибки, которые имеют место, Р° также отсылать людей «к правильным документам».
Так все же, какие специальные мероприятия в контексте перечисленных в разделе 1.1 типовых задач способны выполнять люди, выступающие акторами информационной операции в телекоммуникационной среде, а какие задания — виртуальные специалисты-[ро]боты? Сравним:
Множество действий, доступных виртуальному специалисту, — это также:
— рассылка сообщений-напоминаний, аудио, видеоматериалов в рамках утвержденного графика работ;
— регулярный СЃР±РѕСЂ материалов СЃ заданных источников РІ сети Рнтернет, обработка (реферирование), хранение;
— сбор аудио-, видеоинформации с WEB-камер и других технических средств;
— ведение новостной ленты (кто и когда включил/выключил компьютер, отправил сообщение, сколько раз обратился к той или иной базе данных и т. п.);
— контроль технологических процессов;
— ведение журналов аудита;
— разработка предсказаний; предупреждение о возможной опасности;
— акцентирование внимания руководства на нетипичных ситуациях;
— ответы на вопросы с использованием всего спектра разнородной информации (текст, аудио, видео), обсуждение сформулированной человеком проблемы; при этом диалог может вестись как в виде текстовых сообщений, так и голосом и на уровне видеореплик (так, например, браузер Google Chrome позволяет вводить запросы и реплики голосом с высоким качеством распознавания).
Одним из перспективных направлений для решения перечисленных выше функциональных задач является применение специального программного обеспечения, интерфейс которого идентичен поведению реального пользователя сети. Понимаем, что виртуальный специалист — это программный модуль, написанный на языке web-программирования, например, php. Модуль исполняется на сервере и способен использовать любые доступные ему как программному модулю ресурсы. Особенностью модуля является наличие всех тех механизмов, которые пожелает встроить в него разработчик.
Благодаря перечисленным особенностям Рё функциональным возможностям, виртуальные специалисты становятся РІСЃРµ более востребованными. Создание виртуальных специалистов возможно практически РІ любой предметной области. РРј находится место Рё РІ качестве бойцов РЅР° информационном поле Р±РѕСЏ. Таким путем РёРґСѓС‚ РІ РЎРЁРђ, например, РІ 2011 РіРѕРґСѓ контракт стоимостью 2,76 млн. долл. достался зарегистрированной РІ Лос-Анджелесе компании Ntrepid. Цель контракта — разработать специальное программное обеспечение (РџРћ) для проведения проамериканской пропаганды через различные социальные сети Рё блоги. «По словам представителя Centcom Билла РЎРїРёРєСЃР°, данная технология позволит вести секретную блогерскую деятельность РЅР° зарубежных сайтах. Р’ частности, такое РџРћ поможет противодействовать распространению пропаганды Р·Р° пределами РЎРЁРђ, кампаниям РїРѕ дезинформации или хакерским атакам… РІ рамках этой программы Р±СѓРґСѓС‚ создаваться вымышленные виртуальные личности РІ Twitter, Facebook Рё РґСЂСѓРіРёС… соцсетях, которые РїРѕ всем внешним признакам должны казаться обычными пользователями РёР· разных стран Рё иметь убедительную легенду. РџРѕРґ контролем РѕРґРЅРѕРіРѕ военного будет РґРѕ десяти онлайн-персонажей. Единый РїСѓРЅРєС‚ управления расположится РЅР° базе Р’Р’РЎ РЎРЁРђ Макдилл близ Тампы (Флорида) Рё будет функционировать РІ круглосуточном режиме. Работать РІ нем будет РґРѕ 50 операторов. Также предусмотрена система защиты РѕС‚ разоблачения. Отличить Р±РѕС‚ РѕС‚ настоящего пользователя будет еще более затруднительно, поскольку фэйловым аккаунтам замаскируют IP-адрес. Рто позволит создать видимость того, что посты отправляются реально существующими пользователями РёР· разных стран». РџРѕ словам Билла РЎРїРёРєСЃР°, пресс-секретаря Центрального командования Р’РЎ РЎРЁРђ, данная система будет использоваться для общения РЅР° арабском, фарси, СѓСЂРґСѓ, пушту Рё РґСЂСѓРіРёС… языках. Данный проект позволит американской армии РЅРµ только получать оперативную информацию РѕС‚ пользователей Рѕ текущем состоянии РІ регионе, РЅРѕ Рё добиться «эффекта ложного единодушия» РІ онлайн-РґРёСЃРєСѓСЃСЃРёСЏС….
Для виртуального специалиста вполне реально сформулировать цели, задачи и правила поведения — это, в первую очередь, постоянное расширение знания в той предметной области, за которую он отвечает, а во вторую — набор правил, согласно которым он функционирует, зафиксированные в его функциональных обязанностях. Виртуальный специалист должен постоянно актуализировать данные, информацию, знание. Он обязан активно обучаться в части решения классической задачи по распределению ресурсов и заданий.
Рассмотрим возможности виртуальных специалистов по обучению и переобучению. При этом будем помнить о том, что, поскольку виртуальные специалисты работают в условиях анонимности, то желательно, чтобы они как можно больше походили на людей, но превосходя их в точности, скорости и масштабности действий.
Обучение виртуального специалиста предполагает организацию работ по двум направлениям:
— обучение материалам, которые, согласно оперативному сценарию, должны быть доставлены на интернет-ресурсы;
— обучение общему поведению и такому языковому интерфейсу, которые бы способствовали повышению веры посетителей ресурсов в источник сообщения.
Доверие СЃРѕ стороны объекта управления Рє источнику мультимедийного контента, РІ данном случае Рє виртуальному специалисту, РІРѕ РјРЅРѕРіРѕРј определяется возможностью его причисления Рє категории «своих». Рсследуем направления работ РїРѕ обучению Рё переобучению виртуального специалиста РІ направлении повышения Рє нему доверия СЃРѕ стороны РґСЂСѓРіРёС… субъектов. РћСЃРЅРѕРІРѕР№ любого доверия всегда является понимание РѕРґРЅРѕРіРѕ субъекта РґСЂСѓРіРёРј, которое, РІ СЃРІРѕСЋ очередь, строится РЅР° базе созданного информационного образа. Создать информационный образ любого субъекта — значит воссоздать его систему отношений, С‚.В Рµ. проявить его опыт РЅР° данный момент. Если же известны правила, РїРѕ которым данный субъект осуществляет познание РјРёСЂР°, то появляется возможность создания устойчивого информационного образа, СЃРїРѕСЃРѕР±РЅРѕРіРѕ Рє обучению, Рє самостоятельному познанию РјРёСЂР°. Р’ том случае, если измерение отношения осуществляется РЅРµ однозначно Рё РЅРµ двузначно, Р° многозначно, то система отношений превращается РІ систему предпочтений. Часть предпочтений задаётся РЅР° этапе создания виртуального специалиста, РґСЂСѓРіРёРµ формируются РІ С…РѕРґРµ проведения информационной операции.
Система предпочтений, правила познания, индивидуальная манера поведения в совокупности образуют основу любого информационного образа, в частности информационного образа виртуального специалиста. К этому образу можно добавить биографию, имя, наиболее характерные истории из жизни, чтобы он выглядел более реалистично. Чтобы информационный электронный образ был похож на «живой», он должен состоять из элементов, способных к взаимозависимой деятельности. Он должен содержать в себе своё алгоритмическое самоподобие в виде множества интегрированных компонент, способных к различным видам взаимозависимой деятельности.
Введение понятия «алгоритмическое самоподобие» влечет Р·Р° СЃРѕР±РѕР№ переход Рє процессам, протекающим РїРѕ структурам, образованным РЅР° базе отношений. Рменно процессы определяют, какие сиюминутные информационные образы Р±СѓРґСѓС‚ проявлены, Р° какие нет. РќРѕ сами процессы, РІ СЃРІРѕСЋ очередь, также поддаются классификации, Рё каждый процесс имеет СЃРІРѕСЋ структуру, С‚.В Рє. сам РїРѕ себе состоит РёР· последовательности различных операций. Например, РІ объектно-ориентированном программировании элементарными составляющими процесса являются методы. Р’ нашем исследовании Рє методам можно отнести возможности:
— изменения размеров;
— изменения месторасположения;
— изменения компонент объекта;
— добавление новых компонент;
— удаление компонент;
— порождение дополнительного образа объекта, освещающего (описывающего) данный объект под другим углом зрения.
Перечисленные методы связаны с перемещением объекта в пространстве и времени и с изменением компонент самого объекта.
Рнформационный образ виртуального специалиста проявляется через естественный язык, который понимают пользователи Рнтернет, Р° также искусственные языки среды Рнтернет, РІ частности язык разметки гипертекстов html, который РѕРЅРё обязаны понимать, РєРѕРіРґР° попадают РЅР° тот или РёРЅРѕР№ интернет-ресурс. Язык среды используется для создания текстов.
Среда, в которой функционирует виртуальный специалист, структурируется наличием:
— ключевых слов для текстов, циркулирующих в этой среде;
— связей между ними;
— эмоциональной окраской, как всех текстов, так и отдельных предложений и даже слов;
— наличием определенной комбинации тегов языка разметки гипертекстов. С помощью тегов указывается значимость того или иного слова для данного текста. Подобного рода значимые слова выделяются в тексте с помощью т. н. тега и тегов разметки текста типа создания заголовков разного уровня, подчеркивания, включения жирного шрифта, гиперссылок. Виртуальному специалисту достаточно «взглянуть» на содержимое названных тегов, и он уже «понимает», о чем идет речь.
Ртак, задача виртуального специалиста РїСЂРё общении СЃ человеком или СЃ сайтом заключается РІ переводе полученных текстов РЅР° СЃРІРѕР№ внутренний язык, причем перевод этот должен начинаться СЃ оценки эмоциональной окраски Рё удаления избыточности. РўРѕ, что останется, Рё будет языковой средой.
Рндивидуальная манера поведения виртуального специалиста формируется РЅР° РѕСЃРЅРѕРІРµ множества его бесед СЃ пользователями ресурсов сети Рнтернет. Беседы строятся РЅР° предпочтениях. Р’ беседах, как правило, присутствуют любимые слова Рё выражения Рё отсутствуют нелюбимые. Беседы СЃ теми, Рє РєРѕРјСѓ хорошо относятся, РїСЂРѕС…РѕРґСЏС‚ совсем РЅРµ так, как СЃ тем, РєРѕРіРѕ опасаются, — РґСЂСѓРіРѕР№ сценарий беседы. Если РІ РѕСЃРЅРѕРІРµ первого сценария лежит выбор такого сообщения, которое заинтересует Рё позволит увеличить продолжительность беседы, то РІРѕ втором случае сообщения выбираются так, чтобы время беседы сокращалось, Р° сама беседа ограничилась получением только РЅРѕРІРѕРіРѕ знания Рѕ возможных опасностях.
Правила познания. В данном случае рассматриваются способности виртуального специалиста правильно решать те или иные задачи независимо от способности к т. н. познанию. Если задача того или иного уровня решается информационной системой (виртуальным специалистом), значит, система (виртуальный специалист) соответствует этому уровню познания.
Предлагается выделить следующие семь уровней познания:
На первом уровне система способна давать ответы на вопросы только на основе содержания имеющегося у нее текста. Если, например, системе известен текст: «Началась война!», то система должна уметь отвечать правильно на вопрос типа: «Что началось?» Существуют различные алгоритмы решения данной задачи. Например:
— на базе фрейма, содержащего все места, которые посещает субъект, с перечнем его возможных действий;
— поиск в хранящихся текстах предложений, содержащих в себе вопрос или большую часть вопроса, и объединение их в текст ответа с учетом синтаксиса языка. В данном случае системе совсем необязательно уметь анализировать текст и понимать, что такое «война», и знать, что она началась, — это должен знать тот, кто задал вопрос. Главное, чтобы субъект, задающий вопрос, был удовлетворен ответом. На данном уровне важнейшей задачей является задача определения расстояния не только между различными текстами (в этой части достаточно существующих решений), но и между неизвестным вопросом и известным ответом, который и должен быть поставлен в соответствие этому вопросу.
Для определения индивидуального стиля поведения (разговора) виртуальному специалисту вполне РїРѕРґРѕР№РґСѓС‚ адаптированные Рє текстам естественного языка алгоритмы самообучения РЅР° базе гибели Рё рождения элементов. Р’ магистерской диссертации Р .РЎ. Токарева (МФТР, 2009В Рі.) было показано, что для решения данной задачи вполне достаточно всего четырех РІРёРґРѕРІ элементов СЃ такими базовыми операциями, как удалить слово, добавить слово, заменить слово, переставить слова.
На втором уровне у системы имеются правила пополнения текстов и правила исключения отдельных фрагментов текста. Здесь возможны два пути модификации исходных текстов:
— их действительная модификация (включение/исключение);
— расширение (сужение) для информационной системы возможностей по доступу к текстам, принадлежащим другим информационным системам.
Наличие подобных правил может стать основой механизма самообучения, т. к. при определенных условиях эти правила задают направление развития информационной системы. Все ответы готовятся на базе различных текстов. Неоднократная отрицательная оценка ответа различными собеседниками является достаточным основанием для удаления текста, понижения его статуса. Положительная оценка приводит к повышению статуса текста, что, в итоге, способствует его выбору в случае наличия конкуренции среди текстов, претендующих на роль генератора ответа.
На третьем уровне при ответе на вопрос система должна уметь оперировать историей вопросов-ответов. Например, отвечая на вопрос «Согласны?», система должна уметь посмотреть историю диалога и расширить вопрос текстами о том, с чем предполагается согласиться. Как глубоко уходить в историю, на сколько шагов, определяется собеседником. В случае рядовой беседы людей друг с другом ими обычно учитываются от 3 до 7 последних высказываний.
Повышению эффективности функционирования системы на третьем уровне может способствовать карта взаимосвязи текстов, страниц сайтов, состоящая из матрицы следования текстов (вопросов/ответов друг за другом) и матрицы расстояний между текстами.
РќР° четвертом СѓСЂРѕРІРЅРµ система должна иметь РЅРµ только тексты, РЅР° базе которых строится ответ, РЅРѕ Рё информацию Рѕ конкретном субъекте, являющемся источником РІРѕРїСЂРѕСЃРѕРІ-сообщений, Рѕ цели Рё правилах общения. Четвертый уровень предполагает возможность интимного общения, опирающегося РЅР° знания Рѕ собеседнике. Четвертый уровень хотя Р±С‹ без частичного знания системы предпочтений собеседника невозможен. Знания Рѕ собеседнике РјРѕРіСѓС‚ быть собраны информационной системой (виртуальным специалистом) РІ процессе регулярных бесед СЃ собеседником. Рти знания представляются РІ РІРёРґРµ соответствующей модели, которая позволяет рассчитывать такие характеристики, как:
— отношение собеседника к данному виртуальному специалисту. Отношение можно попытаться оценить через время беседы, через число положительных оценок, выставленных собеседником виртуальному специалисту за беседу, через число непосредственных обращений;
— интересы собеседника. Рнтересы формируются РЅР° базе частотного словаря употребления ключевых слов — это Рё есть интересуемые проблемы;
— отношение Рє интересующим проблемам. Рто отношение формируется путем СЃР±РѕСЂР° данных РѕР± эмоциональной окраске речи собеседника применительно Рє интересующим проблемам;
— адекватность собеседника, в том числе истинность или ложность его текстов. Подобное возможно, если собирать оценки других посетителей на высказывания виртуального специалиста, которым его научил конкретный собеседник.
На пятом уровне система должна уметь оценивать истинность или ложность того или иного сообщения, в том числе с учетом того, кто автор этого сообщения. Умение оценивать истинность или ложность предполагает наличие памяти о происходящем, о том, чем закончилось то или иное высказывание.
РќР° шестом СѓСЂРѕРІРЅРµ система должна уметь самостоятельно достигать целей, ради которых РѕРЅР° существует. Рзначально цели должны быть сформулированы создателем конкретного виртуального специалиста.
Цели могут быть самыми разными: от максимально возможного продления времени существования себя в беседе до получения конкретного результата от собеседника. Выдача и получение соответствующих текстов становятся возможными только тогда, когда данные тексты есть у виртуального специалиста, и для него возможен сценарий беседы, приводящий к требуемому результату.
В общем виде достижение целей предполагается путем модификации правил, в соответствии с которыми осуществляется изменение статуса отдельных текстов. При этом процессы, направленные на достижение целей, должны протекать не только во время беседы, но и в «спящем» режиме. Суть этих процессов заключается, во-первых, в установлении связей между имеющимися текстами на предмет достижения поставленных целей, а во-вторых, в повышении структурированности текстов за счет внесения в текст гиперссылок, раскрывающих смыслы как отдельных слов, так и предложений.
Для седьмого уровня одного текста на естественном языке недостаточно. Здесь речь уже идет о распознавании изображений, голосов и т. п.
Уровни познания расположены в порядке расширения возможностей познания. С одной стороны, они следуют друг из друга, позволяя последовательно возводить здания искусственной жизни, получая на каждом этапе определенный практический результат. С другой стороны, многие задачи (логический вывод, построение трехмерных образов, синтаксический анализ, теория перевода, механизмы самообучения и т. п.) в рамках названных уровней познания уже решены до вполне приемлемых результатов.
Рсследуя СѓСЂРѕРІРЅРё познания, РјС‹ показали РѕРґРЅРѕ РёР· направлений совершенствования виртуальных специалистов. Второе РЅРµ менее важное направление — это повышение привлекательности виртуального специалиста. Рто важнейшее направление, так как привлекательность напрямую связана СЃ верой РІ передаваемое информационное сообщение.
Введем функцию определения мощности множества — μ. Обозначим через μ(Tj) мощность множества Тj. Через tn — множество истин, ставших известными субъекту i в ходе беседы с некоторым не представившимся субъектом j, которого надо узнать в ходе беседы. Тогда для субъекта i вероятность, что он беседует именно с субъектом j, могла бы быть оценена по формуле:
P = Ој(tО—)/ Ој(Tj).
РќРѕ реально субъект i РЅРµ всегда может знать РІСЃРµ множество истин Tj. Рто множество истин (РІ случае человека) может быть вообще РЅРµ перечислимым, С‚.В Рµ. РЅРµ всегда возможно даже посчитать мощность множества Tj, Р° значит, наверняка узнать собеседника. Так, предлагаемая формула верна только для случая, РєРѕРіРґР° речь идет РѕР± узнавании такого виртуального специалиста, РІСЃРµ тексты которого известны субъекту i.
Любой субъект может реализовывать операцию узнавания только на базе тех данных, что у него есть. Пусть субъект i ранее в ходе бесед с субъектом j накопил определенные знания о субъекте j в виде множества истин t3. Тогда вероятность, что в данный момент он беседует с j, можно оценить так:
P = Ој(tО— О© t3)/ Ој(t3).
Признаем, что узнавание собеседника (робота или человека) идет не по глубине мысли, а по набору присущих субъекту любимых слов и словосочетаний. Причем таких слов и словосочетаний, именно любимых, не так уж и много. Поэтому можно усилить последнюю формулу, заменив в ней tз на t3`, где t3` — множество любимых слов и словосочетаний.
Привлекательность для виртуального собеседника — это умение притягивать к себе посетителей. Повышать привлекательность — значит повышать умение привлекать к себе внимание. Виртуальный специалист делает это целенаправленно и алгоритмически обоснованно. Рон обязан это делать регулярно, чтобы оставаться востребованным.
Если измерять качество общения строго формально, то на первый план выходит именно оригинальность и новизна сказанного и желание человека слушать данного конкретного виртуального специалиста. Как только собеседники «перелили» друг другу свое содержание (доступное для понимания друг другом) и вышли на соответствующий баланс, как в их отношения вкладывается однообразие, которое затем приводит к раздражению, и на этом взаимодействие заканчивается. Психологи подобное состояние называют информационной опустошенностью.
На основании изложенного выдвинем следующие требования к оценке привлекательности:
1. Привлекательность тем выше, чем меньше пустых диалоговых квантов в каждый фиксированный временной интервал общения.
2. Привлекательность тем ниже, чем меньше пересечение диалоговых квантов каждого фиксированного временного интервала общения с базой знаний посетителя.
С одной стороны, виртуальному специалисту надо что-то говорить, а с другой — нельзя говорить то, что неинтересно посетителю. Важно правильно найти точку равновесия. Кроме того, для виртуального специалиста непростой задачей является понимание того, в чем заключаются интересы посетителя, о чем целесообразно с ним разговаривать?
Перейдем к формальной постановке задачи.
Обозначим через Ki(t) — множество диалоговых квантов, в которых виртуальный специалист а принимал участие вместе с i-м посетителем до момента времени t;
Ki(t) — множество диалоговых квантов, в которых принимал участие i-й посетитель (эти кванты могут быть из бесед данного посетителя с любыми другими посетителями, в том числе другими виртуальными специалистами-роботами) до момента времени t;
Δt — фиксированный временной интервал. Предлагается считать, что вся беседа состоит из последовательности таких интервалов {Δtj}.
Тогда, оценку привлекательности попробуем собрать из вероятности, что виртуальный специалист попадет в тему посетителя, и вероятности, что очередной фиксированный временной интервал беседы не будет пуст.
 — оценка вероятности попадания в тему посетителя;
 — оценка вероятности, что новая последовательность квантов будет «лучше» предыдущей.
Ртого:
Р РїСЂРёРІ = Р 1 В· P2.
Данная формула очень важна для функционирования виртуального специалиста, она указывает цель в его самообучении, тем самым делая его существование целесообразным, а его самого — привлекательным для посетителей интернет-ресурсов.
В ходе любой беседы, используя эту формулу, виртуальный специалист первоначально подготовит несколько реплик, но прежде чем сказать, просчитает все подготовленные реплики на предмет собственной привлекательности, выберет лучшую и только потом выдаст ответ.
Обосновав основные направления самообучения, которые на уровне моделей должны быть встроены в процессы, ответственные за обучение и переобучение, перейдем к основным компонентам данной подсистемы.
Данная подсистема должна включать в себя следующие блоки (рис. 3.1.3.1):
• обучение диалогу в виде множества взаимозависимых реплик, которые позволяют настроиться собеседникам друг на друга;
• обучение историям, которые может рассказать виртуальный специалист о себе или о других (например, собственная биография, истории из жизни);
• обучение «любимым» фразам и индивидуальной манере подачи материала. Под любимыми фразами в данном случае понимаются выражения (диалоговые реплики, отдельные фразы, слова и словосочетания, придающие индивидуальность — по этим фразам конкретный виртуальный специалист всегда может быть идентифицирован);
• обучение заданиям. Под заданиями понимаются действия виртуального специалиста в виде размещения соответствующего материала в заданной форме на указанных интернет-ресурсах;
• хранение всех реплик диалогового взаимодействия;
• корректировка диалоговых форм и реплик с целью исправления ошибок, допущенных виртуальным специалистом в ходе информационного взаимодействия с посетителями сайтов и процесса обучения.
В ходе информационного взаимодействия виртуальный специалист может использовать все перечисленные блоки, т. е. любую входную реплику любого посетителя он должен проанализировать и активизировать соответствующие блоки. При активизации возможны ошибки следующего характера:
• активизирован не тот блок, который является более правильным в качестве выходного ответа;
• блок выбран правильно, но внутри выбранного блока выбор ответа оказался неверным.
Р РРЎРЈРќРћРљ 3.1.3.1, Общая функционально-структурная схема подсистемы обучения Рё переобучения
База данных словарей и заданий виртуального специалиста должна состоять из взаимоувязанных таблиц, содержащих словарь виртуального специалиста, словарь синонимов, множество взаимоувязанных реплик по типу вопрос/ответ, множество взаимоувязанных историй, множество характерных фраз, определяющих индивидуальную манеру поведения виртуального специалиста, множество выданных ему заданий.