Победить и слона, и кита. «Журнал «Компьютерра» №38»

Этот разговор про инновации в информационных технологиях впервые зашел на одном из заседаний конференции ИТ-директоров «Русский день-2005» в Сочи. Многие участники дискуссии горячо высказывали мнение, что основные игроки рынка ИТ в России пропустили несколько волн инноваций, закоснели и стали медлительными; другие же не менее горячо это мнение отвергали. На мой взгляд, разногласия и накал страстей спорщиков объясняются просто: рынок ИТ в его классическом понимании (продажа компьютеров, сетевого оборудования, программного обеспечения) еще лет пять назад окончательно вышел из категории «растущих рынков» (несмотря на то что продажи и не думают снижаться). Инновации же возникают на растущих рынках (или сами их «под себя» создают). Работать на растущем рынке легко и приятно - палку воткни, и она расцветет, что ни сделай - рынок все простит, деньги и клиенты текут рекой. Поэтому у тех, кто видел бурный рост рынка классических ИТ в начале 90-х, возникает своего рода ностальгия по молодым и бесшабашным временам.

Но те времена вовсе не прошли, просто сместилась область роста: продажа десктопов и «двигание коробок» с ПО действительно стагнирует, а вот на границах традиционных ИТ постоянно возникают стыки с чем-то новым, где кипят новые идеи и рождаются новые продукты, быстро развиваются новые виды бизнеса.

Вот краткий рассказ про некоторые из них, вполне доступные традиционным компаниям из сферы ИТ (была бы только легкость на подъем).

Мобильный контент

Сейчас чрезвычайно быстро развивается рынок мобильного контента - игр, справочников, мелодий, картинок для мобильных устройств, в первую очередь сотовых телефонов. В значительной части этот вид бизнеса прямо и цинично ориентирован на отъем родительских денег у недалеких и доверчивых подростков, впервые в истории заимевших что-то вроде карманных денег на счетах мобильных операторов. Однако на этом рынке есть место и для вполне этичных услуг.

Вот простой пример конвергенции традиционного ИТ-бизнеса и мобильных технологий: известная российская компания «Парагон» разрабатывает и продает многочисленные и многоязычные словари для мобильных устройств. Словари лицензируются у традиционных ИТ-разработчиков («МедиаЛингва», ABBYY), издателей (Berlitz) и др. и превращаются в словари для бесчисленного множества модификаций мобильных устройств, от наладонников и смартфонов до дешевых мобильных телефонов. Это довольно перспективный бизнес, созданный за счет объединения давно известных идей в нечто новое. Для этого «Парагону» пришлось создать мощную программистскую фабрику, способную три-четыре раза в год легко переходить на новую ОС или платформу - дело, невиданное в традиционных ИТ.

Большой спрос в мобильном мире также на энциклопедии и справочники - довольно неожиданный после краткого взлета мультимедиа для ПК в середине 1990-х годов. То же касается простеньких игр, многие из которых сейчас возвращаются аж из конца 80-х и переживают второе рождение в мобильниках.

Мобильный мир требует и нового программного обеспечения для бизнеса - пусть и примерно с теми же самыми функциями. Это еще один стык, на котором рождаются инновации. Например, компания «ДИСКо» в прошлом году выпустила продукт «ДИСКаунт» для учета продаж на наладонном компьютере. Это принципиально иная задача, нежели решаемая, скажем, «1С:Торговлей» для настольного компьютера (хотя «1С» один из продавцов этого продукта). Аудитория тоже иная - малый (скорее даже мелкий) бизнес, на уровне лотка или палатки на Горбушке

Лидер в категории «мобильный офис» пока не появился. Соответственно, нет и общего стандарта, хотя он всем очень нужен. Кто его разработает и внедрит, тот будет монополистом (боюсь, им опять окажется Microsoft).

Искусственный интеллект и мобильные технологии

В области ИИ обещания создать говорящих роботов, устройства распознавания речи, машинные переводчики даются уже более сорока лет, однако сделано не очень много. Мне кажется, в первую очередь потому, что у рядового потребителя не было потребности в разумном поведении бытовых устройств. Однако с проникновением ИТ, а особенно мобильников в массы эта потребность появилась.

Мобильные устройства и телефоны сейчас остро требуют внедрения технологий ИИ. В первую очередь - распознавания речи.

Распознавание речи

Насколько удобнее было бы вводить SMS или номер абонента вслух, чем с помощью убогой клавиатуры и капризного алгоритма Т9! Не говоря уже о пользовании мобильником в автомобиле, где управлять звонками голосом гораздо удобнее и безопаснее. Но до сих пор эта проблема не решена; я не говорю об элементарных голосовых метках, которые есть во многих современных телефонах - там, по сути, распознается не речь, а звуковой паттерн, и они начинают сбоить уже при числе меток номеров более 15-20.

Вообще же качество распознавателя определяется соотношением числа узнанных слов к допустимому числу разных дикторов. Сейчас существуют системы только двух крайних типов - множество слов для одного или нескольких дикторов (скажем, 60 тысяч слов/1 диктор) и много дикторов с несколькими десятками слов. А чтобы обслуживать массового пользователя, нужны системы для множества дикторов с множеством слов.

Первый тип голосовых систем используется для диктовки текстов или управления компьютером, при условии тщательного обучения системы вашему голосу. Такие системы после обучения работают довольно надежно. Однако массовый пользователь никогда ничего не настраивает, никогда ничему не обучает, это известный факт. Настройки в операционной системе, текстовом редакторе или на веб-сайте поисковика меняют не более 1-2% пользователей.

Второй тип распознавания используется для элементарных вопросо-ответных систем в центрах обслуживания абонентов, для набора номера голосом, в так называемых голосовых порталах, но тут технология работает не очень хорошо. Понятно, что системы с многими дикторами должны работать без обучения с любым диктором, и это их проклятие.

В общем, безупречная массовая система типа, скажем, 1000/1000 или 1000/10000, то есть для многих дикторов с распознаванием нескольких сотен слов (а уж тем более фраз или слитной речи любого диктора), пока не создана. Тот, кто создаст такую систему для английского, немецкого, китайского, да и для русского языка, озолотится.

Естественно, такие системы активно разрабатываются. На мой взгляд, тут самая обещающая идея - перейти от «сугубо технического» распознавания 90-х годов (очистка сигнала, нарезка, угадывание фонем и пр.) к распознаванию «по смыслу», по контексту, то есть к предугадыванию того, что могло бы быть сказано. Именно так распознает речь человек: без знания контекста и заранее сформированной модели ситуации мы ошибаемся в распознавании на слух абстрактных текстов не реже машины. А предугадать круг возможных реплик не слишком трудно, это и так делают при создании любого центра обработки звонков, службы технической поддержки и пр.

Ясно, что заранее обученные контексту системы можно создавать только для ограниченного контекста, то есть для узких и хорошо описанных предметных областей (или они должны надежно распознавать предметные области и быстро переключаться между ними). Тем не менее для массовых справочных сервисов в мобильном телефоне этого было бы вполне достаточно.

Вторая перспективная идея - отказ от попытки точно распознать всю фразу. Вместо этого нужно «ловить» в потоке непонятной речи ключевые слова и фразы - и по ним строить гипотезы о возможном содержании запроса. Это тоже близко к тому, как распознает речь человек, особенно в условиях шума, сильного акцента собеседника, большого количества неизвестных слов в его речи. Фактически нужно превратить распознаватель в поисковую машину по возможным репликам пользователя.

Виртуальные собеседники

Рынок мобильного контента требует интеллектуальных агентов, умеющих поддерживать связный диалог - болтать в чате, осуществлять навигацию по услугам, выбирать картинки или мелодии… Из развлечения для студентов и профессоров и повода выиграть престижный, но практически бесполезный приз Лёбнера (на прохождение теста Тьюринга на «человечность») виртуальные собеседники превращаются в серьезный бизнес. Уже появляются первые «виртуальные подружки» - тамагочи в мобильнике, - требующие внимания и подарков.

Для английского языка это сделать проще, а для немецкого или русского - гораздо сложнее. Такие стартапы сейчас то и дело появляются. Например, российская компания «Наносемантика» разрабатывает виртуальных собеседников для русского и английского языков, позволяющих вести связный диалог по SMS и в Интернете, и к ним очень большой интерес проявляют агрегаторы мобильного контента.

Главные идеи разработки близки описанным выше для распознавания речи - нечеткое распознавание, отказ от жестких «лингвистических» шаблонов, превращение распознавателя фраз в поисковую машину по возможному контексту.

В общем, поддерживать связный диалог с роботом уже вполне возможно - в узких предметных областях. Когда к таким речевым агентам присоединится настоящее распознавание звуковой речи, в общении человека и компьютера произойдет революция. И те, кто ее возглавит, станут богаче если не Гейтса, то уж Брина с Пейджем точно.

Новый интернет-бум

После того как лопнул пузырь доткомов, казалось, что интернет-бизнес больше никогда не наберет такого же хода. Тем не менее в 2003-04 годах начался новый бурный рост, но уже не на дрожжах обещаний и надежд, а на солидном основании больших заработков на рекламе. И потребности пользователей, и инновации в Интернете теперь - настоящие.

Новые поисковые системы

Новые короли Интернета - поисковики. Зарабатывая большие деньги на контекстной рекламе, они стали единственным входом во всемирную сеть для полумиллиарда пользователей. Однако, на мой взгляд, сами поисковые машины сейчас находятся в удручающе застывшем состоянии: релевантность поиска не растет или даже падает, пользовательский интерфейс остается на уровне 1999 года - бесконечная лента результатов поиска, где в одну кучу свалены форумы, сайты, товарные предложения, новости и, конечно, поисковый спам: бесконечные входные страницы, липовые сайты, фальшивые каталоги, платные бессмысленные ссылки… Развитие поисковиков идет экстенсивно - по пути превращения в порталы с мультисервисной моделью, новостями, товарами, богатым контентом, почтой, электронными деньгами.

Пользователям, как мне кажется, очень нужна новая парадигма поисковой машины.

Наиболее перспективные идеи в это области таковы:

Структурирование результатов поиска. Чтобы облегчить выбор среди найденного, результаты нужно разбивать по темам и типам документов. Для этого необходимо вводить распознавание тематик и структуры данных при индексации веб-страниц. Хороший пример такого структурированного поиска - портал A9.com, созданный при участии Amazon.

Специализированные поисковики. В очень многих областях интересов вместо общего поисковика лучше использовать специализированный поиск по разным сущностям (тем или иным предметным областям, товарам, блогам, сообществам, новостям). Результаты должны объединяться и структурироваться.

Коллективный поиск. Для структуризации и организации результатов поиска можно привлекать на помощь сообщества пользователей. Такие проекты уже существуют и получают инвестиции.

Мобильный поиск. Не будем забывать о приходе в Интернет мобильных пользователей, которых в разы больше, чем нынешних интернетчиков, - им рано или поздно потребуется голосовое общение с поисковой машиной (а значит, диалог с нею на естественном языке).

Те, кто первыми предложат новые виды поиска и интерфейсы поисковых машин, станут новыми Деллами и Бринами. Впрочем, сейчас в отрасли интернет-поиска начинается великая битва слона с китом - Google с Microsoft[См. по этому поводу обсуждение в . - Л.Л.-М.]. Но не думаю, что через пять-семь лет победителями будут сегодняшние поисковики - скорее, ими станут новички (как не известен был Google семь лет назад). Сейчас в США и Европе в год появляются несколько десятков громких стартапов, в той или иной форме реализующих вышеперечисленные идеи поиска.

Гибридные сайты или замешивание данных (Mash-ups)

Недавно начал бурно развиваться еще один новый вид проектов в Интернете - сервисы, создаваемые «поверх» поисковых порталов (и их сервисов), крупных магазинов, блогов за счет объединения различных типов данных. Несколько примеров: поиск людей (коллег, одноклассников) с одновременным показом их местонахождения на картах Google; разбор криминальных сводок с сайта полиции города с отметкой происшествий на тех же картах Google, что позволяет понять, насколько криминализован твой район; соединение данных об автомобильных пробках от Yahoo! с картами Google; поиск по Amazon и объединение на той же странице данных других магазинов для сравнения цен, и т. д.

Пока этот вид бизнеса довольно рискованный, ибо зависит от доброй воли всех владельцев данных. Скажем, Google категорически против метапоисковых сервисов, использующих его результаты поиска (он даже блокирует их, если создается большой трафик), но не очень возражает против использования своих карт. Есть уже случаи блокирования со стороны Yahoo! и Google доступа с таких гибридных сайтов, замешивающих их данные. Но надо учесть, что обычно с грандами Интернета трудно договориться заранее. А вот постфактум - можно. Если ты сделал гибридный сайт, никого не спрашивая, и доказал, что можешь привлечь большую аудиторию, а главное - можешь показать, где в твоей схеме деньги для Google или MSN, то договариваться гораздо проще. Стало быть, риск есть, но выигрыш может быть громадным и быстрым - гибридные сайты зачастую привлекают миллионы посетителей моментально и без всякой раскрутки.

Машинный перевод для поисковиков и мобильников

Машинный перевод - больная тема вот уже полвека. Несмотря на значительные вложения и затрату чудовищного количества человеко-лет в США, Европе и России, прорыва нет. Состояние отрасли всякий может увидеть на примере работы российского . В последние годы «ПРОМТ», несомненно, лучшая в мире система перевода. Но то, что эта лучшая в мире система дает на выходе, часто напоминает не очень хороший подстрочник. Сейчас компьютерные переводчики можно использовать только для выбора текста на нужную тему, для быстрого ознакомления с документацией на товар или изделие, для пролистывания сайта конкурента в Китае или Японии (ценно хотя бы то, что вместо кракозябров на экране появляется привычная латиница или кириллица). Я считаю, что традиционные «словарные» системы автоматического перевода уже восемь-десять лет находятся в идейном тупике, и из технологии перевода, основанного на словарях, выжато все возможное.

Однако задача перевода вдруг обрела второе дыхание. Автоматические переводчики теперь нужны не только профессионалам-переводчикам, аналитикам спецслужб и библиотекарям, и это дает надежду на прорыв. Появилась новая аудитория - пользователи Интернета и мобильных устройств, которым требуется языковая прозрачность информационного пространства. Тут же возник и новый подход к решению задачи автоматического перевода - использующий, при помощи поисковых машин, «человеческие» образцы перевода. Это развитие довольно давней идеи статистического перевода, применяемой к гигантским индексам поисковиков - хранилищам текстов с удобным поиском и сравнением образцов.

Идея поискового перевода внешне проста: поисковик, индексирующий гигантский объем данных, всегда может вычленить из него параллельные тексты (или хотя бы фразы) - образцы перевода, сделанные людьми (даже если в Сети эти образцы лежат далеко друг от друга и внешне не связаны). Сделать это можно по «похожести» - так же как поисковик определяет дубли веб-страниц на одном языке.

Ну а сделать из образцов параллельных текстов гибкие шаблоны перевода - задача лингвистически сложная, но вполне решаемая. Вот и Google уже создает свой переводчик и даже получает за него призы[Об этой и других новых идеях в области машинного перевода см. - Л. Л.-М]. Я уверен, что вскоре этим займутся и другие поисковики, например MSN. Впрочем, не факт, что преуспеют здесь именно поисковики. Скорее, их ресурсы будут текстовой базой для систем перевода, созданных разработчиками, имеющими опыт в прикладной лингвистике.

Итак, если вспомнить про конвергенцию Интернета с мобильниками и распознавание речи, мы вплотную подходим к идее устройства, описанного в фантастических романах, - к универсальному коммуникатору, маленькой коробочке, лежащей на столе и переводящей речь разноплеменных собеседников.

Интернет-маркетинг и реклама

В настоящее время происходит быстрый идеологический сдвиг в области интернет-рекламы. На смену традиционной баннерной и контекстной рекламе (по поисковым словам) идет контекстно-чувствительная реклама. Эта реклама способна учитывать как контекст страниц, на которых она показывается, так и контекст пользователя (его предыдущие действия и привычки поведения в Сети). Фактически на стыке традиционной интернет-рекламы и классического маркетинга возникает новое направление, я назову его управление аудиторией. Первыми, относительно простыми примерами за последние два-три года послужили системы контекстно-чувствительной рекламы наподобие Google AdSense, «АвтоКонтекста» Бегуна, РОРЕРа и подобных им. Сейчас возникают новые игроки, новые продукты и сервисы.

Например, появляются разветвленные партнерские системы с показом на веб-страницах товарных предложений, релевантных содержанию страницы. На смену баннерам могут прийти «мини-сайты» с возможностью навигации по ним прямо на рекламной площадке, без перехода на рекламируемую веб-страницу. Следует упомянуть автоматизированные сервисы по управлению интегрированными рекламными кампаниями на аукционе eBay, в контекстных системах в поисковиках и на партнерских сайтах (с анализом эффективности, автоматическим отзывом проданных или непродающихся позиций и пр.). Сюда же относится тематическая реклама в блогах и новостных RSS-лентах; реклама в почте, привязанная к содержанию писем. Быстро развивается также анализ поведения аудитории и отдельного пользователя, с распознаванием категории пользователя по его поведению. Вместо традиционных счетчиков появляются аналитические продукты нового поколения, позволяющие контролировать не посещаемость, а полное состояние интернет-маркетинга клиента.

Мне кажется, лицо интернет-рекламы радикально изменится за ближайшие два-три года, и тут огромный простор для инноваций.

Я не коснулся других огромных областей для инноваций, возникающих на стыках отраслей (скажем, веб-сервисов и мобильных сервисов), - например, средств использования традиционного софта новыми способами. Каждый такой стык - бесконечная тема. Инновации возникают там, где возникают реальные потребности массы пользователей, или там, где кто-то умный придумывает для них новую потребность. А таких областей вокруг ИТ - множество.

Название книги

Журнал «Компьютерра» №38

Компьютерра Журнал 610

Победить и слона, и кита