Профессиональный поиск в Интернете

Кутовенко Алексей

Глава 7

Поиск изображений

 

 

Интернет-поиск уже давно не ограничивается только текстовыми документами. Пожалуй, следующий по популярности тип контента – изображения. Сейчас можно насчитать три основных направления в развитии технологий интернет-поиска изображений – это индексация по косвенным признакам, построение разнообразных каталогов и контентный поиск изображений.

Индексация по косвенным признакам остается наиболее популярным способом поиска изображений. Этот способ широко представлен в вертикальных базах изображений универсальных интернет-поисковиков, благо практически все крупные машины предлагают такие возможности поиска. В данном варианте интернет-поиск изображений концептуально не отличается от поиска веб-страниц и других текстовых документов. Поисковик при индексации работает не с самим изображением, а с его косвенными признаками: именами графических файлов и тегами, присвоенными в HTML-разметке. Кроме того, анализируются подписи и текст, расположенный рядом с изображением на веб-странице, изучается текст гиперссылок, ведущих к той или иной картинке. Именно такие косвенные признаки изображения и заносятся в индексную базу, по которой затем ведется поиск при поступлении запросов от пользователей.

Подобные поисковики принимают запрос от пользователя в виде привычной текстовой строки, содержащей ключевые слова. Как правило, к характеристикам собственно изображений относятся только поля расширенного поиска, определяющие формат файла, размер изображения и другие подобные признаки.

Преимущества такого подхода понятны: его относительно проще реализовать. Кроме того, задействуются огромные индексные базы, что обеспечивает хороший охват поиска. Недостатки также очевидны: поскольку поиск идет по косвенным признакам, причем исключительно в автоматическом режиме, неизбежны информационный шум и ошибки.

Избавиться от неточностей и шума, свойственных автоматическому индексированию по косвенным признакам, можно несколькими способами. Один из них – включить в работу системы человека. Подробное описание картинок по заданной заранее схеме обычно имеет место в тематических галереях изображений. Перед включением изображения в базу данных на него заполняется своеобразная анкета, в которой содержится заранее отобранный список важных для поиска признаков и характеристик изображения. Такой способ позволяет качественно обработать как формальные свойства изображения, так и отразить его тематику. Благодаря четкой структуре описания обеспечивается достаточно высокая точность поиска. Если вам повезет найти по интересующей вас теме подобную специализированную галерею, эффективность поиска изображений вырастет в разы по сравнению с обычным универсальным поиском.

Не стоит забывать и про специализированные фотобанки. Профиль таких ресурсов может быть самым разным: от коллекций «обоев» для рабочего стола до коммерческих баз высококачественных фото, которые можно применять в полиграфии. Как правило, там используются стандартные режимы поиска, кроме того, для работы с такими базами существуют специальные поисковики.

Один из главных недостатков такой «каталожной» технологии – серьезные трудозатраты на описание ресурсов. Эпоха Web 2.0 дала новый толчок развитию данной модели. На социальных проектах задача описания загружаемых на сервер изображений полностью возлагается на их авторов. Кроме того, схема самого описания радикально упрощается. Вместо заполнения развернутой, но сложной анкеты предлагается схема свободного присваивания картинкам простых тегов. На некоторых ресурсах добавлять теги к изображениям могут не только их владельцы, но и другие пользователи сервиса Примерами ресурсов, где практикуется такой подход (его еще называют «фолксономией») при индексации изображений, могут служить Flickr, Photobucket и огромное количество других социальных фотохостингов.

Социальное индексирование изображений – способ хороший, однако не лишенный недостатков. Если в случае автоматического индексирования мы зависим от алгоритмов универсального поисковика, то здесь мы вынуждены полагаться на мастерство и добросовестность авторов. А индексаторская квалификация у владельцев картинок разная. У кого-то получается лучше, у кого-то хуже. Не надо забывать, что для описания близких по содержанию картинок разные авторы могут использовать различные ключевые слова. Кроме того, совершенно не факт, что автор картинки посчитает достойными индексирования именно интересные вам признаки. Свою роль может сыграть и фактор времени. Хорошо если человек загружает за один сеанс несколько фотографий – можно спокойно подумать над хорошим подбором тегов. А если таких снимков сотня? Скорее всего, всякий нормальный человек сэкономит время, в результате чего вся подборка будет описана всего несколькими общими тегами, и только некоторые фото удостоятся подробного описания. Такое сокращение поисковых признаков неизбежно сказывается на качестве будущего поиска.

Третья «генеральная» технология поиска, так называемая технология CBIR (Content Based Image Retrieval – поиск изображений по содержанию), делает ставку на системы автоматического распознавания изображений, которые работают напрямую с картинкой и индексируют такие ее параметры, как цвет, очертания изображенных объектов, их взаимное расположение.

Далее мы рассмотрим возможности поиска изображений с помощью вертикальных баз крупнейших универсальных поисковиков, попробуем определиться с качеством их поиска, а затем познакомимся с лучшими представителями семейства современных CBIR-поисковиков.

Для оценки качества работы универсальных поисковиков мы прибегнем к тестовому поиску по одинаковым запросам. Конечно, абсолютно исчерпывающим результат такого исследования не будет, однако предлагаемый подход хорош тем, что максимально приближен к повседневной работе и может быть легко воспроизведен: вам останется только подобрать собственные запросы из хорошо известной тематической области. Работать мы будем только с русским языком, а «семейные» фильтры отключим. Кроме того, тестовые запросы будут выполняться без входа в персональные аккаунты – в Google эта операция способна заметно повлиять на результаты выдачи.

 

Google Картинки

Google Картинки – один из основных сервисов Google, ориентированный на поиск изображений, находящийся в постоянном развитии. В последнее время он заметно изменился и усовершенствовался, продолжая оставаться одним из самых популярных и мощных средств поиска изображений, обеспечивая широкий охват за счет больших объемов индексных баз. Доступно две версии такого поиска: усовершенствованная, которая сейчас является стандартной, и упрощенная. Отличаются они в основном внешним видом страницы выдачи, возможности формулирования запроса у них одинаковые.

Изображения в Google можно искать в режимах простого и расширенного поиска. При вводе запроса в режиме простого поиска действуют инструменты, привычные по обычному текстовому веб-поиску: предложения по дополнению запроса и виртуальная клавиатура.

Форма расширенного поиска состоит из двух блоков: стандартного для всех поисковых продуктов Google и специфического блока, содержащего инструменты, необходимые именно для поиска изображений. Стандартный блок предлагает поля поиска по всем словам, по любым указанным словам, по точной фразе, а также поле исключения определенных слов. Специфический блок содержит большее количество инструментов. Кроме привычного фильтра поиска по конкретному сайту или домену, остальные инструменты позволяют описать различные характеристики нужных изображений.

Фильтр Типы картинок позволяет искать изображения, содержащиеся только в новостных сообщениях. Помимо этого, здесь можно увидеть работу новых инструментов Google, проводящих определенный контентный анализ изображения. С их помощью можно отбирать только цветные или только черно-белые изображения, фотографии или клипарт. Кроме того, в системе реализован механизм распознавания лиц, соответственно, возможен отбор таких изображений.

Google предлагает неплохой выбор фильтров, ориентирующихся на формальные характеристики изображения. С помощью фильтра. Размер можно отбирать картинки фиксированных размеров, причем кроме привычных вариантов. Большие, Средние и Маленькие, предлагаются различные варианты разрешения изображений в мегапикселях. Шаг списка довольно подробный, можно выбирать в списке значения от двух до семидесяти мегапикселей. Фильтр Точный размер, в свою очередь, позволяет вручную указать точное значение размеров нужной картинки в пикселях. Дополнительная опция этого фильтра. Использовать разрешение моего рабочего стола включает режим автоматического определения этого параметра и ограничивает поиск картинками данного размера. Фильтр Соотношение сторон дает возможность выбирать изображения, подходящие под один из четырех вариантов этой характеристики: квадратные, широкие, узкие и панорамные. Отдельный фильтр. Права использования позволяет вести поиск только тех изображений, которые распространяются в соответствии с определенным типом лицензии и правами на изменение. Фильтр Безопасный поиск дает возможность управлять «семейным» фильтром поисковика.

Страница выдачи усовершенствованной версии поисковика состоит из двух частей: области просмотра результатов и боковой панели, содержащей инструменты быстрого уточнения запроса. Вся область просмотра отдана миниатюрам найденных изображений. Они располагаются тесной мозаикой. При наведении указателя мыши на миниатюру она увеличивается, кроме того, появляется краткая текстовая характеристика картинки, содержащая имя файла, адрес сайта, на котором она была найдена, размеры в пикселях (рис. 7.1). Для некоторых картинок демонстрируется ссылка. Похожие, которая открывает список визуально и тематически похожих результатов поиска.

Рис. 7.1. Страница выдачи сервиса Google Картинки

За счет отказа от текстового сопровождения миниатюр Google удалось заметно увеличить количество изображений на одной странице выдачи Теперь на ней размещается до трех десятков миниатюр. Для просмотра выводится только первая страница выдачи Для того чтобы увидеть все результаты, понадобится воспользоваться кнопкой. Еще результаты, расположенной под списком выдачи Она позволяет вывести все результаты поиска на одной странице в виде бесконечной вертикальной ленты. Для ускорения работы миниатюры в этом случае подгружаются постепенно.

Боковая панель страницы выдачи содержит три блока быстрой фильтрации. Первый из них предлагает отбор изображений по размеру. Доступные варианты здесь повторяют форму расширенного поиска. То же можно сказать о блоке фильтра типа изображения. Здесь также можно отбирать фотографии, рисунки или изображения, содержащие портреты. Функционально от расширенного поиска отличается только блок фильтров по цвету. В отличие от расширенного поиска здесь предлагается палитра, запускающая контентный анализ найденных изображений и позволяющая отбирать их по признаку преобладающего в цветовой гамме оттенка. Заметим, что работает данный инструмент вполне корректно и его применение дает действительно хорошие результаты.

После щелчка на миниатюре открывается страница просмотра. Она содержит три фрейма: в левом выводится веб-страница, на которой было найдено изображение, в правом, боковом, информация Google – размер, тип и условия распространения картинки. Сама картинка целиком выводится в индивидуальном фрейме, расположенном поверх самой страницы просмотра.

Упрощенная версия поиска изображений функционально соответствует более современной версии, однако страница выдачи здесь решена в более привычном и традиционном стиле. Результаты поиска представлены не единым списком, а разбиты на отдельные страницы. Кроме того, миниатюры снабжены текстовой характеристикой. На каждой странице выдачи по умолчанию содержится не более двух десятков миниатюр. Внешний вид страницы просмотра найденного изображения не отличается от усовершенствованной версии поисковика.

 

Яндекс.Картинки

Развитие системы поиска изображений одного из крупнейших российских интернет-поисковиков также не стоит на месте. В настоящее время система использует собственную индексную базу, а также задействует базу системы Picsearch.

В системе Яндекс.Картинки предусмотрены режимы простого и расширенного поиска. В ходе простого поиска работает механизм автодополнения вводимых в поле поиска ключевых слов. Поскольку этот механизм оптимизирован с учетом особенностей русского языка, его работа весьма полезна.

Форма расширенного поиска предлагает четыре блока фильтров, работающих с различными признаками изображения, как формальными, так и визуальными. Фильтр Искать слова учитывает косвенные признаки и позволяет искать изображения по окружающему их на веб-странице тексту, а также описанию изображения в HTML-разметке. Поддерживаются поиск по фразе и поиск с учетом различных словоформ. С помощью фильтра. Формат можно указать желаемый графический формат изображений. Поддерживается ограничение поиска указанным сайтом или доменом.

Фильтры Размер и Ориентация позволяют указать формальные характеристики нужного изображения. Предлагается список из пяти вариантов размера: от «иконок» до «очень больших» изображений. Поддерживается выбор в перечне стандартных разрешений мониторов с целью поиска «обоев» для рабочего стола, а также ручное указание нужного размера изображения в пикселях.

Фильтр Цвет позволяет указать желаемую цветовую гамму изображения. Работает этот фильтр достойно, но в то же время не стоит забывать, что он анализирует общую гамму изображения, иногда не делая различий между тем, что, собственно, изображено на картинке, и фоном.

Фильтр Тип дает возможность не только разделить фотографии, клипарт и графику, но и находить изображения людей, для чего служит переключатель Портреты.

Очень удобной особенностью расширенного поиска в системе Яндекс.Картинки является блок в нижней части формы, где все условия поиска приводятся в виде осмысленного текстового запроса. Такой инструмент позволяет увидеть недочеты запроса, да и просто оценить его возможный результат.

Результаты поиска выводятся постранично. По умолчанию на одной странице выдачи располагаются двадцать миниатюр. Миниатюры сопровождаются краткой текстовой характеристикой, которая содержит фрагмент текста исходной веб-страницы, размер изображения и адрес сайта, на котором картинка была найдена.

Инструменты уточнения запроса собраны под строкой запроса. Они немногочисленны, но полезны. С их помощью можно фильтровать картинки определенного размера. Поддерживается отбор только по заранее заданным группам: большие, средние, маленькие и обои. На эту панель также вынесены инструменты контентного анализа изображений. Это уже знакомый нам по форме расширенного поиска переключатель. Портреты, который включает режим распознания лиц на изображениях, а также палитра, с помощью которой можно быстро отбирать в списке выдачи картинки определенной цветовой гаммы (рис. 7.2).

Рис. 7.2. Страница выдачи системы Яндекс.Картинки с включенным фильтром Портреты

Щелчок на миниатюре открывает страницу просмотра. Яндекс.Картинки, в отличие от многих других поисковиков, не открывает сразу страницу, на которой было найдено изображение. Страница просмотра, кроме собственно выбранного изображения, предлагает список копий картинки, найденных на разных сайтах. Список отсортирован по размерам изображений, что позволяет быстро найти наиболее качественный вариант. Следует заметить, что это весьма удобный инструмент, действительно облегчающий поиск. На странице просмотра появляется также ссылка на веб-страницу, на которой была размещена найденная картинка. В нижней части экрана в виде ленты выводятся остальные результаты поиска изображений по заданному пользователем запросу. Это решение также стоит признать удачным, поскольку можно быстро вернуться к результатам поиска и просмотреть другие изображения, не уходя со страницы просмотра.

Яндекс предлагает также отдельный экспериментальный проект. Визуальный поиск. Строго говоря, это не поиск изображений по запросу, а своеобразная рекомендательная система. Пользователю предлагается выбирать среди демонстрируемых фотоснимков ландшафтов и достопримечательностей наиболее понравившиеся картинки. Собрав статистику (может потребоваться от десяти до пятидесяти выборов), система рекомендует посетить определенную страну, а также предлагает варианты поиска дополнительных изображений понравившихся достопримечательностей.

Нельзя не отметить наличие сервиса поиска изображений, оптимизированного для смартфонов и телефонов. Этот сервис доступен в общем пакете сервисов Яндекса для мобильных устройств.

Рассказ о вертикальных базах универсальных поисковиков мы завершим анонсированным во вступлении к этой главе тестом качества их поиска. Сначала попробуем оценить охват поисковых сервисов Google Картинки и Яндекс.Картинки. Для этого достаточно будет посмотреть на общее количество результатов каждого поисковика по одинаковым запросам. В качестве тестового задания выступит фраза «космонавт Юрий Гагарин». Этот запрос, на момент написания данных строк, принес на Google 2510 результатов, на Яндексе – 780. Налицо более чем трехкратное преимущество Google.

Поскольку поиск картинок идет по косвенным признакам, посмотрим, насколько высок уровень информационного шума. На. Яндексе первое изображение, не относящееся напрямую к первому космонавту. Земли и названному в его честь кораблю (это был портрет космонавта № 4, Павла. Поповича), появилось на шестой странице выдачи В Google это событие произошло гораздо раньше, уже на шестнадцатой позиции списка выдачи появилось фото неизвестного спортсмена-воднолыжника. Значительный информационный шум, при котором количество релевантных результатов практически сравнялось с мусором, у Google возник уже на седьмой странице. Яндекс продержался до девятой страницы.

После включения режима распознавания лиц выяснилось, что на обоих поисковиках он работает отменно, сбоев не было. Яндекс нашел 102 портрета, Google – 282. Что же касается точности, то оба поисковика опростоволосились уже на первых страницах выдачи Яндекс показал Павла Поповича на 18-й позиции, а Google – неизвестную даму на 11-й. Информационно-мусорный «полураспад» наступил в Яндексе на четвертой странице (6 из 20 изображений не относились к теме). Заметим, что численное превосходство релевантных результатов на сервисе Яндекс.Картинки сохранилось до последней страницы выдачи Google в аналогичных условиях сдался уже на четвертой странице. Перелом был достаточно резкий: начиная с шестой-седьмой страницы в результатах можно было найти практически кого угодно, но только не космонавта Гагарина.

В случае использования цветовых фильтров при отборе портретов количество результатов предсказуемо и резко сокращается. Максимум результатов на Яндексе дала белая гамма. Правда, там было немало ложных срабатываний на картинки с белым фоном и обводками. Что касается остальных цветов, то Яндекс оказался достаточно требовательным: искомый цвет для прохождения фильтра должен быть преобладающим в изображении. Как и прежде, Google превосходил Яндекс в количестве результатов каждого цвета – у Google список выдачи после применения фильтра измерялся сотнями картинок. Однако нельзя не заметить, что Google демонстрирует другой, гораздо более либеральный подход к фильтрации: для прохождения фильтра на изображении достаточно простого присутствия объекта искомого цвета.

 

Flickr

В качестве примера системы поиска изображений рассмотрим принадлежащий Yahoo! проект фотохостинга Flickr – один из крупнейших в мире ресурсов такого плана. Количество изображений в его базе исчисляется многими миллионами. Данный проект предлагает практически все типичные для данного класса ресурсов инструменты поиска.

Поиск ведется только в собственной базе Flickr, изображения в которую загружаются пользователями ресурса. Необходимо помнить, что снимки на ресурсе могут быть как публичными, так и приватными. В последнем случае они доступны только владельцам и приглашенным пользователям.

На Flickr доступны простой и расширенный режимы поиска. Простой режим поиска, кроме поля ввода запроса, предлагает несколько фильтров. Область поиска определяется переключателями, расположенными над полем ввода запроса. При выборе одного из трех доступных вариантов (Photos, Groups, People) меняется содержимое расположенного рядом меню Search. Переключатель Photos позволяет вести поиск среди всех публичных изображений базы Flickr, в архивах персональных профилей, в загрузках пользователей из адресной книги вашего аккаунта или же в базе Getty Images, в которую попадают наиболее удачные снимки. При желании можно воспользоваться опциями, ограничивающими поиск введенного текста только описаниями фото или же присвоенными им тегами. Переключатель Groups позволяет найти тематические группы пользователей Flickr. Необходимо отметить, что последующий поиск в архивах таких тематических групп достаточно эффективен и позволяет добиться хороших результатов. Переключатель People предлагает поиск имен пользователей (рис. 7.3).

Рис. 7.3. Интерфейс простого поиска фотохостинга Flickr

Режим расширенного поиска предлагает поиск с использованием логических операторов и поиск по точной фразе. Присутствуют и дополнительные фильтры, позволяющие указывать тип нужного контента (фото, видео, рисунки), вести поиск по дате создания или загрузки изображения, включать «семейный фильтр», а также отбирать фотоработы, предоставленные по лицензии Creative Commons.

Страница результатов поиска предлагает просмотреть расположенные мозаикой миниатюры изображений. Предлагаются три режима отображения миниатюр, отличающиеся размером каждой миниатюры и подробностью текстового описания. Боковая панель страницы выдачи содержит список групп, изображения из архивов которых попали в результаты поиска, список фотографов, а также перечень географических местоположений, где были сделаны найденные снимки. Расширить или уточнить свой запрос можно с помощью инструмента Tag Clusters, в котором демонстрируется перечень тегов, отмечающих изображения текущей страницы выдачи.

 

CBIR-системы

 

Аббревиатура CBIR обозначает технологии поиска картинок, основанные на анализе характеристик изображенных на них объектов. Другими словами, CBIR-система пытается «рассмотреть» содержимое самой картинки.

Контентный анализ изображения нельзя назвать «горячей новинкой» – подобные технологии давно и активно используются в системах видеонаблюдения, более того, они давно работают за кулисами универсальных поисковиков в качестве части так называемых «семейных» фильтров. Экспериментальные машины просто дают пользователям контроль над таким режимом поиска и предлагают новые, оригинальные интерфейсы.

В общем виде CBIR-система, как и обычный поисковик, работает в два этапа: индексирование и собственно поиск по запросу пользователя. На первом этапе каждое изображение описывается и заносится в базу данных. Как мы уже выяснили, обычные интернет-поисковики ориентируются на тексты содержащих изображения веб-страниц, имена графических файлов и другие косвенные признаки. В отличие от них CBIR-система с помощью специальных алгоритмов анализирует характеристики самого изображения – его цветовую гамму, композицию, очертания предметов и другие подобные признаки. Есть принципиальные отличия и на этапе поиска картинок. Поскольку индексируемые признаки у CBIR-поисковиков не совсем обычные, то и предлагаемые пользователям инструменты составления запросов заметно отличаются от привычных форм с полями ввода ключевых слов.

В настоящее время различают несколько основных типов CBIR-систем, которые отличаются способом составления поискового запроса.

Первый вариант – уточнение запроса путем отбора похожих изображений пользователем. Сначала в базе системы по ключевым словам находится некоторое подмножество картинок нужной тематики, после чего пользователь выбирает среди них похожие на то, что он хотел бы увидеть в итоге. Ориентируясь на эти указания, поисковик предлагает новый набор картинок, отобранный по образцу одобренных пользователем изображений.

Второй тип CBIR-систем позволяет вести поиск изображений по точно заданными визуальным параметрам. В этом случае пользователь указывает точные значения различных характеристик необходимого изображения, которые затем сравниваются с имеющимися в базе поисковика.

Третий тип CBIR-систем работает с графическим запросом. Системе предъявляется некий образец, она производит его анализ, после чего проводит в своей индексной базе поиск изображений со сходными параметрами.

 

Tiltomo

Финский экспериментальный поисковик Tiltomo является примером реализации технологии уточнения запроса с помощью похожих изображений. Разработчики Tiltomo решили не тратить ресурсы на формирование самостоятельной базы изображений, а предпочли работать с готовой базой фотохостинга Flickr. Здесь действует ограничение – поиск идет не во всей многомиллионной базе Flickr, а в тестовой выборке, объем которой постоянно увеличивается и в настоящее время составляет несколько сотен тысяч фото.

Поиск начинается вводом ключевого слова-тега, которое нужно для формирования первоначальной выборки снимков с различными визуальными характеристиками. Начинать поиск можно также со случайного набора снимков, предлагаемого системой.

Интерфейс выдачи Tiltomo максимально прост. Пользователь работает со страницей, содержащей пару десятков миниатюр фотоснимков, сопровожденных несколькими ссылками-переключателями (рис. 7.4). Далее доступны два варианта действий: уточнение темы запроса и поиск по характеристикам изображения. Для уточнения темы достаточно выбрать понравившийся снимок-пример и щелкнуть на ссылке Find Similar by Theme, которая находится под каждой миниатюрой. Допустим, вам требуются фотоснимки обычных съедобных яблок – никаких проблем, выбирайте соответствующий образец и получайте новую страницу результатов, на которой все снимки будут содержать изображения яблок в различных ситуациях и ракурсах.

Рис. 7.4. Поисковик Tiltomo позволяет подбирать визуально похожие изображения

Другой инструмент поиска, запускаемый ссылкой Find Similar by Color/Texture, призван искать изображения, схожие по характеристикам цвета и очертаний. Получив такую обратную связь, поисковик ищет в своей базе картинки, визуальные индексы которых близки к отобранным изображениям. В результате пользователь получает новый список выдачи, картинки в котором визуально похожи на указанный им пример. Цикл может повторяться несколько раз, напоминая обычное уточнение запроса на универсальном поисковике, только инструментами здесь выступают не дополнительные ключевые слова, а содержимое изображения. Попадания могут быть достаточно точными – если, допустим, на снимке-образце была лужайка, мы получим набор фотоснимков с изображением различных зеленых растений. Справедливости ради заметим, что «тематический» фильтр при этом начинает давать сбои, поэтому для получения максимально точного результата приходится повторять поиск несколько раз.

Использование переключателей позволяет Tiltomo достойно справляться со словами-синонимами. Для примера: в списке выдачи по запросу «apple» система позволяет уточнить, что имеется в виду: продукция компьютерной компании Apple, яблоки и яблони разных сортов или же фотографии. Нью-Йорка, известного также как «Big Apple».

 

Retrievr

Поисковик Retrievr, разработанный австрийской фирмой System One, реализует режим поиска по графическому запросу. Любопытно, что движок сервиса полностью написан на языке Python. Как и Tiltomo, Retrievr работает с фотоснимками, размещенными на сервисе Flickr, однако использует другой способ составления запросов. Здесь предлагается сделать ручной набросок искомого изображения или вести поиск по представленному пользователем образцу.

Интерфейс Retrievr разделен на две части. Слева располагается боковая панель, содержащая инструменты составления запроса. Справа выводятся результаты поиска – миниатюры подходящих под условия запроса изображений (рис. 7.5).

Рис. 7.5. Система Retrievr позволяет искать по наброску

Retrievr работает с двумя типами графических запросов: наброском, который можно нарисовать от руки, и загружаемой на сервер картинкой-примером. Переключаются режимы кнопками Sketch Search и Image Search.

Для рисования применяется специальная Flash-панель. Она содержит небольшую рабочую область, на которой и предлагается подготовить графический запрос. Кроме того, на ней находится набор круглых кистей разного размера, а также палитра, с помощью которой выбираются нужные оттенки. Анализ рисунка происходит практически в режиме реального времени. Прямо в ходе рисования на страницу подгружаются результаты поиска, позволяя немедленно корректировать набросок.

Результаты такого поиска пока неоднозначны. Простейшая «рожица» позволяет исправно получать галерею портретов, белый круг на черном фоне – фотоснимки Луны. В то же время попытки изобразить деревце или еще что-нибудь более детальное ведут пока к серьезному разброду в результатах. Для получения хорошего результата нужно рисовать крупными мазками, не пытаться изображать мелкие детали, а постараться передать общий колорит.

Что интересно, пользовательские наброски сохраняются и им присваиваются собственные URL-адреса, которые можно сохранить или отправить по электронной почте. Кроме того, на сайте имеется галерея набросков, уже сохраненных в системе, причем при желании можно проголосовать за понравившиеся. Эта информация используется для совершенствования алгоритмов системы.

Второй режим поиска Retrievr – по представленной пользователем фотографии, которая и исполняет в данном случае роль запроса. В настоящее время принимаются только файлы в формате JPEG. Снимок можно загрузить со своего компьютера или же указать его URL-адрес, если он находится в сети. Качество такого поиска сейчас мало чем отличается от поиска по наброску – основное внимание уделяется цветовой гамме при заметном пренебрежении к деталям изображения. Поработать в данном режиме также можно, не загружая свой фотоснимок, а взяв за образец любую миниатюру со страницы результатов поиска. Если задержать на такой миниатюре указатель мыши, появляется значок с лупой, при щелчке на котором Retrievr начинает искать похожие на миниатюру изображения.

 

Выводы и рекомендации

Основными системами поиска изображений в Сети остаются универсальные поисковики и специализированные фотохостинги. Универсальный поиск силен широким охватом, но страдает от информационного шума. Наилучшие результаты он дает тогда, когда изображение можно явно и однозначно описать в текстовом виде, после чего остается надеяться, что веб-мастера не упустили этот момент при верстке своих страниц. Каталоги обеспечивают высокое качество тематического поиска, но «закрывают» далеко не все тематические ниши. Поскольку индексные базы изображений у крупных поисковиков отличаются, при серьезном поиске желательно задействовать несколько машин.

Экспериментальные контентные поисковики сейчас в основном работают с «низкоуровневыми» характеристиками изображений – цветом, формой, текстурой, в то время как человек, глядя на картинку, воспринимает цельные образы, причем способность к такому восприятию во многом опирается на приобретенный жизненный опыт. У машины такой школы нет, и это является причиной многих неточностей при поиске. Пользователю при составлении запроса, так или иначе, приходится учитывать специфику «машинного» восприятия изображения и переводить искомые образы на язык характеристик понятого машине уровня. Ориентация на словесное описание изображений в «традиционных» поисковиках при всех своих недостатках позволяет «зацепить» эти тонкие аспекты за счет прямого или косвенного участия человека в распознании содержимого картинки.

Пользовательский CBIR-поиск еще в самом начале пути. Большинство поисковиков открытого доступа находятся в стадии бета-версий. Экспериментальные машины поиска изображений занимают нишу специфических запросов и вряд ли готовы полностью заменить обычные поисковики и каталоги, ориентированные на использование ключевых слов. В то же время новейшие «контентные» технологии становятся прекрасным дополнением к «традиционным» способам индексации и поиска. Действительно: наиболее гибкими и удобными оказываются сервисы, объединяющие различные подходы к поиску: по ключевым словам, по тегам, по визуальным характеристикам изображений. Это, скорее всего, будет ведущей тенденцией ближайшего будущего. Возможности поиска изображений по косвенным признакам и проставленным пользователями тегам на универсальных поисковиках и фотохостингах все активнее дополняются технологиями контентного поиска.

Примерами могут служить рассмотренные в этой главе сервисы Google Картинки и Яндекс.Картинки. Возможности составления запросов у этих проектов сопоставимы, разве что Google распознает больше оттенков, в то время как. Яндекс предлагает более совершенные инструменты для работы с текстом запроса. Новые инструменты поиска и фильтрации изображений у обоих проектов достигли хорошего уровня. Механизмы распознавания лиц и поиска изображений по цветовой гамме функционируют четко и приносят реальную пользу. По количеству результатов выигрывает Google, однако результаты выдачи Яндекса, обычно уступая в разы количественно, дольше остаются релевантными. Поэтому выбор поисковика зависит от выбора приоритетов: «не упустить, даже ценой шума» или же «пусть меньше, да лучше».

Что касается интерфейсов просмотра, то здесь однозначного лидера выделить трудно. На стороне Google – удобная боковая панель с быстрым доступом к фильтрам и «бесконечная лента» выдачи. В активе Яндекса – чрезвычайно удобная опция группировки одинаковых изображений, а также информативная страница просмотра, позволяющая увидеть изображение без перехода на исходную веб-страницу.