Индексируя страницы сайта, поисковый робот первым делом извлекает из них информацию. Чем более че\тко и организованно она подана «посланцу» Google или «Яндекса», тем быстрее и точнее он решит эту задачу.
На быстроту и корректность сбора данных для индексации влияет так называемая семантическая разметка страницы. Такое форматирование веб — документа призвано преподнести контент поисковику в предельно понятном, «съедобном» виде. Страница без семантической разметки будет так или иначе интерпретирована роботом, но ему придется самостоятельно структурировать извлеченную из нее информацию. А поскольку алгоритмы поисковых систем неидеальны, при отсутствии помощи со стороны сайтовладельца им не всегда удается безошибочно трактовать материалы и обеспечивать безупречный поиск по ключевым запросам.
Зато благодаря «семантической паутине», охватывающей все больше интернет — площадок, поисковики оказываются в состоянии давать пользователям точно и внятно сформулированные ответы на их запросы.
Микроформаты и микроданные
Семантическая разметка страницы осуществляется по специальным стандартам. Исторически сложилось так, что два гиганта поиска – Google и «Яндекс» изначально придерживались каждый своего формата. Разработчики из корпораций Google, Yahoo! и Microsof создали проект под названием Schema.org. Он основан на разметке с помощью тегов microdata («микроданные»). «Яндекс» присоединился к инициативе западных коллег осенью 2011 года, а до того начал продвигать в массы другую методологию – «микроформаты» (h p://microformats.org/wiki).
Очевидным образом веб — мастеров мягко подталкивают к тому, чтобы они прибегали к семантической разметке страниц. Администраторам сайтов в Рунете ради повышения привлекательности сайта для «Яндекса» и Google нужно учитывать оба формата и составлять две версии семантического описания контента.
Вот пример описания продукта с применением формата microdata:
(div itemscope itemtype="http://schema.org/Product")
(span itemprop="name")Микроволновая печь Samsung MW73VR(/span)
(img src="samsung — microwave — mw73vr.jpg" alt='Микроволновая печь Samsung MW73VR' />
(div itemprop="aggregateRating" itemscope itemprop="h p://schema.org/AggregateRating">
Средняя оценка покупателей (span itemprop="ratingValue">4(/ span>
на основе (span itemprop="reviewCount">11(/span>отзывов(/div>
(div itemprop="offers" itemscope itemtype="h p://schema.org/ Offer">
(span itemprop="price">2630 р.(/span>
(link itemprop="availability" href="h p://schema.org/ InStock" />В наличии
(/div>
(span itemprop="description">Отдельностоящая микроволновая печь объемом 20 л и мощностью 800 Вт(/span>
(div itemprop="reviews" itemscope itemtype="h p://schema.org/ Review">
(span itemprop="name">Отличная печка(/span> – от (span itemprop="author">Иван(/span>,
(meta itemprop="publishDate" content="2012 — 04 — 01">1 апреля 2012
(div itemprop="reviewRating" itemscope itemtype="h p:// schema.org/Rating">
(meta itemprop="worstRating" content = "1">
(span itemprop="ratingValue">4(/span>/
(span itemprop="bestRating">5(/span>stars
(/div>
(span itemprop="description">Легко чистить(/span>
(/div>
(/div>
Формат microformats hProduc «Яндекса» на текущий момент используется поисковиком для описания автомобилей в программе «Отзывы по автомобилям». Пример разметки микроформатами приведен на странице помощи в сервисе «Яндекс. Вебмастер» (h p:// help.yandex.ru/webmaster/?id=1113265).
Насколько верна семантическая разметка с использованием микроформатов на вашем сайте, легко проверить соответствующим валидатором в «Яндекс. Вебмастере» (h p:// webmaster.yandex.ru/microtest.xml).
CMS с поддержкой микроформатов
Для работы с большим количеством страниц рациональнее обеспечить семантическую разметку инструментами CMS. Среди готовых решений, которые поддерживают микроформаты, – Drupal, Wordpress, Movable ype. Под «самописную» CMS придется создавать специальный модуль со сходной функциональностью.
Важно помнить, что предназначение семантической разметки – помочь поисковику проанализировать и структурировать созданный для посетителя и видимый ему контент. Любое отклонение от курса (например, попытка упорядочить скрытый текст и другие сомнительные элементы) может быть расценено как нарушения правил поисковой системы и грозит наложением санкций на ресурс вплоть до «пессимизации».
Семантическая разметка – это мало того, что большой шаг к улучшению результатов поиска, но и средство, делающее прозрачнее отношения между сайтами и поисковыми системами. А значит, процедура в равной мере коммерчески и «гигиенически» значимая.