Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Россия +7 (495) 139-20-33
10 Апреля 2006 в 12:00

Текстовая релевантность. Внутритекстовые факторы

Россия +7 (495) 139-20-33
0 13473
Подпишитесь на нас в Telegram

Понятие релевантности, применительно к сфере поиска, – это мера соответствия документа запросу, поставленному пользователем. Релевантность определяет, насколько точно и полно та или иная страница интернет-ресурса отвечает запросу пользователя. У каждой поисковой системы свои методы и критерии (внутреннее ссылочное ранжирование, внешнее ссылочное ранжирование, текстовая релевантность) оценки релевантности документов запросу. Среди всех критериев можно выделить текстовую релевантность, имеющую достаточно большое значение и учитываемую большинством поисковых систем.

Текстовая релевантность в поиске – это мера соответствия совокупности внутритекстовых факторов документа запросу, поставленному пользователем. К внутритекстовым факторам относятся:

  • заголовки текста. В HTML-языке существуют специализированные теги для выделения заголовков текста: h1, h2, h3, ..., h6;
  • информационное текстовое содержание страницы;
  • форматирование текста, т. е. придание фразам, словам определенный вид;
  • атрибуты тегов, т. е. их значения.

Рассмотрим более подробно каждый из этих факторов.

1. Заголовки текста

Поисковые системы уделяют немало внимания заголовкам текста при оценке релевантности документа, так как именно заголовки передают содержание текста в краткой форме. Пользователь, прочитав заголовок, может определить, понять основное содержимое, тематику страницы и т. д. Из этого следует: размещение ключевых слов запроса в заголовках может увеличить релевантность текста по определенному запросу.

Для выделения заголовков в HTML-языке предусмотрены специализированные теги, отражающие иерархическую структуру документа:

  • [h1]слово (слова) заголовка[/h1] – основной заголовок страницы, характеризующий содержание данной страницы (самый важный);
  • [h2]слово (слова) заголовка[/h2] – заголовок раздела страницы (менее важный, чем h1);
  • [h6]слово (слова) заголовка[/h6] – заголовок подраздела страницы (менее важный, чем h5).

Пример: иерархическая структура страницы с включением в заголовки слов запроса «производство стеклопакетов»:

[h1]Производство стеклопакетов[/h1]

...текст...

[h2]Производство стеклопакетов в Европе[/h2]

...текст...

[h2]Производство стеклопакетов в России[/h2]

...текст...

[h3]Производство стеклопакетов в Калининграде[/h3]

...текст...

[h3]Производство стеклопакетов в Воронеже[/h3]

...текст...

Нежелательно повторять теги h1, h2 ... h6 для выделения одного заголовка.

2. Текст

Релевантность текста, размещенного на странице сайта, зависит от нескольких факторов:

  • наличие ключевых слов запроса в тексте. Одно из самых очевидных условий релевантности страницы запросу – это наличие данного запроса в тексте страницы;
  • плотность ключевых слов, т. е. отношение количества ключевых слов на странице к общему числу слов. Если запрос состоит из нескольких ключевых слов, т. е. является многосложным, то необходимо рассматривать плотность каждого слова в отдельности. Данный фактор является очень важным, т. к. поисковые системы рассчитывают релевантность текста, строя частотный ряд из слов, расположенных в документе. Чем чаще по отношению к тексту встречаются ключевые слова, тем большую, по отношению к запросу пользователя, релевантность она (страница) получает. Однако это совсем не значит, что чем больше количество ключевых слов в тексте, тем выше релевантность страницы. Обычно оптимальная плотность ключевого слова составляет 3-7% от общего числа; при большей плотности ключевых слов, поисковые системы могут воспринять это как спам. Но данный процент плотности не может быть жестко привязан ко всем документам. Например, если искать в поисковой системе какое-либо литературное произведение, то релевантными могут быть документы с плотностью ключевых слов менее 3%, т. к. название литературного произведения и его автора могут встречаться на странице всего лишь один раз, после чего может идти само произведение. Таким образом, плотность ключевых слов должна определяться для каждого запроса и тематики в отдельности;
  • расположение (распределение) ключевых слов запроса в тексте. Наиболее важно разместить ключевые слова запроса как можно ближе к началу текста. Идеальным будет вариант, когда ключевые слова встречаются более одного раза в первом предложении, и при этом первое предложение начинается с ключевых слов. Как показывают исследования в данной области, желательно, чтобы плотность ключевых слов равномерно убывала, начиная с начала документа;
  • расположение ключевых слов относительно друг друга. Если запрос состоит из двух и более ключевых слов, т. е. запрос представлен в виде фразы, то очень важным аспектом будет размещение ключевых слов как можно ближе друг к другу. Идеальным вариантом является точное вхождение фразы в тексте.

Все текстовые критерии оценки релевантности имеют очевидное логическое объяснение: создатели поисковых систем при разработке алгоритма оценки релевантности исходили из предположения, что интернет-ресурс создавался и структурировался в расчете на «живого» человека, т. е. если, например, страница посвящена какому-либо животному, то название данного животного должно встречаться несколько раз в тексте страницы, но при этом текст должен быть читаемым и информативным, а не набором ключевых слов.

3. Форматирование текста

В HTML-языке существует множество специализированных тегов, предназначенных для придания тексту или словам определенного вида, например, гарнитура шрифта, его начертание, размер, цвет и т. д. В таблице представлены теги форматирования, влияющие на текстовую релевантность текста документа запросу пользователя. Остальные теги мы рассматривать не будем, т. к. с точки зрения продвижения сайта интерес представляют только рассматриваемые в таблице теги.

Действие тега Тег физического форматирования Тег логического форматирования
Выделение полужирным – bold b strong
Выделение курсивом – italic i em

Выделение текста используется для акцентирования внимания пользователя на конкретных словах, фразах, в связи с чем мы можем увеличить релевантность документа запросу путем выделения ключевых слов. Рекомендуется акцентировать внимание на ключевых словах в тексте по мере необходимости и не более двух раз.

Теги strong и b используются для выделения текста или слов полужирным. Оба тега показывают выделенную область полужирным и имеют примерно одинаковый вес для поисковых машин. Различие между ними состоит в том, что тег физического форматирования b прямо указывает на то, что следует изменить свойства шрифта, сделать его полужирным, в то время как тег логического форматирования strong, наряду с визуальным, выделяет и логически. Например, компьютерные программы автоматического чтения текста сделают акцент на словах, заключенных в тег strong

Использовать можно любой из них для выделения фраз или отдельных слов, однако, приоритетнее использование тега strong. Желательно использовать данный тег для выделения ключевых слов в первом предложении.

Теги em и i форматируют текст курсивом. Оба тега показывают выделенную область курсивом и имеют примерно одинаковый вес для поисковых машин. Приоритетнее использование тега em.

Экспериментальные исследования показали, что тег strong более весом для поисковых систем, нежели тег em.

Существует так же тег u, который форматирует подчеркивание текста. Использовать данный тег не рекомендуется, так как он вводит в заблуждение пользователей, которые считают выделенную тегом область ссылкой.

4. Атрибуты тегов

Практически каждый тег имеет определенные атрибуты, которые задают значение тега, например, цвет, положение, начертание и размер шрифта и т.д.

С точки зрения повышения релевантности текста запросу, интерес представляет только атрибут alt тега img, если данный атрибут будет содержать ключевые слова запроса. Атрибут alt необходим для текстового описания изображения в случае, когда само изображение не может быть воспроизведено. Также, текстовое описание атрибута alt «всплывает» при наведении мыши на рисунок, поэтому не стоит прописывать в атрибуте alt все ключевые слова, а только лишь те, которые действительно описывают содержание картинки, иначе поисковая система может расценить это как спам.

Если Вы создаете сайт с целью его дальнейшего продвижения в поисковых системах по определенным запросам, то очень важным фактором, влияющим на продвижение, будет написание текстов, создание правильной структуры текста, его форматирование – акцентирование внимания пользователя на конкретных словах и фразах. Необходимо уже на этапе создания сайта продумать структуру и написать тексты с учетом ключевых слов запроса, их наличием в тексте, заголовках текста, распределением и выделением в тексте. При этом лишь грамотные, обдуманные действия приведут к увеличению текстовой релевантности Вашего документа определенному запросу и, следовательно, к высоким позициям в выдаче поисковых систем, без наложения штрафных санкций.

0 комментариев
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.

Отправьте отзыв!