Вы когда-нибудь видели быстрые ссылки из тэгов Delicious?

Когда вы просматриваете результаты поиска, то иногда видите какие-то дополнительные ссылки на другие страницы сайта, в том числе и в рамках единственного результата поиска для страницы. Это часто случается, когда поисковая машина считает ваш запрос навигационным, а вы хотите найти какую-то конкретную страницу на сайте. Например, если вы хотите посетить домашнюю страницу WordPress, вместо того, чтобы набирать «wordpress.org» или «wordpress.com» в адресной строке браузера, вы можете набрать «wordpress» в поисковой форме. Существует вероятность того, что вы хотите попасть на страницу WordPress вместо того, чтобы найти сайты, на которых упоминается слово «wordpress».

Поисковые машины не всегда используют одни и те же механизмы, когда направляют вас на страницы, однако существует значительное количество сходств. Например, используя слово «wordpress» в поисковике Google, вы увидите домашнюю страницу wordpress.org вверху результатов поиска, а также несколько ссылок на страницы этого сайта, включая страницу, на которой можно скачать программное обеспечение, а также на страницу со ссылками на форумы поддержки. При аналогичном поиске в Yahoo вы увидите домашнюю страницу wordpress.com — сервиса размещения блогов, а также дополнительные страницы категорий блогов, которые можно найти на странице.

Почему Google показывает сайт, где можно скачать программное обеспечение, а Yahoo — сервис размещения блогов? Хороший вопрос.

Есть много вопросов относительно того, как поисковые машины обрабатывают навигационные запросы, и как они определяют, какой сайт и какие быстрые ссылки показывать под ними.

Часто кажется, что эти быстрые ссылки используют слова, которые являются сокращенными версиями якорного текста, использованного в ссылках на внутренние страницы сайта, однако выбор слов, который используется в тех ссылках, является в некотором смысле тайной. Недавний патент от Yahoo объясняет, как машина отбирает текст для быстрых ссылок, которые будут показаны пользователям в рамках результатов поиска.

В нем также объясняется, почему поисковая машина показывает быстрые ссылки вместо того, чтобы отображать несколько результатов поиска с той же самой страницы:

Если результаты будут представлены в виде URL-адресов или фрагментов популярных страниц в домене apple.com, то пользователь, вероятно, нажмет сразу на ссылку, ведущую на популярную страницу, на которую он хотел попасть изначально. Однако площадь страницы результата поиска мала, и, следовательно, ценна, поэтому показывать множество URL-адресов, фрагментов страниц и другой текст часто непрактично.

Обычное решение — показывать быстрые ссылки на популярные страницы сайта. Есть текстовые ссылки, обычно с короткими ярлыками, которые указывают на то, что страница находится внутри сайта. Такая тактика уменьшает использование площади страницы результатов поиска, и в то же время успешно справляется с задачей уменьшения количества шагов, которые пользователь должен предпринять для достижения цели. Ряд коммерческих поисковых машин, в том числе Google и Yahoo, используют такие быстрые ссылки.

Патент:

Назначение понимаемых человеком ярлыков веб-страницам

Изобретатель: Ashwin Tengli

Патент США 20090319533

Опубликовано 24 декабря 2009 года

Подано на рассмотрение 23 июня 2008 года

Аннотация

Методы и системы, которые присваивают ярлыки веб-страницам, собирают ряд ярлыков для входящих ссылок и оценивают языковую модель для веб-страницы, вычисляют вероятность генерирования каждого ярлыка для ссылки с учетом языковой модели, назначают оценку каждому ярлыку, основываясь на этой вероятности, и назначают веб-странице ярлык на основе оценок, назначенных каждому якорю входящих ссылок.

Ярлык для входящих ссылок желательно брать из ряда веб-документов, ссылающихся на эту веб-страницу. Назначенные ярлыки используются при предоставлении ссылок с текстом на веб-страницы с сайтов, находящихся вверху результатов поиска.

Интересно отметить, что в патенте текст, используемый в быстрых ссылках, называется «ярлыками», а не якорным текстом. Описанный процесс представлен довольно просто, однако речь здесь идет о довольно сложном процессе. Вот краткое изложение того, как «ярлыки» могут генерироваться для страниц, отображаемых в Yahoo как быстрые ссылки:

  • Для веб-страницы оценивается языковая модель;
  • Собирается ряд ярлыков для входящих ссылок веб-страницы;
  • Ярлыки для потенциального использования вычисляются на основе языковой модели, также им назначаются оценки;
  • Странице присваивается ярлык, который будет использоваться в качестве быстрой ссылки, ведущей на страницу.

«Языковая модель», создаваемая для страницы, включает глубокий анализ слов, которые есть на странице, или которые указывают на страницу. Среди них:

  • Название и данные заголовка веб-страницы;
  • Содержимое веб-страницы;
  • Потенциальные ярлыки для веб-страницы.

Ярлыки, или текст, используемый в быстрых ссылках, могут быть взяты из различных мест:

Якорный текст — якорный текст со ссылок, ведущих на веб-страницу. Возможно, будет рассмотрен текст вокруг ссылки и текст, связанный со ссылкой, ведущей на страницу, однако об этом в патенте прямо не говорится.

Тэги с сайта Delicious — Вкусные тэги, указывающие на веб-страницу, можно рассматривать как потенциальные ярлыки. Интересен тот факт, что здесь Yahoo упоминает об использовании тэгов с их сайта закладок Delicious. Я видел много страниц с тэгами на Delicious, которые лучше описывают отношения между страницей, добавленной в закладки, и человеком, который ее туда добавил, такие, как «прочитать» или «домашняя работа». Однако, возможно, что такой тип тэгов не может считаться ярлыком, так как не вписывается в рамки языковой модели, созданной для страницы, на которую указывает.

Запросы, с результатов которых перешли на страницу. Также возможно, что пользовательские поисковые запросы, по результатам которых в виде ссылок перейдут на ту или иную страницу, также можно назвать потенциальными ярлыками. Такая история поискового поведения — это независимый источник данных о содержимом страницы или ссылках, ведущих на страницу, основанный на информации, собранной поисковой машиной, однако он может считаться очень релевантным.

Зачем нужно использовать «ярлыки» из разных источников? Нам говорят, что этот метод имеет ряд преимуществ:

  • Методы и системы, созданные на основе этого изобретения, решают проблемы назначения веб-страницам понимаемых человеком ярлыков быстро и масштабируемо. Это дает возможность назначать ярлыки любой веб-странице и вставлять ссылки с короткими ярлыками на страницы результатов поиска для любого веб-хоста.
  • Кроме этого, вставки с применением ярлыков входящих ссылок используют веб-содержимое, генерируемое человеком, в то время как вставки, применяющие историю поисков, используют генерируемое человеком содержимое поиска. Активность поиска и производство веб-содержимого предоставляет текст ярлыка с относительно разными временными рамками.

Заключение

Поисковые машины говорят нам, что быстрые ссылки или ссылки на сайты могут быть полезны для пользователей, которые делают навигационные запросы, и, вероятно, хотят как можно быстрее перейти на конкретную страницу сайта. Например, я часто буду набирать «ESPN» в форме поиска для перехода на этот сайт, и выбирать среди быстрых ссылок «бейсбол» или «баскетбол» вместо того, чтобы использовать навигацию по сайту.

Ранее мы не видели в патентах, проектах или блогах поисковых машин объяснения того, как отбирается текст для быстрых ссылок. Этот патент дает нам представление о том, что хотят добиться поисковые машины, когда они отбирают текст для тех ссылок — очень короткий и очень информационный ярлык, который говорит нам, о чем может быть страница.

В патенте также говорится, что поисковая машина может брать ярлыки из нескольких различных источников, от якорного текста, ведущего на страницу, до тэгов из социальных сетей для добавления в закладки типа Delicious и поисковых запросов, которые делают пользователи. Рассмотрение этих ярлыков в свете языковой модели, созданной для этих страниц, увеличивает вероятность того, что быстрые ссылки точно описывают содержимое страницы.

Использует ли Yahoo тэги из Delicious в качестве возможных ярлыков для быстрых ссылок? Использование якорного текста, ведущего на страницы, из таких мест, как навигация по сайту, кажется наиболее очевидным источником ярлыков для быстрых ссылок, однако интересно рассмотреть возможности того, что поисковые машины используют тэги из таких источников, как Delicious и текст запросов, используемый для поиска страниц.


Переводной материал, источник.


(Голосов: 5, Рейтинг: 5)