4 Августа 2015 в 11:56

Яндекс рассказал, как работает объектный ответ в поиске

10 3121

Яндекс рассказал, на основе каких данных составляются объектные ответы в результатах поиска.

Что это?

Объектный ответ – карточка с общей информацией о предмете запроса, находящаяся прямо на странице результатов поиска.

madonna.png

Функционал появился в выдаче Яндекса в апреле 2015 года и на тот момент содержал описания 92 млн известных личностей, фильмов, музыкальных альбомов, городов, лекарств, автомобилей и т.д. Сегодня их уже 110 млн.

Наряду с основными фактами в карточке объекта расположена и дополнительная информация. Так, для фильма это будет жанр, режиссер, продюсер и рейтинг на Кинопоиске. Для города – описание, площадь, численность населения и дата возникновения. Все зависит от типа запрашиваемого предмета.

В объектном ответе есть и допблоки. Например, для запросов о кино будет показан блок «Актеры», а для городов – «Достопримечательности».

В планах Яндекса сделать ответы полнее и добавить туда некоторые колдунщики из общего поиска. Например, плееры Музыки и Видео. Ведь пользователям, ищущим какую-то группу, будет интересно увидеть несколько популярных клипов и песен.

Как это работает?

Объектные формируются автоматически при помощи семантического графа – модели, описывающей совокупность объектов, их свойства и связи. Информация собирается из разных источников по всему интернету, которые затем оцениваются системой на предмет степени совпадения информации, наличия дублей и противоречащих фактов.

madonna-1.png

Дополнительные блоки строятся похожим способом. Только сопоставляются там не факты объектах, а связи между ними. Например, если в нескольких база сказано, что «Завтрак на траве» и «Олимпия» –это картины Эдуарда Мане, то, вероятно, так оно и есть. Но если в одной из баз указано, что к картинам Мане относятся «Кувшинки», но это больше нигде не подтверждено, то такая информация может быть расценена как ошибочная. Также система учитывает авторитетность источника, так что в карточку могут попасть данные, которые оказались на одном, но очень авторитетном ресурсе.

Выбрать из сотен миллионов связей наиболее актуальные помогает Матрикснет, позволяющий учитывать множество факторов при анализе поведения пользователей. Например, Мактрикснет может заметить, что с запросом «подсолнухи» часто встречается уточнение «ван гог». А в текстах, где встречаются эти слова, зачастую упоминаются Гоген и Сезанн. Так что в блоках «Произведения» и «Смотрите также» к карточке по запросу «ван гог» окажутся «Подсолнухи» и Гоген с Сезанном.

Помимо этого, Матрикснет помогает определить, насколько карточка будет интересна пользователю. Для этого он сравнивает ее с описаниями страниц в поиске. Так, в ответ на запрос «getz», конечно, можно показать информацию и саксофонисте Стене Гетце, но результаты поиска указывают на то, что лучше будет рассказать про автомобиль.

getz.png

10 комментариев
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
  • Максим Ляпцев
    59
    комментариев
    0
    читателей
    Максим Ляпцев
    больше года назад
    Интересная схема. А чем больше яндекс закупает сервисов, тем в большем количестве информации может копаться, например, купив auto.ru. Вообще уже интересно какие крупные компании в России что купили. Может будет статейка- исследование?
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    Где-то я уже это видел... ах да! это уже есть в Гугле
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    а вот еще одна опечаточка
    Но если в одной из баз указано, что к картинам Мане относятся Кувшинки, но это больше нигде не подтверждено, то такая информация может быть расценена как ошибочная. Также система учитывает авторитетность источника, так что в карточку могут попасть данные, которые оказались на одном, но очень авторитетном ресурсе.
    -
    0
    +
    Ответить
    Поделиться
    • Дарья Калинская
      201
      комментарий
      0
      читателей
      Дарья Калинская
      Гость
      больше года назад
      И вам спасибо, добрый человек :) Тут даже не опечатка, а целая ошибка. Посыпав голову пеплом, штудирую в перерывах Розенталя ...
      А чтобы не устраивать в комментариях подобные флешмобы, у нас есть комбинация Ctrl+Enter :)
      -
      0
      +
      Ответить
      Поделиться
      • Гость
        Дарья Калинская
        больше года назад
        вообще произвольный кусок текста выделил и вставил в коммент, а тут оказывается ошибочка xD ахаха
        -
        0
        +
        Ответить
        Поделиться
        • Дарья Калинская
          201
          комментарий
          0
          читателей
          Дарья Калинская
          Гость
          больше года назад
          А я подумала, что вы таки заметили отсутствие кавычек в названии картины ) Что ни день, то разочарование...
          -
          0
          +
          Ответить
          Поделиться
  • Гость
    больше года назад
    Вот еще одна опечатка:
    ... содержал описания 92 млн известных личностей, фильмов, музыкальных альбомов, городов, лекарств, автомобилей и т.д. Сегодня ИЗ уже 110 млн.
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    Очепятка: Например, Мактрикснет нет может заменить, что с запросом «подсолнухи»...
    -
    0
    +
    Ответить
    Поделиться
    • Дарья Калинская
      201
      комментарий
      0
      читателей
      Дарья Калинская
      Гость
      больше года назад
      Гость, это даже не очепятка, а страшно сказать, что такое! Спасибо, исправила :)
      -
      0
      +
      Ответить
      Поделиться

Отправьте отзыв!
X | Закрыть