9 Декабря 2010 в 13:21

Патент Google: рейтинг на основе делегирования траста

4 1938
Михаил Сливинский
Независимый эксперт аналитик, руководитель отдела поисковой аналитики,
«Викимарт»

Предмет этого патента я практически слово-в-слово изложил моему клиенту пару месяцев назад, отвечая на вопрос — «что такое траст и как это может работать». Понятно, это были мои догадки, сделанные на основе здравого смысла. 30-го ноября был опубликован патент Google, объясняющий их подход к этому вопросу.

Идея проста: учитывать авторитетность рекомендаций при ранжировании контента.

Изначально некоторое значение авторитета (траста) назначается верхнему (корневому) уровню. «Родитель» может делегировать некоторый траст своим «потомкам», соблюдая условие — суммарный переданный траст не может превышать собственный траст «родителя». Соответственно, любой участник может в какой-либо форме оценивать контент (статью, документ, исследование и т.п.). Чем авторитетнее участник — тем больший вклад в ранжирование получит документ.

Одна из иллюстраций патента, поясняющая сказанное:

Интересно, что Google рассматривает несколько возможных реализаций алгоритма. Например:

  • может или нет корневой ресурс участвовать в оценке контента напрямую;
  • на рейтинг документа может влиять не только траст непосредственного рекомендателя, но и траст его «предка»;

Большой интерес представляют возможные циклические связи и передача траста между рекомендателями.

Очевидно, будут предусмотрены ограничения, поскольку в нынешнем виду мы наблюдаем систему с положительной обратной связью.

Разумеется, в патенте предусмотрен и отзыв переданного траста. Очевидно, разработчики Google сразу закладывают в модель защиту от накруток и спекуляций.

Предусмотрено несколько методик расчета рейтинга документа, вот основная:

Для приведенного примера оценка документа «Content e» (151) будет вычислена следующим образом:

R=(a1,2r1,2:e + a2r2:e + a3,1r3,1:e) / (a1,2 + a2 + a3,1)

Прочие подробности — в патенте (pdf-версия).

Думаю, описанные подходы либо уже реализованы ведущими поисковыми системами, либо будет реализованы в самое ближайшее время. Ведь одна из самых больших проблем в современной сети — отсутствие персонификации и достоверных оценок. И эта проблема может быть решена со временем.

Поводом для этой статьи стали рассуждения Bill Slawski о том, как изменится ранжирование при введении описанных алгоритмов. С моей точки зрения, использование таких методов позволит существенно повысить качество ранжирования. Представьте, что Википедия служит «корнем» этой системы и раздает траст. Замечательный дополнительный сигнал для ранжирования!


4 комментария
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
  • Clausyar
    больше года назад
    А куда вы денетесь в интернете без ссылок? Сам интернет и является набором ссылок: вас передают от DNS к DNS до нужного вам IP адреса. Как это осуществить без ссылок? Другое дело, принципы фильтрации при поисковом запросе, но и тут без ссылок - не обойтись: надо же чего то фильтровать...
    -
    0
    +
    Ответить
    Поделиться
  • Aleksbel
    18
    комментариев
    0
    читателей
    Aleksbel
    больше года назад
    Серьезный материал. Пришлось прочитать несколько раз, чтобы включиться. Представляю, каково это было писать на понятном языке. "Разумеется, в патенте предусмотрен и отзыв переданного траста. Очевидно, разработчики Google сразу закладывают в модель защиту от накруток и спекуляций." Интересно, как можно будет работать в этой схеме над повышением траста, чтобы это не стало "накрутками и спекуляциями" и этот самый траст не был отозван?
    -
    1
    +
    Ответить
    Поделиться
  • Борис Комаров
    5
    комментариев
    1
    читатель
    Борис Комаров
    больше года назад
    Опять сылки, сылки, сылки... Был у них уже такой параметр и назвали они его PR. По сути нам показывается схема банальной ссылочной массы и ее распределения с учетом введения дополнительных параметров.

    "Очевидно, будут предусмотрены ограничения, поскольку в нынешнем виду мы наблюдаем систему с положительной обратной связью."
    Было такое и называлось это "Обмен ссылками"  )))

    "Разумеется, в патенте предусмотрен и отз...
    Опять сылки, сылки, сылки... Был у них уже такой параметр и назвали они его PR. По сути нам показывается схема банальной ссылочной массы и ее распределения с учетом введения дополнительных параметров.

    "Очевидно, будут предусмотрены ограничения, поскольку в нынешнем виду мы наблюдаем систему с положительной обратной связью."
    Было такое и называлось это "Обмен ссылками"  )))

    "Разумеется, в патенте предусмотрен и отзыв переданного траста." - а это называется "Не все ссылки одинаково полезны". Усилят/добавят фильтры, такие как "тематичность донора", "возраст ссылки" и т.д. и т.п. что-то подобное другая ПС уже ввела.



    Многие оптимизаторы для того, чтобы подняться в выдаче Google начинают скупать большое количество ссылок с PR, с введением этой формулы такая схема будет работать не долго. Т.О. кто работал нормально, следил за своим ссылочным у того и будет все хорошо. Ничего принципиально нового для многих не произойдет!
    -
    1
    +
    Ответить
    Поделиться
  • Михаил Сливинский
    33
    комментария
    0
    читателей
    Михаил Сливинский
    больше года назад


    Нет, это не так. Посмотрите внимательно на классическую схему расчета pagerank и на описание патента. Pagerank рассчитывается итерационно. Участники могут накапливать значительный PR просто участвуя в схемам линкообмена. При этом поисковая система изначально не располагает сведениями о достоверности и качестве сайтов и документов.

    В случае с трастом все существенно иначе. Есть некоторое изначальное количество "траста", назначенное корневому узлу, есть схе...


    Нет, это не так. Посмотрите внимательно на классическую схему расчета pagerank и на описание патента. Pagerank рассчитывается итерационно. Участники могут накапливать значительный PR просто участвуя в схемам линкообмена. При этом поисковая система изначально не располагает сведениями о достоверности и качестве сайтов и документов.

    В случае с трастом все существенно иначе. Есть некоторое изначальное количество "траста", назначенное корневому узлу, есть схема его передачи. Таким образом, снижается вероятность получения высокого траста плохим сайтом. Понятно, что мы увидим попытки накруток. но будет и ответ на это, как видно из документа. В конце концов, вебмастер двадцать раз подумает, а стоит ли рисковать потерей траста в угоду примитивной и неизбирательной ссылкоторговле.



    Все просто - нужно делать хорошие сайты :) В этом случае получать внешнее ссылочное много проще.



    Вообще, для тех, кто работает умно и аккуратно - вообще нет проблем ни сейчас, ни в будущем. Этот и аналогичные патенты - лишь способ отсеять мусор, которого немало в сети.



    Спасибо :)
    -
    1
    +
    Ответить
    Поделиться

Отправьте отзыв!
X | Закрыть