В рассылке от "АиП" я прочитал “страшное” слово, вынесенное в заголовок. Слово хорошее, да вот только ошибочно полагать, что когда на сайт ссылаются плохие сайты, то доверие к сайту понижается, и, вообще, что TrustRank бывает отрицательным.
Как вычисляют TrustRank?
На самом деле, танцуя от печки. TrustRank - число от 0 до 1. 1 - верим, 0 - не верим, 0.5 - верим, но наполовину. То есть - есть ограниченное количество сайтов, отобранных вручную, которым верят на 100%. Например, сайт Президента ("ихнего"), Папы Римского или сайт королевы Великобритании, которая, как известно, всегда вне подозрений. Таких сайтов всего-то несколько сотен. Вот ссылки с этих сайтов и наделяют ненулевым уровнем доверия (TrustRank’ом) сайты, на которые они ссылаются. И итерация продолжается, но каждый раз уровень доверия уменьшается.
Поскольку святее Папы Римского быть нельзя - TrustRank не суммируется. То есть если на сайты второго уровня одной ссылкой с сайта первого уровня переносится уровень доверия TR=0.9, то две ссылки уровень доверия в 1.8 не дадут.
NB
Я теорию графов в ВУЗе то ли не проходил, то ли прогуливал, поэтому “извинтеляюсь”, если термин “степень связности графа” в природе не существует или существует, но трактуется по-другому. Чтобы не было разночтений - дам его определение. Связность графа - это возможность добраться из одной вершины (сайта) до другой по связям (ссылкам). Будем называть степенью связности максимальную длину кратчайшего пути между любыми двумя вершинами.
Степень связности веба не больше 8-9. То есть от сайта Папы Римского до моего блога не больше 9 прыжков по ссылкам. Если начальный TR=1, а падение доверия на каждом переходе по ссылке 10%, то конечный TR ~0.39. Чтобы увеличить уровень доверия к своему сайту нужно укоротить путь до него от сайта Папы Римского (или любого другого сайта с TR=1).
Надеюсь, теперь очевидно, что какие бы сайты ни ссылались на мой блог, кратчайшее расстояние до него от сайта с TR=1 может только уменьшиться, но никак не увеличиться, то есть от внешних ссылок TR может только возрасти. Тем не менее, уровень доверия можно легко подорвать самому. За счёт исходящих ссылок. Или контента.
Ещё одно лирическое отступление
Поскольку [проиндексированный] веб представляет собой связный граф, то даже на самый злобный дорвей можно добраться по ссылкам от сайта Папы Римского, т.е. для любого сайта расчётный TR >0. Но, когда выясняется, что сайт является дорвеем (или содержит варез или иной нелегальный контент), то ему присваивают TR=0.
Сайт теряет уровень доверия, если ссылается на сайты с TR=0. Т.е. если вдруг на сайте королевы Великобритании появится куча ссылок на доры, то сама-то королева останется вне подозрений, но это будет означать скорее всего только одно - сайт взломан, а стало быть уровень доверия этого сайта будет установлен в ноль, чтобы он не передавал TR другим сайтам, которые тоже могут быть неблагонадёжными, но об этом ещё неизвестно.
TrustRank и AntiTrustRank
Это крайне неприятное явление для торговцев ссылками. Представьте, что вы продаёте с морды 10 ссылок. На момент продажи все сайты покупателей были "белые и пушистые", но через некоторое время выясняется, что 5 из этих 10 сайтов решили запитать сетки доров. Это называется "сушите вёсла - приплыли". После бана сеток эти пять сайтов получат TR=0, а морда вашего сайта ссылается на 5 криминальных сайтов. Соответственно, и ваш сайт тоже надо изымать из цепочки распространения TR. И получается, как в полупроводниках, - в одну сторону дрейфуют электроны (TrustRank), а в другую - “дырки” (AntiTrustRank).
А вот для покупателей максимальная неприятность заключается в том, что возможна покупка слабо работающих ссылок за неслабые деньги. Это основная составляющая работы оптимизатора - оценить работает ли ссылка до её приобретения. Да и после постоянно проверять надо. Но это опять лирика.
Самый тонкий момент в этой истории - когда зануляют TR за ссылки на плохие сайты. Возможно, одна ссылка расценивается как случайность, две - как совпадение, а три - как закономерность. Абсолютно точно здесь не рассматривается процентное соотношение между "плохими" и "хорошими" ссылками, дабы принципиально исключить возможность маскировки плохих ссылок хорошими.
Хорошая новость заключается в том, что сайты с нулевым TrustRank тоже надо ранжировать. То есть существует множество ниш, в которых не нужно заморачиваться о существовании таких тонких материй, как TrustRank, а уж тем более и AntiTrustRank.