Оценка спамности доноров

Компания Реаспект разработала новую оценку спамности доноров. Она в большей мере отражает степень спамности доноров, т.к. использует при анализе оценку оптимизированности анкоров. Собственно, во многом именно на основе анализа анкоров поисковые системы делают вывод о спамности ссылок (тот же «Мадридский доклад» и метрику «SEO-text»).

Метрика исходящих хостов на страницу (ссылок на страницу)

Пообщавшись с большим количеством SEO-специалистов, мы поняли, что сегодня часто используется простая метрика «ссылок на страницу» или «хостов на страницу». Её смысл: «Чем больше донор имеет ссылок на уникальные хосты, и чем меньше у него страниц, тем он спамнее».

Так же часто для расчёта качества донора некоторые специалисты используют количество входящих ссылок на донор, их посещаемость и т.п. То есть вся оценка о КАЧЕСТВЕ сводится к оперированию данных о КОЛИЧЕСТВЕ (доноров, получателей, посетителей и кучей других количественных метрик).

Мы задумались. Посмотрим со стороны поисковых систем. Поисковые системы не борются со ссылками. Они борются с псевдо-ссылками. Они не борются с сайтами, на которых много исходящих ссылок. Они борются с сайтами, на которых много псевдо-ссылок для манипулирования их алгоритмами.

Поэтому оперировать ТОЛЬКО количественной информацией при оценке спамности донора — всё-таки не совсем правильный подход. При проведении прошлого исследования по выявлению различных признаков коммерческих и некоммерческих анкоров, мы проанализировали множество анкор-листов сайтов, не продающих ссылки. Сайт, не продающий ссылки, по данной метрике может оказаться очень спамным. Хотя, с точки зрения поисковой системы, это должен быть вполне «чистый» источник данных (с которых часто ссылаются на википедию, популярные форумы, хостинги изображений и т.п.).

Метрика оптимизированности анкор-листа

Мы решили оценить степень спамности доноров оценивая оптимизированность их исходящих анкор-листов. Применили простую эвристику, основная суть которой заключается в учёте количества:

  • безанкорных ссылок (ссылок-картинок и урловых ссылок — http://; в спамных анкор-листах их доля обычно слишком низкая),
  • анкорных коммерческих ссылок (те слова и фразы, которые наиболее часто содержатся в коммерческих ссылках — выявлены так же по результатам прошлого исследования),
  • хостов-получателей — в качестве понижающего коэффициента (если их 500 и более — коэффициент равен 1; если хостов-получателей 1, то коэффициент стремится к нулю).

Данные факторы учавствуют в формуле в виде различных степенных логарифмических функций. Сами функции подбирались эмпирически.

Полученная формула показывает достаточно хорошую эффективность оценки спамности анкор-листов. Ручная оценка специалистом и оценка сервиса, использующего эту эвристику, совпадает минимум в 90% случаев. В то время, как оценки, использующие в основе метрику «исходящих хостов на страницу» совпадают с оценкой специалиста существенно реже (50-60%).

Этот же сервис мы смогли применить не только для оценки спамности исходящих анкор-листов. Но и оценки заспамленности акцепторов (входящих анкор-листов) — сайтов, которые находятся в активном продвижении.

Пример данных из нашего сервиса:

При желании, в формулу можно добавить и некоторые другие показатели (например, посещаемость, цитируемость, упоминаемость донора в качестве дисконтирующих коэффициентов).

В целом, идея достаточно простая и построена по логике поисковых систем. Пользуйтесь:)

Если хотите сравнить свои оценки доноров с оценкой нашего сервиса, то можете присылать 50 хостов на rustem@reaspekt.ru с пометкой «Хосты на оценку».


(Голосов: 7, Рейтинг: 3.86)