Сегодня основным подходом по выявлению спам-страниц является контент-анализ (content analysis), основанный на эвристических правилах. Компания Microsoft предлагает нечто новое – это контекстный подход (context-based approach), предполагающий применение анализа редиректа сайта (URL-redirection analysis).
Такой подход компания называет
Основными причинами появления нового подхода послужили следующие наблюдения:
- большинство спам-страниц используют редирект и клоакинг. Поэтому новый подход будет рассматривать каждую спам-страницу как динамическую программу, а не статичную страницу;
- большинство спамеров создают огромное количество дорвеев, также осуществляющих редирект. Определив домены целевых страниц, на которые ведет множество дорвеев, можно найти большинство спамерских доменов со всеми страницами-дорвеями и доменами-дорвеями.
Главными преимуществами такого подхода являются:
- возможность нахождения нового спама в уже ранее определенных спамерских форумах “HoneyForum”;
- отображение домена целевой страницы в списке Top Domain.