Спам в Analytics стал одной из самых «горячих» тем аналитики в 2015 году. Пик обсуждений этой проблемы пришёлся на лето 2015 года, затем в ноябре она снова набрала популярность и не потеряла актуальности и по сей день.
Динамика популярности
Google создал справку «Фильтрация переходов из определенных доменов», что говорит об осведомлённости компании о данной проблеме и попытках найти её решение. Адам Сингер (Adam Singer), сотрудник Google Analytics, подтвердил, что Google работает над устранением проблемы рефспама, но дата релиза пока не названа.
Команда The Daily Egg проанализировала 292 аккаунта Google Analytics, не установивших спам-фильтрацию, у которых не менее 25 реферальных сеансов в день. Общий реферальный спам-трафик составил 11%, а 57% всех веб-сайтов получают трафик с хотя бы с одного из 500 спам-доменов.
Как сохранить новый трафик чистым с помощью автоматизированных инструментов
Большинство решений, с помощью которых можно очистить от спама статистику Analytics, предполагают ручную установку фильтра для спам-доменов или общую фильтрацию в рамках GA.
На данный момент существует около 550 доменов, которые вызывают проблему со спамом (актуальную базу данных спам-доменов можно найти на открытом ресурсе GitHub).
Из-за увеличения числа подобных доменов установка фильтров вручную стала отнимать слишком много времени, а учитывая тот факт, что новые спам-домены возникают каждый месяц, их появление достаточно сложно отслеживать.
Чтобы справиться с постоянно растущим объёмом спама, были созданы специальные инструменты, большинство из которых бесплатны.
Это не бесплатный инструмент, но это небольшая цена за избавление от лишней головной боли. Этот спам-блокер является одним из инструментов аналитики, предоставляемых Analytics Toolkit.
Referrer Spam Blocker – бесплатный инструмент от Stijlbreuk, обладающий одним из самых привлекательных и удобных для пользователей интерфейсов в этом списке.
Типы фильтра: по занесённым в чёрный список доменов
Цена: бесплатно
Достоинства:
Можно выбрать несколько ресурсов и представлений
Квота увеличилась до 5000 обращений в день
Недостатки:
Неполная база спам-доменов (203+ доменов, 17 фильтров)
Как работают инструменты и фильтры
Большинство инструментов содержат один или несколько следующих фильтров. Давайте рассмотрим, как они работают.
Exclude Empty Hostname
Исключить трафик пустого имени хоста
Большинство спам-ботов не присылает информацию с именем хоста, отправляя фейковые данные в GA.
Этот фильтр исключает все обращения с пустой колонкой «Имя хоста».
Exclude Empty Screen Resolution
Исключить трафик пустого разрешения экрана
Большинство спам-ботов не присылает информацию о разрешении экрана, отправляя фейковые данные в GA.
Этот фильтр исключает обращения с пустой колонкой «Разрешение экрана».
Include Only Own Hostnames
Включить трафик только собственных имен хоста
Иногда спам-боты всё же устанавливают имя хоста, используя в большинстве случаев имя хоста спам-домена, а не настоящего домена веб-сайта.
Фильтр удаляет все обращения с именами хоста, отличающимися от предоставленного списка имён.
Предупреждение: Этот фильтр включает только обращения с предоставленными именами хоста, исключая все остальные обращения. У этого есть отрицательная сторона: если вы измените домен в будущем или используете один и тот же GA аккаунт для нескольких доменов (например, для каждого языкового домена верхнего уровня или нескольких субдоменов), вы можете отфильтровать качественный трафик. Поэтому с этим фильтром стоит быть осторожнее, иначе можно лишиться большого объёма чистого трафика.
Хотя этот фильтр и хорош, он всё же неидеален. Некоторые спам-боты всё же посещают ваш сайт, используя верное имя домена, и в этом случае спам-трафик не отфильтровывается.
Exclude Blacklisted Domains (Campaign Source Filter)
Исключить трафик занесённых в чёрный список доменов (Фильтр по источникам кампании)
Когда не работает ни один другой фильтр, вам придётся исключить каждый занесённый в чёрный список домен вручную (на данный момент в базу дынных занесены около 550 доменов).
Большинство инструментов используют списки доменов, которые обновляются автоматически.
Как удалить спам из уже загрязнённого трафика
Вам не удастся очистить заспамленные данные в GA, используя вышеописанные методы. Google analytics поддерживает сегменты, которые позволят вам отфильтровать старый трафик.
Используя сегменты, вы можете скрыть все спам-домены в старых данных. Этот метод очень полезен в том случае, если у вас было много спам-трафика и вы его не фильтровали.
Просто импортируйте Analytics Spam Blocker (550 доменов) и вы сможете выбрать этот сегмент в любом представлении.
Нерекомендуемые решения
Существует ряд других решений, которые могут частично сработать, но не исключено, что они принесут больше вреда, чем пользы.
Создание специальных параметров для каждого сеанса (не лучше описанных фильтров)
Создание специальных параметров для каждого сеанса позволит вам отличить спам от качественного трафика. Для этого вам необходим доступ к коду отслеживания на веб-сайте.
Установка дополнительных параметров для триггера типа «Просмотр страницы» (не рекомендуется)
Чтобы установить дополнительные параметры, вам нужен доступ к коду отслеживания на веб-сайте.
Создание нового идентификатора отслеживания (не рекомендуется)
Создание нового идентификатора отслеживания GA не является удачным решением, так как вы потеряете все старые данные. Более того, спам-боты найдут ваш новый аккаунт и поступление спам-трафика возобновится.
Фильтрация IP адресов (не рекомендуется)
Фильтрация IP адресов не является эффективной, так как боты используют разные IP.
Вывод:
Google работает над решением проблемы спама в Analytics, и, будем надеяться, устранит её раз и навсегда в ближайшем будущем.
Однако до тех пор, пока решение не найдено, вы можете воспользоваться большим выбором автоматизированных инструментов, которые просты и удобны в использовании.
Друзья, теперь вы можете поддержать SEOnews https://pay.cloudtips.ru/p/8828f772
Ваши донаты помогут нам развивать издание и дальше радовать вас полезным контентом.
Добрый день! На днях заметил в GA странный трафик с lifehacker и reddit. Вероятно спамный. По вашему совету воспользовался первым сервисом в этой статье Analytics Referrer/Ghost Spam Blocker.
А как вы решаете эту проблему? И вообще нужно ли ее решать?
Какой смысл спамить в AdWords? Где там можно увидеть левые ссылки? Надо просто в GA убрать возможность кликать по спамным ссылкам - рефералам. Не будет у них трафика, и спама не будет.