Черные дыры Google Analytics, или Где теряются данные

Наверное, вы не раз замечали, что данные, собранные разными счетчиками, могут различаться. Также совершенно разными могут быть показатели в сервисах и в отчетах о продажах. Куда пропадают данные из Google Analytics и других инструментов? Как сделать так, чтобы получить максимально приближенные к реальности цифры? Эксперт Moz и глава консультативной группы агентства Distilled Том Каппер исследовал этот феномен, а редакция SEOnews перевела для вас его отчет.

Методология

Если методология исследования вам не интересна, можете пропустить этот пункт и сразу перейти к результатам.

В качестве примера в исследовании фигурируют данные реального сайта distilled.net.

У нас есть стандартный ресурс Google Analytics, настроенный через Google Tag Manager (GTM). На сайте установлено три разных счетчика GA, чтобы измерять расхождения между различными конфигурациями.

Два счетчика (один установлен через Google Tag Manager, другой – напрямую) установлены локально. Инструменты аналитики часто не могут отследить пользователей с установленными блокировщиками рекламы. Чтобы обойти защиту эдблокеров, мы переименовали копии файла GA JavaScript (www.distilled.net/static/js/au3.js вместо www.google-analytics.com/analytics.js), функции JavaScript (f1 и f2 вместо стандартных ga) и счетчики (t1 и t2).

Третий объект отслеживания (переименован в t3), напротив, использует стандартный код и встроен напрямую в код страницы.

На таблице собраны все описанные выше настройки:

Счетчик

Функция переименована?

Установлен через GTM или напрямую?

Файл JavaScript размещен локально?

По умолчанию

Нет

GTM HTML-тег

Нет

t1

Да – f1

GTM HTML-тег

Да

t2

Да – f2

Напрямую

Да

t3

Нет

Напрямую

Нет


Наблюдая за количеством просмотров в инструментах разработчика браузера, мы протестировали, как счетчики работают с разными блокировщиками рекламы и браузерами. Нам удалось собрать статистику по каждому и проанализировать, по каким причинам Google Analytics может «терять» данные.

Причина №1: Блокировщики рекламы

В этом разделе мы проверили, какие блокировщики рекламы скрывают данные пользователей от инструментов аналитики, а какие – нет.

В последние годы функционал эдблокеров расширился: теперь они умеют не только скрывать рекламу, но и защищать личные данные. В этом и заключается проблема: пользователи становятся невидимыми для инструментов аналитики.

Некоторые из них блокируют сервисы аналитики по умолчанию, другие – только если включить специальную настройку. Например, AdBlock Plus «прячет» пользователей при включенной функции EasyPrivacy. uBlock Origin, напротив, скрывает личные данные по умолчанию.

Таблица показывает, отслеживаются ли данные пользователей с установленными AdBlock Plus и uBlock Origin.

Установка

Adblock Plus без допнастроек

Adblock Plus с настройкой EasyPrivacy

uBlock Origin

Через GTM

Да

Нет

Нет

На странице

Да

Нет

Нет

Через GTM, код и функция переименованы

Да

Нет

Нет

На странице, код и функция переименованы

да

Нет

нет


Из данных таблицы делаем вывод, что изменение названия не спасает от потери данных.

Из-за блокировщиков рекламы инструменты аналитики теряют до 10% данных.

В разных регионах эдблокеры установлены у 15-25% всех пользователей интернета. На данный момент Adblock Plus является лидером рынка, на него приходится 50-70% от всех установок блокировщиков рекламы. Однако большинство используют стандартные настройки AdBlock Plus, которые не мешают инструментам аналитики собирать данные.

Причина №2: Функция «Не отслеживать» в браузерах

В этом разделе мы проверили, какие браузеры со включенной функцией «Не отслеживать» позволяют GA собрать данные, а какие – нет.

Настройка «Не отслеживать» есть в большинстве популярных браузеров и также служит для защиты личных данных. В Firefox Quantum есть улучшенная версия «Не отслеживать», которая называется «Защита от отслеживания в приватном режиме». Ее мы также включили в выборку.

Таблица показывает, отслеживаются ли данные в последних версиях Chrome и Firefox для Windows со включенной функцией «Не отслеживать» и Firefox Quantum с «Защитой от отслеживания в приватном режиме».

Установка

Chrome «Отправлять запрет отслеживания с исходящим трафиком»

Firefox «Защита от отслеживания»

Firefox Quantum «Защита от отслеживания в приватном просмотре»

Через GTM

Да

Да

Нет

На странице

Да

Да

Нет

Через GTM, код и функция переименованы

Да

Да

Нет

На странице, код и функция переименованы

Да

Да

Нет


Здесь также видно, что изменение названий не помогло собрать просмотры пользователей Firefox Quantum с усиленной защитой.

Из-за включенной функции «Не отслеживать» теряется менее 1% данных.

Единственным браузером, которому удалось помешать Google Analytics собрать данные, стал запущенный в феврале 2018 года Firefox Quantum. Но функция «Защита от отслеживания в приватном просмотре» не включена по умолчанию, поэтому ей пользуется очень маленький процент юзеров, и влияние на количество данных, собранных GA, так мало.

Причина №3: Фильтры

Фильтры, установленные в Google Analytics, также могут искажать данные по трафику, полученные с помощью инструментов аналитики. Иногда специалисты долгое время не обращают на это внимание. Например, вы поставили фильтр, который отключает отслеживание трафика с устройств с редким разрешением экрана, потому что решили, что в этой категории только боты и сбор данных бесполезен. На самом деле таким образом вы можете потерять данные..

Количество данных, которые теряются из-за включенных фильтров, оценить невозможно, так как настройки варьируются от сайта к сайту.

Мы рекомендуем создать дубликат без фильтров, чтобы вовремя отслеживать разницу и принимать меры.

Причина №4: Настройка через Google Tag Manager

В этом разделе мы сравнили показатели, собранные счетчиками, установленными через GTM и напрямую, а также узнали, что будет, если поместить код счетчика не в head, а в body.

Уже несколько лет Google Tag Manager является одним из главных инструментов внедрения сервисов аналитики. Однако в ходе исследования стало понятно, что счетчики, установленные напрямую, отображают больше просмотров, чем уставленные через GTM.

Также мы проверили, какой процент данных «потеряется», если не следовать всем инструкциям Google по установке кода счетчика на сайт.

За 100% мы взяли стандартный счетчик, установленный через GTM.

GTM

Изменен и размещен через GTM

Размещен в head

Изменен и размещен в head

Размещен в body

Chrome

100%

98,75%

100,77%%

99,8%

94,75%

Safari

100%

99,42%

100,55%

102,08%

82,69%

Firefox

100%

99,71%

101,16%

101,45%

90, 68%

Internet Explorer

100%

80,06%

112,31%

113,37%

77,18%


Выводы:

  • Код, встроенный в страницу напрямую, показывает больше трафика, чем добавленный через GTM.
  • Измененный код всегда дает результаты в пределах погрешности, в отличие от измененного кода, встроенного через GTM в IE, о чем подробнее будет рассказано ниже;
  • В зависимости от браузера неверно установленный код отслеживания может стоить вам до трети трафика по сравнению с корректно установленным счетчиком.
  • Кастомизированные настройки, которые должны помочь избегать блокировщики рекламы и тем самым фиксировать больше трафика, по сути не приносят никакой пользы.

Из-за неправильно размещенного кода теряется около 10% данных.

Стоит отметить, что кастомизированные счетчики получили меньше трафика, чем стандартные. Для счетчика, внедренного на страницу через код, это скорее погрешность, а для GTM существует другая причина. Я использовал профили без фильтра, поэтому в главном профиле много трафика от ботов, которые маскируются под пользователей Internet Explorer. Наш главный профиль – самый спамный – в исследовании взят как исходная отметка. Таким образом разница между счетчиками, установленными напрямую и через GTM, может быть больше, чем показывает это исследование.

Также мы оценили разницу между трафиком с разных устройств:

GTM

Изменен и размещен через GTM

Напрямую на сайт в head

Изменен и Напрямую на сайт в head

Напрямую на сайте, на через body

Десктоп

100%

98,31%

100,97%%

100,89%

93,47%

Смартфоны

100%

97,00%

103,78%

100,42%

89,87%

Планшеты

100%

97,68%

104,20%

102,43%

88,13%


Вывод: Из-за установки через GTM могут теряться и данные мобильных браузеров.

Размещение счетчика Google Analytics через GTM может лишить вас данных о 1-5% просмотров, а размещение счетчика в body – около 10%.

Количество потерянного трафика зависит от того, с какого браузера и девайса пользователь заходит на ваш сайт. На сайте distilled.net разница составляет около 1,7%, учитывая, что аудитория больше заходит с десктопа и почти не пользуется Internet Explorer.

Я сфокусировался на тех областях, где данные могут полностью отсутствовать. Однако GA может потерять только часть данных или неправильно истолковать полученную информацию. Обычно у этого две причины: «темный трафик» и атрибуция.

«Темный трафик»

«Темным трафиком» называются переходы на сайт, источник которых неизвестен.

Причины возникновения «темного трафика»:

  • отсутствие тегов в email-кампаниях;
  • отсутствие тегов в кампаниях для приложений (в Facebook, Twitter и т.д.);
  • искаженные данные по трафику;
  • неправильные настройки счетчика.

Стоит отметить, что в последнее время растет доля прямого трафика, который исторически считался органикой. Из-за автозаполнения браузера, синхронизации истории пользователей на разных устройствах и других нововведений юзеры все чаще вводят URL сайта вручную.

Атрибуция

Сеанс в инструментах аналитики – нестабильный процесс. Вам может казаться очевидным, как группы обращений собираются в сессии, но на самом деле это – сложный процесс, который зависит от многих факторов. Стоит отметить, что Google Analytics обычно присваивает прямой трафик (в том числе и «темный») непрямым источникам, если такие имеются.

Алексей Бузин, генеральный директор СЕО Импульс
Если вы установили счетчик от Google Analytics и не видите какие-то переходы, в первую очередь нужно убедиться, что счетчик установлен на всех страницах сайта. Достаточно часто его забывают поставить на лендинг, к примеру, для какой-то рекламной кампании, и, соответственно, статистика оттуда теряется. Наиболее распространенными потерями данных по трафику считаю использование различных блокировщиков в браузерах и режимов Инкогнито.

Андрей Зайко, руководитель отдела аналитики агентства performance-маркетинга Adventum
Существует два вида систем аналитики: те, что обрабатывают логи со всеми запросами загрузки страниц (серверные), и те, что отслеживают загрузки страниц в браузерах пользователей. Ко второму типу относятся Google Analytics и Яндекс.Метрика. Основное их предназначение – анализ поведения пользователей на сайте и оптимизация рекламы. Для того и другого не обязательно обладать 100% данных. Достаточно анализировать тренды изменения показателей и сегменты.

Самое банальное, что может помешать при сборе статистики, неполная загрузка страницы и скорость интернета. Именно поэтому в Google Analytics и Яндекс.Метрике всегда будут расходиться данные по просмотру страниц: какой-то из счетчиков сработает быстрее, а какой-то просто не успеет загрузиться.

Данные также могут теряться из-за блокировщиков рекламы, внешних ситуаций (яркий пример: недавняя блокировка Роскомнадзором серверов Google).

Есть мнение, что нежелательно устанавливать коды аналитики через GTM. При его использовании в первую очередь грузится контейнер с тегами, а только потом счетчики. Это дополнительные времязатраты, которые могут вести к потере данных. На практике же количество “упущенных” пользователей не превышает 1-2%. Их компенсируют преимущества GTM: простая настройка аналитики и кодов других сервисов, отсутствие необходимости во внешней разработке, что снижает вероятность ошибок внедрения и исключает лишние затраты.

Дополнительными причинами потери трафика могут быть некорректно настроенные фильтры или ограничения системы аналитики. Данные не будут собраны, если за одну сессию будет зафиксировано более 500 хитов (загрузок страниц или событий) или размер отправляемых данных превысит 8192 байта.

Чтобы минимизировать потери при сборе данных, мы придерживаемся нескольких простых правил:

  1. Устанавливаем счетчики аналитики или GTM как можно выше на странице.
  2. При настройке счетчиков в Google Analytics всегда делаем как минимум два представления: “рабочее” с фильтрами и “резервное” без фильтров. Это помогает получить информацию даже тогда, когда была допущена ошибка в настройках.
  3. Если в рамках проекта отправляется большой объем данных, фиксируется много событий и просмотров страниц, используем свою кастомную настройку передачи данных.
  4. Если хотим видеть максимальное количество данных по всем пользователям, настраиваем передачу данных через Measurement Protocol. Это трудозатратно, но позволяет анализировать практически 100% данных.

(Голосов: 1, Рейтинг: 5)