Введение: на настоящий момент в русскоязычном интернете насчитывается несколько десятков систем, обрабатывающих статистику посещаемости сайтов. В ходе этого исследования решается задача по определению самых популярных систем статистики посредством подсчёта количества появлений счётчика системы в исходных кодах главных страниц.
Цель работы: определить долю сайтов, использующих системы по сбору статистики о посещаемости, определить наиболее популярные системы, а также выявить самые частые связки систем, которые используются в рамках одного сайта. Определить наиболее авторитетные системы статистики путём сравнения тИЦ сайтов статистических систем.
Материалы и методы:
Исследование проводилось параллельно с исследованием файлов robots.txt. В процессе сбора статистики для группы из 77642 сайтов, выбранных из каталога Яндекса, были загружены главные страницы. Объём полученных данных составил более 5 гигабайт. В исходных кодах сайтов из обозначенной группы был произведён поиск кода следующих счётчиков:
- Liveinternet
- SpyLog
- HotLog
- Rambler TOP100
- Top.mail.ru
- Google-analytics
- Bigmir)net
- 24LOG
- Logoslovo
- Hitcounter
- SmartLog
Выбор каталога поисковой системы Яндекс как источника сайтов продиктован тем, что при добавлении ресурсов в каталог модераторы Яндекса тщательно проверяют их содержимое. С большой долей вероятности можно считать, что все сайты разработаны для пользователей и представляют собой реальные ресурсы.
Ход исследования:
1. Популярность использования систем статистики
Системы сбора статистики применяются для оценки эффективности сайта. Они позволяют решить несколько задач анализа:
- Оценка общей эффективности;
- Оценка качества аудитории;
- Оценка технических параметров работы сайта.
На настоящий момент не существует универсальной системы анализа статистики.
Каждая из систем имеет свои особенности предоставления и анализа данных.
Все системы статистики работают посредством установки скрипта счётчика системы на страницах сайта, для которого проводится анализ.
Для исследуемой группы наличие счётчиков на страницах сайта имеет следующий вид (таблица 1):
Таблица 1 — Наличие счётчиков на страницах сайтов
Из данных таблицы 1 видно, что около трети сайтов из каталога Яндекса не используют исследуемые системы сбора статистики. Также необходимо отметить, что доля сайтов с 2-мя и более счетчиками в 2 раза выше, чем с одним, т.е. вебмастера чаще устанавливают несколько систем статистики.
Некоторые вебмастера, вероятно, в погоне за наиболее точной статистикой о посещаемости сайта, разместили 7 (максимальное значение) счётчиков из указанного списка (mykeira.com, scards.ru, www.cdc.ru).
2. Наиболее популярные системы статистики
После загрузки главных страниц для всей исследуемой группы сайтов было получено следующее распределение популярности систем статистики (таблица 2):
Таблица 2 — Наиболее популярные системы статистики
Чаще всего в русскоязычном интернете встречается счётчик Rambler Top100. Эту популярность объясняет то, что счётчик является одним из самых старых, а также то, что он работает в связке с каталогом сайтов, который генерирует большой трафик пользователей на зарегистрированные в нём сайты.
Второе место принадлежит системе LiveInternet. Это можно объяснить бóльшим спектром статистики, предоставляемой в рамках этой системы. При этом наблюдается отставание в 11 процентов от лидера исследования.
Счётчик GoogleAnalytics, предоставляющий в распоряжение своим пользователям уникальные инструменты, значительно отстаёт от лидеров. Несмотря на такие преимущества этой системы статистики, как
- отсутствие графического элемента;
- компактность кода счётчика.
3. Наиболее популярные связки счётчиков
Из данных таблицы 1 видно, что 40% вебмастеров используют в рамках своих сайтов несколько систем статистики. Вероятнее всего, это делается для получения более объективных данных, на основе сравнения результатов нескольких счётчиков. Чаще всего встречаются следующие группы (таблица 3):
Таблица 3 — Наиболее популярные связки систем статистики
Из данных таблицы 3 видно, что самая популярная связка систем статистики — LiveInternet и Rambler TOP100. На втором месте к указанной связке примыкает ещё система Top.mail.ru.
Популярность связки LiveInternet + Rambler TOP100 легко объясняется тем, что большинству вебмастеров достаточно того объема данных, который предоставляет система LiveInternet, а каталог Rambler TOP100 — единственный рейтинг сайтов, способный генерировать значительный трафик пользователей.
Стоит отметить, что в каждую из восьми указанных связок входит счётчик системы Rambler TOP100. Что ещё раз подтверждает популярность и авторитетность этой системы статистики.
4. тИЦ сайтов систем статистики
Тематический индекс цитирования (тИЦ) определяет «авторитетность» интернет-ресурсов с учетом качественной характеристики ссылок на них с других сайтов. Эту качественную характеристику называют «весом» ссылки. Рассчитывается она по специально разработанному алгоритму. Большую роль играет тематическая близость ресурса и ссылающихся на него сайтов. Само по себе количество ссылок на ресурс также влияет на значение его тИЦ, но тИЦ определяется не количеством ссылок, а суммой их весов (источник). Соответственно, чем больше авторитетных сайтов ссылается на сайт системы статистики, тем выше у него индекс цитирования.
Приведём значения тИЦ для сайтов систем статистики (таблица 4):
Таблица 4 — значения тИЦ для сайтов систем статистики
Из данных таблицы 4 видно, что авторитетность в глазах поисковой системы Яндекс достаточно точно соответствует значениям популярности систем статистики, установленным в данном исследовании. Высокая авторитетность системы Bigmir)net связана с тем, что на данном доменном имени располагается не только система статистики, но и крупный портал с достаточно большим функционалом.
Высокая авторитетность системы top.mail.ru объясняется тем, что в коде счётчика стоит прямая гиперссылка (не закрытая в блок). Это позволяет роботам поисковой системы Яндекс индексировать данные ссылки, а, следовательно, увеличивает ТИЦ сайта системы статистики.
Выводы:
- Более чем на 60% сайтов установлены системы анализа статистики.
- Вебмастера чаще всего устанавливают сразу несколько счётчиков (связку).
- Самой популярной системой статистики является Rambler Top100.
- Система Google Analytics пользуется низкой популярностью среди российских вебмастеров.
- Система Rambler Top100 участвует в большинстве популярных связок систем статистики.
- Rambler Top100 образует самую популярную связку вместе с системой LiveInternet.
- Более чем на 2% сайтов установлено сразу 5 различных счётчиков (LiveInternet + SpyLog + HotLog + Rambler TOP100 + Top.mail.ru).
- тИЦ сайтов систем статистики в большинстве случаев соответствует популярности системы.