В Яндекс.Метрике появилась возможность забирать сырые данные за любой период и работать с ними самостоятельно. Эту возможность обеспечит новый программный интерфейс Logs API.
В стандартных отчетах Метрики мы получаем агрегированные (обобщенные) данные, из которых удобно делать выводы. Сырые, неагрегированные данные могут пригодиться, чтобы получать новую статистику, которой нет в отчетах.
Вот несколько примеров:
Чтобы изучить пути пользователей к покупке, можно отслеживать историю переходов на сайт для каждого посетителя в отдельности. Например, можно посмотреть, как разнесены по времени визиты, в которых посетитель совершает целевые действия, и какие каналы приводят клиентов на том или ином шаге воронки.
Метрика предлагает три готовых модели атрибуции: по первому, последнему и последнему значимому переходу. Работа с сырыми данными позволяет создавать любые модели и анализировать долю разных маркетинговых каналов в конверсии.
Сырые данные из Метрики можно объединять с данными из других систем, а еще связывать их с данными в вашей CRM.
Если данные из других систем аналитики не сходятся с Метрикой, проанализируйте сырые логи и посмотрите, каким образом каждая из систем обрабатывает данные. Выберите наиболее подходящий для вас подход.
Сырые данные передаются в формате tsv. Файл можно импортировать в большинство систем управления базами данных, том числе в ClickHouse. Это бесплатное открытое решение, на котором работает и сама Метрика. ClickHouse обрабатывает сложные запросы в реальном времени, легко настраивается и не требует больших вычислительных ресурсов. Автоматически подгружать свежие данные в ClickHouse можно с помощью скрипта, подготовленного командой Метрики.
Документацию по Logs API, подробное описание схемы данных и скрипт выгрузки в ClickHouse вы найдете на сайте технологий.
Источник: Блог Яндекс.Метрики