Выгрузка данных через Google Analytics API с заданным процентом случайной выборки (семплирования)
Иногда работая с большими данными на медленных компьютерах хочется по методу прогрессивного jpeg'a быстро получать ответы регулируя при этом процент выборки для изменения точности. Например, нужно посчитать пересечение аудиторий, данные о которых хранятся в разных ресурсах Google Analytics и понять, эта цифра ближе к 10% или к 90%? При этом не хочется выгружать полные данные и долго ждать точных вычислений. В таком случае, хотелось бы выгрузить какой-то процент случайных ClientID из обоих ресурсов и посчитать пересечение на этой выборке данных. Такой подход основан на методе Монте-Карло, который часто можно встретить для решения и других задач из разных областей.
Возвращаясь к вопросу выгрузки данных из Google Analytics с заданным процентом выборки (семплирования) на помощь приходит малоизвестный параметр Google Analytics — userBucket. По умолчанию, в Google Analytics этот параметр случайным образом заполняется целым числом от 1 до 100. Это значит, что по этому параметру можно выбрать любой случайный процент аудитории для получения отчетов прямо в интерфейсе или для более гибких расчетов выгружая данные по API. Например, так можно составить сегмент 15% случайных посетителей:
Возвращаясь к вопросу выгрузки данных из Google Analytics с заданным процентом выборки (семплирования) на помощь приходит малоизвестный параметр Google Analytics — userBucket. По умолчанию, в Google Analytics этот параметр случайным образом заполняется целым числом от 1 до 100. Это значит, что по этому параметру можно выбрать любой случайный процент аудитории для получения отчетов прямо в интерфейсе или для более гибких расчетов выгружая данные по API. Например, так можно составить сегмент 15% случайных посетителей:
А так можно выгрузить данные по API (если у вас ClientID хранится в «dimension1»):
Кроме того, что userBucket позволяет выгружать данные из Google Analytics с заданным процентом выборки (семплирования), его можно использовать для проведения A/B тестирования в аудиториях ремаркетинга. В справке Google Analytics есть отдельная статья на эту тему, в которой рассмотрен процесс создания и тестирования одинаковых аудиторий ремаркетинга, что позволяет определить максимально эффективную стратегию работы с ними.
Если у вас остались вопросы — задавайте их в комментириях к этой статье. Так же, можете подписаться на мой канал в Telegram —WebAnalytics, где я собираю информацию по веб-аналитике, по повышению конверсии и по анализу данных в маркетинге.
Комментарии
Отправить комментарий