Выгрузка данных через Google Analytics API с заданным процентом случайной выборки (семплирования)

Иногда работая с большими данными на медленных компьютерах хочется по методу прогрессивного jpeg'a быстро получать ответы регулируя при этом процент выборки для изменения точности. Например, нужно посчитать пересечение аудиторий, данные о которых хранятся в разных ресурсах Google Analytics и понять, эта цифра ближе к 10% или к 90%? При этом не хочется выгружать полные данные и долго ждать точных вычислений. В таком случае, хотелось бы выгрузить какой-то процент случайных ClientID из обоих ресурсов и посчитать пересечение на этой выборке данных. Такой подход основан на методе Монте-Карло, который часто можно встретить для решения и других задач из разных областей.

Возвращаясь к вопросу выгрузки данных из Google Analytics с заданным процентом выборки (семплирования) на помощь приходит малоизвестный параметр Google Analytics — userBucket.  По умолчанию, в Google Analytics этот параметр случайным образом заполняется целым числом от 1 до 100. Это значит, что по этому параметру можно выбрать любой случайный процент аудитории для получения отчетов прямо в интерфейсе или для более гибких расчетов выгружая данные по API. Например, так можно составить сегмент 15% случайных посетителей:


А так можно выгрузить данные по API (если у вас ClientID хранится в «dimension1»):

Кроме того, что userBucket позволяет выгружать данные из Google Analytics с заданным процентом выборки (семплирования), его можно использовать для проведения A/B тестирования в аудиториях ремаркетинга. В справке Google Analytics есть отдельная статья на эту тему, в которой рассмотрен процесс создания и тестирования одинаковых аудиторий ремаркетинга, что позволяет определить максимально эффективную стратегию работы с ними.

Если у вас остались вопросы — задавайте их в комментириях к этой статье. Так же, можете подписаться на мой канал в Telegram —WebAnalytics, где я собираю информацию по веб-аналитике, по повышению конверсии и по анализу данных в маркетинге.

Комментарии

Популярные сообщения из этого блога

Настройка Conversions API (Server-Side API) для Facebook Pixel

Как стримить Google Analytics данные в Facebook Analytics через Pixel

Как незаметно поломать систему аналитики для сайта на базе SPA