Usando o Google Analytics com R

Andy Granowitz, mediador de desenvolvedores do Google Analytics – setembro de 2014

O objetivo deste artigo é incentivar os grandes estatísticos, pesquisadores e cientistas de dados que atualmente usam R a considerar o Google Analytics como um conjunto de dados útil e, da mesma forma, incentivar os usuários do Google Analytics a utilizar o R para suas graves necessidades de processamento de dados. Neste artigo, apresentamos um exemplo que demonstra como medir o valor de longo prazo das campanhas de marketing usando dados do Google Analytics em R.

Introdução

R, a linguagem de programação conhecida para computação estatística, é uma ferramenta poderosa para analisar e extrair insights de dados. Ao combinar R com seus dados do Google Analytics, você pode realizar análises estatísticas e gerar visualizações de dados para entender melhor e melhorar seus negócios.

O restante deste artigo descreve as etapas necessárias para gerar alguns dados e gráficos perspicazes usando a biblioteca do Google Analytics com R.

Configuração

A biblioteca RGoogleAnalytics permite recuperar dados do Google Analytics de maneira nativa do R. Para começar, faça o seguinte:

  1. Verifique se você tem acesso a uma conta do Google Analytics que contém dados que podem ser usados para análise
  2. Instalar R
  3. Instalar o pacote RGoogleAnalytics
  4. Siga o código de exemplo no GitHub (em inglês) para garantir que você consiga acessar os dados do Google Analytics em R

Para acessar outros recursos de configuração, acesse o Guia de configuração do RStudio.

Pergunta

Qual é o valor das minhas campanhas de marketing a longo prazo?

Os relatórios padrão no Google Analytics podem ajudar a determinar se as campanhas de marketing geram conversões a curto prazo. No entanto, pode ser difícil determinar o valor das campanhas no longo prazo, porque isso exige uma análise cumulativa.

Análise

Para determinar o valor de longo prazo das campanhas de marketing, você pode usar R para gerar receita cumulativa e gráficos de transações para determinados coortes. Dessa forma, é possível consultar quantas transações um grupo de clientes foi adquirido de determinada campanha de marketing ao longo de um período mais longo. Isso é diferente de uma análise mais padrão, em que você observa se um cliente que visitou sua propriedade em uma campanha de marketing fez uma compra imediatamente.

A consulta

Para realizar essa análise, é possível modificar a consulta de amostra do RGoogleAnalytics. A consulta a seguir extrai transações e receita de todos os usuários que acessaram o site pela primeira vez da Campanha A entre 1o e 7 de setembro de 2014 e fizeram uma compra em algum momento entre 1o e 29 de novembro.

query.list <- Init(start.date = "2014-09-01",
        end.date = "2014-11-29",
        dimensions = "ga:date",
        metrics = "ga:transactions,ga:transactionRevenue",
        segment = "users::sequence::^ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07;ga:campaign==Campaign%20A;->>perSession::ga:transactions>0",
        max.results = 10000,
        sort = "ga:date",
        table.id = tableId)

Se o segmento for omitido, a consulta vai extrair transações e receita de todos os usuários por data. A adição do segmento só inclui usuários que visitaram o site pela primeira vez e fizeram uma transação entre os períodos especificados.

Compreendendo o segmento

O segmento consiste em algumas condições de sequência:

  1. O segmento seleciona users:: para incluir não apenas as sessões que correspondem às condições, mas também todas as sessões entre os usuários que correspondem às condições.
  2. O prefixo sequence:: permite a seleção de um conjunto de usuários que concluíram um conjunto especificado de etapas. Nesse caso, a primeira etapa é acessar uma determinada campanha em um determinado período, e a segunda é fazer uma compra.
  3. O prefixo ^ na frente de ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07 garante que as condições "Data da sessão", "Campanha" e "Tipo de usuário" sejam verdadeiras para o primeiro hit da primeira sessão no período determinado.
  4. ->>perSession::ga:transactions>0 especifica a segunda etapa para fazer uma compra em algum momento.

Consulte o Guia do desenvolvedor sobre segmentos e veja mais detalhes sobre os possíveis segmentos para criação e detalhes de sintaxe, caso você queira modificar esse segmento ou criar um novo.

Como trabalhar com os resultados

O resultado desta consulta são transações e receita por dia para o grupo de usuários especificado. As transações diárias ou incrementais e a receita por dia podem ser transformadas em números cumulativos em R usando a função cumsum. Esses dados podem ser representados em um gráfico usando a função plot ou o pacote ggplot2.

Enquanto um gráfico de transação incremental mostra o número de transações que ocorreram em cada data, um gráfico de transações cumulativas mostra o número total de transações que ocorreram até cada data. Assim, o gráfico de transações cumulativas nos permite observar o valor de longo prazo de cada campanha:

Resultado

Ao analisar essas duas campanhas, vemos que, embora os clientes adquiridos da Campanha A tenham concluído mais transações do que os clientes adquiridos da Campanha B nas primeiras quatro semanas, no longo prazo, os clientes da Campanha B concluíram mais transações cumulativas. Analisar apenas as transações que ocorreram imediatamente após uma visita da Campanha A ou B teria levado à conclusão incorreta de que a Campanha A era mais eficaz.

Campanha A x
   Campanha B ao longo do tempo. A Campanha A supera o desempenho da Campanha B no início, mas não ao longo de nove semanas

Espero que isso tenha aberto seu apetite por analisar os dados do Google Analytics em R. Visite o fórum da API de relatórios do Google Analytics para compartilhar algumas das análises que você está fazendo.

Visão geral do vídeo

O vídeo abaixo descreve o exemplo neste artigo. Além disso, são apresentados outros dois casos de uso para o uso de R com o Google Analytics.