R과 함께 Google 애널리틱스 사용하기

앤디 그라노비츠, Google 애널리틱스 Developer Advocate – 2014년 9월

이 문서의 목표는 현재 R을 사용하는 훌륭한 통계학자, 연구자, 데이터 과학자가 Google 애널리틱스를 유용한 데이터 세트로 보고, 마찬가지로 Google 애널리틱스 사용자가 심각한 데이터 처리 요구에 R을 활용하도록 장려하는 것입니다. 이 도움말에서는 R에서 Google 애널리틱스 데이터를 사용하여 마케팅 캠페인의 장기 가치를 측정하는 방법을 보여주는 예를 살펴봅니다.

소개

통계 컴퓨팅에서 널리 사용되는 프로그래밍 언어인 R은 데이터에서 유용한 정보를 분석하고 도출하는 강력한 도구입니다. R과 Google 애널리틱스 데이터를 결합하면 통계 분석을 수행하고 데이터 시각화를 생성하여 비즈니스를 더 잘 이해하고 개선할 수 있습니다.

이 도움말의 나머지 부분에서는 R과 함께 Google 애널리틱스 라이브러리를 사용하여 유용한 데이터와 그래프를 생성하는 데 필요한 단계를 설명합니다.

설정

RGoogleAnalytics 라이브러리를 사용하면 R에서 기본적으로 Google 애널리틱스 데이터를 가져올 수 있습니다. 시작하려면 다음 단계를 따르세요.

  1. 분석에 사용할 수 있는 데이터가 포함된 Google 애널리틱스 계정에 액세스할 수 있는지 확인합니다.
  2. R 설치
  3. RGoogleAnalytics 패키지 설치
  4. GitHub의 예시 코드에 따라 R 내에서 Google 애널리틱스 데이터에 액세스할 수 있는지 확인하세요.

추가 설정 리소스는 RGoogleAnalytics 설정 가이드를 참고하세요.

문제

마케팅 캠페인의 장기적 가치는 얼마인가요?

Google 애널리틱스의 표준 보고서를 사용하면 마케팅 캠페인이 단기적으로 전환으로 이어지는지 확인할 수 있지만 누적 분석을 수행해야 하므로 캠페인의 장기적 가치를 파악하기가 어려울 수 있습니다.

분석

R을 사용하여 특정 동질 집단의 누적 수익과 거래 그래프를 생성하여 마케팅 캠페인의 장기 가치를 파악할 수 있습니다. 이렇게 하면 고객 그룹이 특정 마케팅 캠페인을 통해 일정 기간 동안 이루어진 거래 수를 확인할 수 있습니다. 이는 마케팅 캠페인을 통해 사이트를 방문한 고객이 즉시 구매했는지 여부를 관찰할 수 있는 보다 표준화된 분석과 대조됩니다.

쿼리

이 분석을 수행하려면 RGoogleAnalytics 샘플 쿼리를 수정하면 됩니다. 아래 쿼리는 2014년 9월 1일에서 9월 7일 사이에 캠페인 A에서 사이트를 처음 방문하고 9월 1일에서 11월 29일 사이에 구매한 모든 사용자의 거래와 수익을 가져옵니다.

query.list <- Init(start.date = "2014-09-01",
        end.date = "2014-11-29",
        dimensions = "ga:date",
        metrics = "ga:transactions,ga:transactionRevenue",
        segment = "users::sequence::^ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07;ga:campaign==Campaign%20A;->>perSession::ga:transactions>0",
        max.results = 10000,
        sort = "ga:date",
        table.id = tableId)

세그먼트가 생략된 경우 이 쿼리는 날짜별로 모든 사용자의 거래와 수익을 추출합니다. 세그먼트를 추가하면 사이트를 처음 방문하고 지정된 기간 사이에 거래를 한 사용자만 포함됩니다.

세그먼트 이해하기

세그먼트는 몇 가지 시퀀스 조건으로 구성됩니다.

  1. 세그먼트는 조건과 일치하는 세션뿐만 아니라 조건과 일치하는 사용자 간의 모든 세션을 포함하기 위해 users::을 선택합니다.
  2. sequence:: 프리픽스를 사용하면 지정된 일련의 단계를 완료한 사용자 집합을 선택할 수 있습니다. 이 경우 첫 번째 단계는 일정 시간 동안 특정 캠페인에서 방문하는 것이고 두 번째 단계는 구매입니다.
  3. ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07 앞에 있는 ^ 접두사를 사용하면 지정된 기간 내에 첫 번째 세션의 첫 번째 조회에 대해 세션 날짜, 캠페인, 사용자 유형 조건이 참이 됩니다.
  4. ->>perSession::ga:transactions>0는 특정 시점에 구매하는 두 번째 단계를 지정합니다.

이 세그먼트를 수정하거나 자체 세그먼트를 만들려는 경우, 만들 수 있는 세그먼트와 구문 세부정보를 자세히 알아보려면 세그먼트 개발자 가이드를 참고하세요.

결과 작업

이 쿼리의 결과는 지정된 사용자 그룹의 일일 거래 수 및 수익입니다. 일일 또는 증분 거래와 일일 수익은 cumsum 함수를 사용하여 R의 누적 수치로 변환할 수 있습니다. 그런 다음 plot 함수나 ggplot2 패키지를 사용하여 이 데이터를 그래프로 나타낼 수 있습니다.

점진적 거래 플롯은 각 날짜에 발생한 거래 수를 보여주고, 누적 거래 플롯은 각 날짜까지 발생한 총 거래 수를 보여줍니다. 따라서 누적 거래 도표를 통해 각 캠페인의 장기 가치를 확인할 수 있습니다.

결과

이 두 캠페인을 분석한 결과, 캠페인 A에서 획득한 고객이 처음 4주 동안 캠페인 B에서 획득한 고객보다 장기적으로 더 많은 거래를 완료했지만 장기적으로는 캠페인 B의 고객이 더 많은 누적 거래를 완료했음을 확인할 수 있습니다. 캠페인 A 또는 B의 방문 직후에 발생한 거래만 고려하면 캠페인 A가 더 효과적이라는 잘못된 결론을 내릴 수 있습니다.

시간 경과에 따른 캠페인 A와
   캠페인 B의 비교입니다. 캠페인 A의 실적이 캠페인 B보다 더 우수하지만, 9주 동안은 그렇지 않음

이로써 R에서 Google 애널리틱스 데이터를 분석하는 데 관심이 있으셨기를 바랍니다. Google 애널리틱스 Reporting API 포럼에서 흥미로운 분석 내용을 공유해 보세요.

동영상 개요

아래 동영상은 이 도움말의 예를 간략히 보여줍니다. 또한 R을 Google 애널리틱스와 함께 사용하는 두 가지 다른 사용 사례도 나와 있습니다.