데이터 보고 기대치

이 가이드에서는 Google 애널리틱스 Data API를 사용하여 생성된 보고서에 표시되는 데이터에 관한 중요한 정보를 설명합니다. 사용자는 API (특히 runReport 메서드)에서 반환된 데이터와 Google 애널리틱스 UI에 표시된 데이터 간에 불일치가 발생하는 경우가 많습니다.

샘플링 및 집계

Google 애널리틱스 Data API runReport 메서드는 특히 대규모 데이터 세트나 복잡한 쿼리의 경우 샘플링된 데이터를 반환할 수 있습니다. Google 애널리틱스 UI에서도 샘플링이 적용되지만 구체적인 기준점과 알고리즘이 다를 수 있으므로 보고된 값에 약간의 차이가 있을 수 있습니다.

보고서 결과가 사용 가능한 데이터의 하위 집합을 기반으로 하는지 확인하려면 ResponseMetaData 객체의 samplingMetadatas 필드를 검사하세요. 보고서 결과가 샘플링된 경우 이 필드는 이 보고서에 사용된 이벤트의 비율을 설명합니다.

Google 애널리틱스 Data API의 특정 보고 방법을 사용하면 원하는 샘플링 수준을 지정할 수 있습니다. properties.reportTasks.create 메서드의 samplingLevel 필드를 사용하여 보고서의 샘플링 수준을 제어할 수 있습니다.

이 기능을 사용하면 Google 애널리틱스 360 속성에서 10억 개의 이벤트라는 더 높은 샘플링 한도에 액세스할 수 있습니다. 또한 샘플링 제한을 UNSAMPLED로 설정하여 이벤트 수가 많은 경우 샘플링되지 않은 결과를 사용할 수 있습니다.

자세한 내용은 데이터 샘플링 정보를 참고하세요.

고유 개수 근사값

Google 애널리틱스 Data API는 HyperLogLog++ (HLL++) 알고리즘을 사용하여 활성 사용자 및 세션과 같은 측정항목의 고유 개수를 추정합니다. 이 접근 방식은 API와 Google 애널리틱스 UI에서 성능을 개선하고 대규모 데이터 세트를 효율적으로 관리하는 데 사용되므로 결과는 정확한 수가 아닌 근사치입니다.

자세한 내용은 Google 애널리틱스의 고유 개수 근사값사용자 수의 차이를 참고하세요.

데이터 기준점

Google 애널리틱스에서는 데이터에 표시된 인구통계, 관심분야 또는 기타 신호를 기반으로 개별 사용자를 식별하지 못하도록 보고서에 데이터 기준점을 적용할 수 있습니다.

보고서 행에 포함된 사용자 수가 적으면 해당 행이 결과에서 제외될 수 있습니다. 카디널리티가 높은 측정기준 또는 맞춤 측정기준이 포함된 보고서에서 더 흔합니다.

이 보고서에 기준점이 적용되는지 확인하려면 ResponseMetaData 객체의 subjectToThresholding 필드를 검사하세요.

자세한 내용은 데이터 기준점을 참고하세요.

(other)

측정기준의 카디널리티가 높으면 Google 애널리틱스에서 덜 일반적인 값을 (other) 라벨이 지정된 행으로 그룹화할 수 있습니다. 이는 일별 고유 값이 500개를 초과하는 측정기준이 포함된 보고서에서 더 흔합니다.

Data API에서 필터를 사용할 때 필터는 (other) 행 내부를 확인하지 않으며 데이터가 집계되고 (other) 행이 생성된 에 적용됩니다.

보고서에 (other) 행으로 롤업된 데이터가 포함되어 있는지 확인하려면 ResponseMetaData 객체의 dataLossFromOtherRow 필드를 검사하세요.

자세한 내용은 Google 애널리틱스 4의 '기타' 행을 참고하세요.

보고‏ ID

보고 ID는 보고서에서 사용자의 중복을 삭제하는 방법을 결정합니다. '혼합' 또는 '기기 기반'과 같은 다양한 ID 설정으로 인해 동일한 기간에 대해 사용자 수가 다를 수 있습니다.

Google 애널리틱스 UI와 Data API는 속성에 동일한 보고서 ID 설정을 사용합니다. 이 설정을 변경하면 UI와 API의 보고서에 모두 영향을 미칩니다. UI에서 보고서를 실행하는 것과 API를 통해 보고서 데이터를 가져오는 것 사이에 설정이 변경되면 동일한 기간의 두 보고서 간에 사용자 수가 다를 수 있습니다.

질문 구체성

불일치를 최소화하려면 API 요청의 다음 매개변수가 Google 애널리틱스 UI 보고서의 설정과 정확히 일치해야 합니다.

  • 기간: 시작일과 종료일이 동일한지 확인합니다.
  • 측정기준 및 측정항목: API 요청의 측정기준 및 측정항목이 Google 애널리틱스 UI 보고서의 측정기준 및 측정항목과 동일한지 확인합니다.
  • 필터: API 요청에 적용된 측정기준 또는 측정항목 필터가 UI에 사용된 필터와 일치하는지 확인합니다.

보고서에 측정기준을 추가하면 계산에 사용되는 이벤트 수가 줄어들 수 있습니다. 요청된 측정기준의 데이터가 포함된 이벤트만 보고서에 포함됩니다. 따라서 쿼리에 측정기준을 추가하면 보고서의 측정항목 집계 값이 변경될 수 있습니다.

데이터 최신 상태

Google 애널리틱스에서 이벤트 데이터를 처리하고 집계하는 데 시간이 걸립니다. 최근 데이터를 사용하는 경우 데이터 검색 사이에 시간 지연이 있으면 보고서 간에 약간의 차이가 있을 수 있습니다. 예를 들어 UI에서 보고서를 본 후 몇 분 후에 동일한 보고서에 대해 API를 쿼리하면 진행 중인 처리 및 집계로 인해 데이터가 변경되었을 수 있습니다.

자세한 내용은 데이터 업데이트를 참고하세요.

샘플링되지 않은 데이터 대안

사용 사례에 샘플링되지 않은 전체 이벤트 수준 데이터가 필요한 경우 다음 대안을 사용하는 것이 좋습니다.

  • BigQuery Export: Google 애널리틱스용 BigQuery Export

    원시 이벤트 데이터의 고급 분석에 권장되는 방법입니다.

  • 애널리틱스 360: 애널리틱스 360 라이선스가 있는 속성은 더 높은 샘플링 한도가 적용되며 더 자세한 보고 기능에 액세스할 수 있습니다.