노이즈 처리

집계 가능한 보고서에서 노이즈를 사용하고, 이를 고려하고, 영향을 줄이는 방법을 알아보세요.

시작하기 전에

계속하기 전에 노이즈의 정의와 노이즈의 영향에 대해 자세히 알아보려면 요약 보고서의 노이즈 이해를 참조하세요.

소음 제어

집계 가능한 보고서에 추가되는 노이즈를 직접 제어할 수는 없지만 효과를 최소화하기 위해 취할 수 있는 몇 가지 단계가 있습니다. 다음 섹션에서는 이러한 전략을 설명합니다.

후원 예산에 맞춰 확장

노이즈 이해에서 설명한 것처럼 각 키의 요약 값에 적용된 노이즈는 0~65,536 척도 (0~CONTRIBUTION_BUDGET)를 기반으로 합니다.

노이즈 분포는 예산을 기반으로 합니다.

이 때문에 노이즈에 비례하는 신호를 최대화하려면 집계 가능한 값으로 설정하기 전에 각 값을 수직 확장해야 합니다. 즉, 기여 예산을 초과하지 않으면서 각 값에 특정 계수인 조정 계수를 곱해야 합니다.

배율 조정 적용 및 미사용 상대 노이즈.

배율 계산

배율은 특정 집계 가능한 값을 조정하려는 정도를 나타냅니다. 값은 기여 예산을 특정 키의 집계 가능한 최대 값으로 나눈 값이어야 합니다.

기여 예산을 기반으로 배율 결정

예를 들어 광고주가 총 구매 가치를 알고 싶어 한다고 가정해 보겠습니다. 개별 구매의 최대 예상 구매 가치가 2,000달러라는 것을 알고 있지만 무시하기로 한 몇 가지 이상점은 예외입니다.

  • 배율 계수 계산:
    • 신호 대 잡음 비율을 최대화하려면 이 값을 65,536 (기여 예산)으로 조정해야 합니다.
    • 이렇게 하면 약 32x 배율에서 65,536 / 2,000이 됩니다. 실제로는 이 인수를 반올림하거나 낮출 수 있습니다.
  • 집계 전에 값 확장. 구매 건 1, 000원마다 추적한 측정항목을 32씩 증가시킵니다. 예를 들어 120,000원 구매의 경우 집계 가능한 값을 120*32 = 3,840으로 설정합니다.
  • 집계 후 값 축소. 여러 사용자에게서 합산된 구매 금액이 포함된 요약 보고서를 받으면 집계 전에 사용한 배율을 사용하여 요약 값을 축소합니다. 이 예에서는 배율 32를 사전 집계로 사용했으므로 요약 보고서에 수신된 요약 값을 32로 나누어야 합니다. 따라서 요약 보고서의 특정 키에 대한 요약 구매 값이 76,800이면 요약 구매 값 (노이즈 포함)은 76,800/32 = $2,400입니다.

예산 분할

구매 수, 구매 가치 등 여러 측정 목표가 있는 경우 예산을 이러한 목표에 걸쳐 분할하는 것이 좋습니다.

이 경우 특정 집계 가능한 값의 예상 최댓값에 따라 다양한 집계 가능한 값에 따라 배율이 달라집니다.

자세한 내용은 집계 키 이해를 참고하세요.

예를 들어 구매 횟수와 구매 가치를 모두 추적하고 있으며 예산을 균등하게 할당하기로 했다고 가정해 보겠습니다.

측정 유형 및 소스당 65,536 / 2 = 32,768을 할당할 수 있습니다.

  • 구매 수:
    • 1건의 구매만 추적하고 있으므로 특정 전환에 대한 최대 구매 횟수는 1회입니다.
    • 따라서 구매 수의 배율을 32,768 / 1 = 32,768로 설정하기로 합니다.
  • 구매 가치:
    • 개별 구매의 최대 예상 구매 가치가 2,000달러라고 가정해 보겠습니다.
    • 따라서 구매 가치의 배율을 32,768 / 2,000 = 16.384 또는 약 16으로 설정하기로 합니다.

대략적인 집계 키는 신호 대 잡음비를 개선

대략적 키는 세분화된 키보다 더 많은 전환 이벤트를 포착하므로 일반적으로 대략적인 키가 요약 값이 더 높습니다.

요약 값이 클수록 낮은 값보다 노이즈의 영향을 덜 받습니다. 이러한 값의 노이즈는 이 값에 비해 더 낮을 가능성이 높습니다.

대략적인 키로 수집된 값은 더 세분화된 키로 수집된 값보다 비교적 노이즈가 덜할 가능성이 높습니다.

다른 모든 요소가 동일하게 유지되는 경우, 전 세계 구매 가치를 추적하는 키(모든 국가에서 합산됨)는 국가 수준에서 전환을 추적하는 키보다 요약 구매 가치와 더 높은 요약 전환수가 발생합니다.

따라서 특정 국가의 총 구매 가치에 대한 상대적 노이즈는 모든 국가의 총 구매 가치에 대한 상대적 노이즈보다 높습니다.

마찬가지로 다른 모든 값이 동일한 경우 신발의 총 구매 가치는 신발을 포함한 모든 상품의 총 구매 가치보다 낮습니다.

따라서 신발의 총 구매 가치에 대한 상대적 노이즈는 모든 상품의 총 구매 가치에 대한 상대적 노이즈보다 높습니다.

세분화된 키와 거친 키를 사용하는 노이즈의 영향

요약 값 (롤업)을 합산하면 해당 노이즈도 합산됩니다.

요약 보고서의 요약 값을 합산하여 상위 수준 데이터에 액세스함으로써 이러한 요약 값의 노이즈도 합산합니다.

롤업이 없는 세분화된 키의 노이즈 정도와 롤업이 없는 대략적인 키의 노이즈 정도

두 가지 접근 방식을 살펴보겠습니다. - 접근 방법 A: 키에 지역 ID를 포함합니다. 요약 보고서에는 특정 지역 ID 수준의 요약 구매 값과 연결된 지역 ID 수준 키가 표시됩니다. - 접근 방법 B: 키에 지역 ID를 포함하지 않습니다. 요약 보고서에는 모든 지역 ID / 위치의 요약 구매 값이 직접 표시됩니다.

국가 수준의 구매 가치에 액세스하려면 다음 단계를 따르세요. - 접근 방식 A에서는 지역 ID 수준 요약 값의 합계를 내고 노이즈도 합산합니다. 이로 인해 최종 지역 ID 수준 구매 값에 더 많은 노이즈가 추가될 수 있습니다. - 접근 방식 B에서는 요약 보고서에 표시된 데이터를 직접 살펴봅니다. 노이즈가 해당 데이터에 한 번만 추가되었습니다.

따라서 특정 지역 ID의 요약 구매 값은 A 접근 방식을 사용할 때 노이즈가 더 심할 수 있습니다.

마찬가지로 키에 우편번호 수준 측정기준을 포함하면 리전 수준 측정기준에 대략적인 키를 사용하는 것보다 노이즈가 더 많이 포함될 가능성이 높습니다.

장기간에 걸쳐 집계하면 신호 대 노이즈 비율이 증가합니다.

요약 보고서 요청 빈도가 낮다는 것은 보고서를 더 자주 요청한 경우보다 각 요약 값이 높을 가능성이 높다는 것을 의미합니다. 따라서 더 긴 기간 동안 전환이 더 많이 발생할 수 있습니다.

앞서 언급했듯이 요약 값이 클수록 상대적 노이즈가 낮아질 수 있습니다. 따라서 요약 보고서를 요청하는 빈도가 낮을수록 신호 대 노이즈 비율이 높아집니다.

요약 보고서 요청 빈도가 줄어들면 신호 대 노이즈 비율이 높아집니다.

예를 들면 다음과 같습니다.

  • 24시간 동안 시간별 요약 보고서를 요청한 다음 일별 수준 데이터에 액세스하기 위해 각 시간별 보고서의 요약 값을 합산하는 경우 노이즈가 24번 추가됩니다.
  • 일일 요약 보고서에서는 노이즈가 한 번만 추가됩니다.

높은 epsilon, 낮은 노이즈

epsilon 값이 높을수록 노이즈가 낮아지고 개인 정보 보호 기능은 낮아집니다.

필터링 및 중복 삭제 활용

서로 다른 키 간에 예산을 할당할 때 중요한 부분은 특정 이벤트가 발생할 수 있는 횟수를 파악하는 것입니다. 예를 들어 광고주는 클릭 1회당 구매 1건에만 관심이 있을 수 있지만 '제품 페이지 조회' 전환수는 최대 3회에 관심이 있을 수 있습니다. 이러한 사용 사례를 지원하려면 생성되는 보고서 수와 집계되는 전환을 제어할 수 있는 다음 API 기능을 활용할 수도 있습니다.

epsilon으로 실험

광고 기술은 epsilon을 0보다 크고 64 이하의 값으로 설정할 수 있습니다. 이 범위는 유연한 테스트를 허용합니다. epsilon 값이 작을수록 개인 정보 보호 기능이 향상됩니다. epsilon=10으로 시작하는 것이 좋습니다.

실험 권장사항

다음과 같이 하는 것이 좋습니다. - epsilon = 10으로 시작합니다. - 이로 인해 주목할 만한 유틸리티 문제가 발생하는 경우 epsilon을 점진적으로 늘립니다. - 데이터 사용성과 관련하여 찾을 수 있는 특정 변곡점에 관한 의견을 공유해 주세요.

참여 및 의견 공유

이 API에 참여하여 실험해 보세요.

다음 단계