이 페이지는 Cloud Translation API를 통해 번역되었습니다.

노이즈 실험실

이 문서에 관한 정보

이 도움말을 읽으면 다음과 같은 효과를 얻을 수 있습니다.

요약 보고서를 생성하기 전에 만들어야 할 전략을 파악합니다.
다양한 노이즈 매개변수의 효과를 파악하고 다양한 노이즈 관리 전략을 빠르게 탐색 및 평가할 수 있는 도구인 Noise Lab에 대해 알아봅니다.

의견 공유

이 문서에서는 요약 보고서를 사용하기 위한 몇 가지 원칙을 요약하고 있지만 노이즈 관리에 관한 여러 가지 접근 방식이 여기에 반영되지 않을 수 있습니다. 제안, 추가, 질문은 언제든지 환영합니다.

노이즈 관리 전략, API (epsilon)의 유틸리티 또는 개인 정보 보호에 대한 대중의 의견을 제공하고 Noise Lab으로 시뮬레이션할 때 관찰한 내용을 공유하려면 이 문제에 관해 의견 보내기
Noise Lab에 관한 공개 의견을 제공하려면 (질문, 버그 신고, 기능 요청) 여기에서 새로운 문제를 작성하세요.
API의 다른 측면에 관한 공개 의견을 제공하려면 여기에서 새로운 문제 신고

시작하기 전에

자세한 내용은 기여도 보고: 요약 보고서 및 기여도 보고 전체 시스템 개요를 참고하세요.
이 가이드를 최대한 활용하려면 노이즈 이해 및 집계 키 이해를 살펴보세요.

디자인 결정

핵심 설계 원칙

서드 파티 쿠키와 요약 보고서의 작동 방식에는 근본적인 차이가 있습니다. 한 가지 주요 차이점은 요약 보고서의 측정 데이터에 노이즈가 추가된다는 점입니다. 또 다른 방법은 보고서의 예약 방법입니다.

신호 대 노이즈 비율이 더 높은 요약 보고서 측정 데이터에 액세스하려면 수요측 플랫폼 (DSP) 및 광고 측정 제공업체가 광고주와 협력하여 노이즈 관리 전략을 개발해야 합니다. 이러한 전략을 개발하기 위해 DSP와 측정 제공업체는 설계와 관련된 결정을 내려야 합니다. 이러한 결정은 한 가지 본질적인 개념을 중심으로 이루어집니다.

분포 노이즈 값은 절대적으로 두 매개변수⏤epsilon 및 기여도 예산에만 의존하지만 출력 측정 데이터의 신호-노이즈 비율에 영향을 미치는 다른 여러 제어 기능을 원하는 대로 사용할 수 있습니다.

반복적인 프로세스를 통해 최선의 결정을 내릴 것으로 예상하지만 이러한 결정의 각 변형은 약간 다른 구현으로 이어집니다. 따라서 각 코드 반복을 작성하기 전과 광고를 게재하기 전에 이러한 결정을 내려야 합니다.

결정: 크기 세부사항

노이즈 실험실에서 사용해 보기

고급 모드로 이동합니다.
매개변수 측면 패널에서 전환 데이터를 찾습니다.
기본 매개변수를 확인합니다. 기본적으로 일일 총 기여 전환수는 1, 000회입니다. 기본 설정 (기본 측정기준, 측정기준별로 가능한 다른 값의 기본 개수, 키 전략 A)을 사용하는 경우 버킷당 평균은 약 40입니다. 입력된 '버킷당 평균 일일 기여 전환수'의 값이 40인지 확인합니다.
'시뮬레이션'을 클릭하여 기본 매개변수로 시뮬레이션을 실행합니다.
매개변수 측면 패널에서 측정기준을 찾습니다. 지역의 이름을 도시로 바꾸고 가능한 서로 다른 값의 수를 50으로 변경합니다.
이렇게 하면 버킷당 평균 일일 기여 전환수가 어떻게 달라지는지 관찰합니다. 이제 훨씬 낮아졌습니다. 이는 다른 변경 없이 이 측정기준 내에서 가능한 값의 수를 늘리면 각 버킷에 해당하는 전환 이벤트 수는 변경하지 않고 총 버킷 수는 늘기 때문입니다.
'시뮬레이션'을 클릭합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다. 이제 노이즈 비율이 이전 시뮬레이션보다 높습니다.

핵심 설계 원칙에 따라 작은 요약 값은 큰 요약 값보다 더 많은 노이즈가 발생할 수 있습니다. 따라서 선택한 구성에 따라 각 버킷에 포함되는 기여 전환 이벤트 수 (집계 키라고도 함)가 달라지고, 이 수량은 최종 출력 요약 보고서의 노이즈에 영향을 줍니다.

단일 버킷 내에서 기여 전환 이벤트 수에 영향을 미치는 설계 결정 중 하나는 측정기준 세분화입니다. 집계 키와 측정기준에 관한 다음 예를 참고하세요.

접근 방식 1: 대략적인 측정기준이 포함된 하나의 키 구조: 국가 x 광고 캠페인 (또는 가장 큰 캠페인 집계 버킷) x 제품 유형 (가능한 제품 유형 10개 중)
접근 방식 2: 세분화된 측정기준이 포함된 하나의 키 구조: 도시 x 광고 소재 ID x 제품 (가능한 제품 100개 중)

도시는 국가보다 세부적인 측정기준입니다. 광고 소재 ID는 캠페인보다 더 세분화되고 제품은 제품 유형보다 더 세분화됩니다. 따라서 접근 방식 2는 요약 보고서 출력에서 접근 방식 1보다 버킷당 (= 키당) 이벤트 (전환) 수가 적습니다. 출력에 추가된 노이즈가 버킷의 이벤트 수에 구애받지 않는다는 점을 감안할 때, 접근 방식 2에서는 요약 보고서의 측정 데이터에 노이즈가 더 많이 발생합니다. 결과에서 최대한의 유용성을 얻기 위해 각 광고주별로 키 설계에서 다양한 세부사항 절충점을 실험합니다.

결정: 키 구조

노이즈 실험실에서 사용해 보기

단순 모드에서는 기본 키 구조가 사용됩니다. 고급 모드에서는 다양한 키 구조를 실험할 수 있습니다. 측정기준의 일부가 포함되어 있으며 이를 수정할 수도 있습니다.

고급 모드로 이동합니다.
매개변수 측면 패널에서 키 전략을 찾습니다. 도구에서 A라는 기본 전략은 모든 측정기준을 포함하는 하나의 세분화된 키 구조인 지역 x 캠페인 ID x 제품 카테고리를 사용합니다.
'시뮬레이션'을 클릭합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다.
키 전략을 B로 변경합니다. 그러면 키 구조를 구성할 수 있는 추가 컨트롤이 표시됩니다.
키 구조를 다음과 같이 구성합니다.
1. 키 구조 수: 2
2. 키 구조 1 = 지역 x 제품 카테고리.
3. 키 구조 2 = 캠페인 ID x 제품 카테고리.
'시뮬레이션'을 클릭합니다.
서로 다른 두 개의 키 구조를 사용하고 있다면 측정 목표 유형당 두 개의 요약 보고서(구매 건수용 2개, 구매 가치에 대한 보고서 2개)가 제공됩니다. 노이즈 비율을 관찰합니다.
자체 맞춤 측정기준으로 시도해 볼 수도 있습니다. 그러려면 추적할 데이터, 측정기준을 찾으세요. 예시 측정기준을 삭제하고 마지막 측정기준 아래의 추가/삭제/재설정 버튼을 사용해 측정기준을 직접 만들어 보세요.

단일 버킷 내에서 기여 전환 이벤트 수에 영향을 미치는 또 다른 설계 결정은 사용하기로 결정한 키 구조입니다. 집계 키의 다음 예를 살펴보세요.

모든 측정기준이 포함된 하나의 키 구조로 이를 키 전략 A라고 부르겠습니다.
각각 측정기준의 하위 집합이 있는 2개의 키 구조, 이를 키 전략 B라고 하겠습니다.

전략 A가 더 간단하지만 특정 통계에 액세스하려면 요약 보고서에 포함된 노이즈 요약 값을 롤업 (합계)해야 할 수 있습니다. 이러한 값을 합산하면 노이즈도 합산됩니다. 전략 B를 사용하면 요약 보고서에 노출된 요약 값이 필요한 정보를 이미 제공하고 있을 수 있습니다. 즉, 전략 B가 전략 A보다 신호 대 노이즈 비율이 더 높을 수 있습니다. 그러나 전략 A에서는 노이즈가 이미 수용 가능할 수 있으므로 편의상 전략 A를 사용할 수도 있습니다. 이 두 가지 전략을 요약한 상세한 예시에서 자세히 알아보세요.

키 관리는 심도 있는 주제입니다. 신호 대 잡음비를 개선하기 위해 수많은 정교한 기법을 고려할 수 있습니다. 하나는 고급 키 관리에 설명되어 있습니다.

결정: 일괄 처리 빈도

노이즈 실험실에서 사용해 보기

단순 모드 (또는 고급 모드)로 이동합니다. 두 모드는 일괄 처리 주파수에서 동일한 방식으로 작동합니다.
매개변수 측면 패널에서 집계 전략 > 일괄 처리 빈도를 찾습니다. 집계 서비스로 단일 작업에서 처리되는 집계 가능한 보고서의 일괄 처리 빈도를 나타냅니다.
기본 일괄 처리 빈도를 준수합니다. 기본적으로 일일 일괄 처리 빈도는 시뮬레이션됩니다.
'시뮬레이션'을 클릭합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다.
일괄 처리 빈도를 주별으로 변경합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다. 이제 노이즈 비율이 이전 시뮬레이션보다 더 낮습니다 (더 좋음).

단일 버킷 내에서 기여 전환 이벤트 수에 영향을 미치는 또 다른 설계 결정은 사용하기로 결정한 일괄 처리 빈도입니다. 일괄 처리 빈도는 집계 가능한 보고서를 처리하는 빈도입니다.

더 자주 집계되도록 예약된 보고서 (예: 매시간)는 집계 일정이 짧은 (예: 매주) 동일한 보고서보다 적은 전환 이벤트를 포함합니다. 결과적으로 시간별 보고서에는 더 많은 노이즈가 포함됩니다.``` 집계 일정이 적은 동일한 보고서 (예: 매주)보다 더 적은 전환 이벤트가 포함됩니다. 따라서 시간별 보고서의 신호 대 노이즈 비율은 주간 보고서보다 낮습니다. 다른 모든 항목은 동일합니다. 다양한 주파수에서 보고 요구사항을 실험하고 각 주파수의 신호 대 잡음비를 평가합니다.

일괄 처리 및 장기간에 걸쳐 집계에서 자세히 알아보세요.

결정: 기여 전환에 영향을 미치는 캠페인 변수

노이즈 실험실에서 사용해 보기

이는 예측하기 어려울 수 있고 시즌성 효과 외에도 상당한 변동이 있을 수 있지만, 일일 단일 터치 기여 전환수의 가장 가까운 10: 10, 100, 1,000 또는 10,000을 추정해 보세요.

고급 모드로 이동합니다.
매개변수 측면 패널에서 전환 데이터를 찾습니다.
기본 매개변수를 확인합니다. 기본적으로 일일 총 기여 전환수는 1, 000회입니다. 기본 설정 (기본 측정기준, 측정기준별로 가능한 다른 값의 기본 개수, 키 전략 A)을 사용하는 경우 버킷당 평균은 약 40입니다. 입력된 '버킷당 평균 일일 기여 전환수'의 값이 40인지 확인합니다.
'시뮬레이션'을 클릭하여 기본 매개변수로 시뮬레이션을 실행합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다.
이제 총 일일 기여 전환수를 100으로 설정합니다. 이렇게 하면 버킷당 평균 일일 기여 전환수의 값이 낮아집니다.
'시뮬레이션'을 클릭합니다.
이제 노이즈 비율이 높아진 것을 볼 수 있습니다. 이는 버킷당 전환수가 적을 때 개인 정보 보호를 위해 더 많은 노이즈가 적용되기 때문입니다.

중요한 차이점은 광고주에게 가능한 총 전환수와 가능한 기여된 총 전환수입니다. 후자는 궁극적으로 요약 보고서의 노이즈에 영향을 미칩니다. 기여 전환은 광고 예산, 광고 타겟팅과 같은 캠페인 변수가 발생하기 쉬운 총 전환수의 하위 집합입니다. 예를 들어 $1, 000만 광고 캠페인이 $10, 000 광고 캠페인에 비해 기여 전환수가 더 많을 것으로 예상할 수 있습니다.

고려 사항:

Attribution Reporting API로 수집되는 요약 보고서의 범위 내에 있으므로 단일 터치의 동일한 기기 기여 분석 모델을 기준으로 기여 전환을 평가합니다.
기여 전환에 대해 최악의 시나리오 수와 최적의 시나리오 수를 모두 고려하세요. 예를 들어 다른 모든 조건이 동일하다면 광고주에 사용할 수 있는 최소 및 최대 캠페인 예산을 고려한 다음 두 결과에 대한 기여 가능한 전환수를 시뮬레이션에 대한 입력값으로 예상합니다.
Android 개인 정보 보호 샌드박스 사용을 고려한다면 계산 시 크로스 플랫폼 기여 전환을 고려하세요.

결정: 확장 사용

노이즈 실험실에서 사용해 보기

고급 모드로 이동합니다.
매개변수 측면 패널에서 집계 전략 > 확장을 찾습니다. 기본적으로 '예'로 설정되어 있습니다.
조정이 노이즈 비율에 미치는 긍정적인 영향을 이해하려면 먼저 배율을 No로 설정합니다.
'시뮬레이션'을 클릭합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다.
크기 조절을 Yes로 설정합니다. 노이즈 실험실은 시나리오의 측정 목표 범위 (평균 및 최댓값)를 고려하여 사용할 배율을 자동으로 계산합니다. 실제 시스템 또는 오리진 트라이얼 설정에서 배율의 자체 계산을 구현하는 것이 좋습니다.
'시뮬레이션'을 클릭합니다.
이 두 번째 시뮬레이션에서 이제 노이즈 비율이 더 낮아 (더 좋음) 관찰합니다. 확장을 사용하고 있기 때문입니다.

핵심 디자인 원칙에 따라 추가된 노이즈는 기여 예산의 함수입니다.

따라서 신호 대 잡음 비율을 늘리려면 기여 예산에 따라 값을 확장하고 집계 후에는 배율을 제거하여 전환 이벤트 중에 수집된 값을 변환하도록 결정할 수 있습니다. 조정을 사용하여 신호 대 노이즈 비율을 높입니다.

결정: 측정 목표 수 및 개인 정보 보호 예산 분할

이는 확장과 관련이 있습니다. 확장 사용을 참조하세요.

노이즈 실험실에서 사용해 보기

측정 목표는 전환 이벤트에서 수집되는 고유한 데이터 포인트입니다.

고급 모드로 이동합니다.
매개변수 측면 패널에서 추적하려는 데이터(측정 목표)를 찾습니다. 기본적으로 구매 가치와 구매 횟수라는 두 가지 측정 목표가 있습니다.
'시뮬레이션'을 클릭하여 기본 목표로 시뮬레이션을 실행합니다.
삭제를 클릭합니다. 마지막 측정 목표 (이 경우 구매 건수)가 삭제됩니다.
'시뮬레이션'을 클릭합니다.
이 두 번째 시뮬레이션에서는 이제 구매 가치의 노이즈 비율이 더 낮아(더 좋음) 확인합니다. 이는 측정 목표가 낮기 때문에 하나의 측정 목표에 모든 기여도 예산이 적용됩니다.
재설정을 클릭합니다. 이제 다시 구매 가치와 구매 횟수라는 두 가지 측정 목표가 있습니다. 노이즈 실험실은 시나리오의 측정 목표 범위 (평균 및 최댓값)를 고려하여 사용할 배율을 자동으로 계산합니다. 기본적으로 Noise Lab은 예산을 측정 목표 전체에 균등하게 분할합니다.
'시뮬레이션'을 클릭합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다. 시뮬레이션에 표시된 배율을 기록합니다.
이제 개인 정보 보호 예산 분할을 맞춤설정하여 신호 대 노이즈 비율을 개선해 보겠습니다.
각 측정 목표에 할당된 예산 비율(%)을 조정하세요. 기본 매개변수를 고려할 때 측정 목표 1, 즉 구매 가치는 측정 목표 2보다 훨씬 넓은 범위 (0~1, 000), 즉 구매 횟수 (1과 1, 즉 항상 1과 같음)를 가집니다. 따라서 '확장할 공간이 더 많이' 필요합니다. 더 효율적으로 확장할 수 있도록 (확장 참조) 측정 목표 2보다 측정 목표 1에 더 많은 기여 예산을 할당하는 것이 이상적입니다.
예산의 70% 를 측정 목표 1에 할당합니다. 측정 목표 2에 30% 를 할당합니다.
'시뮬레이션'을 클릭합니다.
결과 시뮬레이션의 노이즈 비율을 관찰합니다. 구매 가치의 경우 이제 노이즈 비율이 이전 시뮬레이션에 비해 현저하게 낮아졌습니다 (더 좋음). 구매 건수는 거의 변경되지 않았습니다.
측정항목별로 예산 분할을 계속 조정하세요. 이것이 노이즈에 미치는 영향을 관찰합니다.

추가/삭제/재설정 버튼을 사용하여 맞춤 측정 목표를 설정할 수 있습니다.

전환수와 같은 전환 이벤트에 대해 하나의 데이터 포인트 (측정 목표)를 측정하는 경우 해당 데이터 포인트는 모든 기여 예산 (65536)을 얻을 수 있습니다. 하나의 전환 이벤트에 대해 여러 측정 목표(예: 전환수, 구매 가치)를 설정하는 경우 이러한 데이터 포인트는 기여 예산을 공유해야 합니다. 즉, 값을 확장할 여유가 줄어듭니다.

따라서 측정 목표가 많을수록 신호 대 노이즈 비율이 낮아질 수 있습니다 (노이즈가 높아짐).

측정 목표와 관련하여 내려야 할 또 다른 결정은 예산 분할입니다. 기여 예산을 두 데이터 포인트에 균등하게 분할하면 각 데이터 포인트의 예산은 65536/2 = 32768이 됩니다. 이는 각 데이터 포인트의 가능한 최댓값에 따라 최적일 수도 있고 그렇지 않을 수도 있습니다. 예를 들어 최대 값이 1인 구매 수와 최소 1, 최대 120인 구매 가치를 측정하는 경우 '더 많은 공간'을 확장하면 구매 가치에 도움이 될 수 있습니다. 즉, 참여 예산의 더 많은 비율이 주어질 수 있습니다. 노이즈의 영향과 관련하여 일부 측정 목표를 다른 목표보다 우선시해야 하는지 확인할 수 있습니다.

결정: 이상점 관리

노이즈 실험실에서 사용해 보기

측정 목표는 전환 이벤트에서 수집되는 고유한 데이터 포인트입니다.

고급 모드로 이동합니다.
매개변수 측면 패널에서 집계 전략 > 확장을 찾습니다.
'확장'이 '예'로 설정되어 있는지 확인합니다. 노이즈 실험실은 측정 목표에 부여한 범위 (평균 및 최댓값)를 기반으로 사용할 배율을 자동으로 계산합니다.
지금까지 최대 구매액이 $2, 000였지만 대부분의 구매는 $10~$120 범위라고 가정해 보겠습니다. 먼저 리터럴 확장 방식을 사용하면 어떻게 되는지 살펴보겠습니다 (권장하지 않음). purchaseValue의 최댓값으로 $2, 000를 입력합니다.
'시뮬레이션'을 클릭합니다.
노이즈 비율이 높은지 확인합니다. 이는 현재 배율이 $2, 000를 기준으로 계산되기 때문입니다. 하지만 실제로는 대부분의 구매 가치가 이 금액보다 현저하게 낮습니다.
이제 보다 실용적인 확장 접근 방식을 사용해 보겠습니다. 최대 구매 금액을 $120로 변경합니다.
'시뮬레이션'을 클릭합니다.
이 두 번째 시뮬레이션에서는 노이즈 비율이 더 낮은 것을 볼 수 있습니다.

배율을 구현하려면 일반적으로 특정 전환 이벤트에 대해 가능한 최대값을 기준으로 배율을 계산합니다(이 예에서 자세히 알아보기).

그러나 리터럴 최댓값을 사용하여 배율을 계산하지 마세요. 신호 대 잡음비가 악화될 수 있습니다. 대신 이상점을 제거하고 실용적 최댓값을 사용하세요.

이상점 관리는 심층적인 주제입니다. 신호 대 잡음비를 개선하기 위해 수많은 정교한 기법을 고려할 수 있습니다. 하나는 고급 이상점 관리에 설명되어 있습니다.

다음 단계

사용 사례에 대한 다양한 노이즈 관리 전략을 평가했으므로 이제 오리진 트라이얼을 통해 실제 측정 데이터를 수집하여 요약 보고서를 실험할 준비가 되었습니다. API 사용해 보기 가이드 및 도움말을 검토하세요.

부록

노이즈 실험실 빠르게 둘러보기

노이즈 실험실을 사용하면 노이즈 관리 전략을 빠르게 평가하고 비교할 수 있습니다. 다음과 같은 용도로 사용할 수 있습니다.

노이즈에 영향을 줄 수 있는 주요 매개변수와 그 효과를 이해합니다.
다양한 설계 결정을 바탕으로 출력 측정 데이터에 미치는 노이즈의 영향을 시뮬레이션합니다. 사용 사례에 적합한 신호 대 잡음비에 도달할 때까지 설계 매개변수를 조정합니다.
요약 보고서의 유용성에 대한 의견을 공유해 주세요. epsilon 및 노이즈 매개변수의 어떤 값이 효과가 있고 그렇지 않은가요? 변곡점은 어디에 있나요?

이를 준비 단계로 생각하세요. Noise Lab은 측정 데이터를 생성하여 입력한 내용을 기반으로 요약 보고서 출력을 시뮬레이션합니다. 유지되거나 데이터를 공유하지 않습니다.

노이즈 실험실에는 두 가지 모드가 있습니다.

단순 모드: 노이즈에 적용되는 컨트롤의 기본 사항을 이해합니다.
고급 모드: 다양한 노이즈 관리 전략을 테스트하고 사용 사례에 가장 적합한 신호 대 잡음비가 무엇인지 평가합니다.

상단 메뉴의 버튼을 클릭하여 두 모드 간에 전환합니다 (아래 스크린샷에서#1).

단순 모드

단순 모드에서는 Epsilon과 같은 매개변수 (왼쪽 또는 아래 스크린샷의#2)를 제어하고 노이즈에 미치는 영향을 확인할 수 있습니다.
각 매개변수에는 도움말('?' 버튼)이 있습니다. 각 매개변수에 관한 설명을 보려면 이를 클릭하세요 (아래 스크린샷에서#3).
시작하려면 '시뮬레이션' 버튼을 클릭하고 출력이 어떻게 표시되는지 관찰합니다 (아래 스크린샷의 #4).
출력 섹션에서는 다양한 세부정보를 볼 수 있습니다. 일부 요소 옆에는 `?` 가 표시됩니다. 시간을 내어 각 `?` 를 클릭하여 다양한 정보에 관한 설명을 확인하세요.
테이블의 확장 버전을 보려면 출력 섹션 내에서 세부정보 전환 버튼을 클릭합니다 (아래 스크린샷에서#5).
출력 섹션의 각 데이터 표 아래에는 오프라인 사용을 위해 표를 다운로드할 수 있는 옵션이 있습니다. 또한 오른쪽 하단에는 모든 데이터 테이블을 다운로드할 수 있는 옵션이 있습니다 (#6. 아래 스크린샷에서).
매개변수 섹션에서 매개변수에 대한 여러 설정을 테스트하고 '시뮬레이션'을 클릭하여 출력에 미치는 영향을 확인합니다.

단순 모드의 노이즈 실험실 인터페이스

상급자 모드

고급 모드에서는 매개변수를 더 세부적으로 관리할 수 있습니다. 맞춤 측정 목표와 측정기준을 추가할 수 있습니다 (아래 스크린샷의 1번 및 2번).
매개변수 섹션에서 더 아래로 스크롤하여 키 전략 옵션을 확인합니다. 이는 다양한 키 구조를 테스트하는 데 사용할 수 있습니다(아래 스크린샷의#3).
- 다양한 키 구조를 테스트하려면 키 전략을 'B'로 전환하세요.
- 사용할 키 구조의 수를 입력합니다(기본값은 '2'로 설정됨).
- Generate Key Structures(키 구조 생성)를 클릭합니다.
- 각 키 구조에 포함하려는 키 옆의 체크박스를 클릭하면 키 구조를 지정할 수 있는 옵션이 표시됩니다.
- '시뮬레이션'을 클릭하여 출력을 확인합니다.
  
  고급 모드용 노이즈 실험실 인터페이스
  
  고급 모드를 위한 Noise Lab 인터페이스입니다.

노이즈 측정항목

핵심 개념

개별 사용자 개인 정보를 보호하기 위해 노이즈가 추가됩니다.

노이즈 값이 높으면 버킷/키가 희소하고 제한된 수의 민감한 이벤트의 기여가 포함되어 있음을 나타냅니다. 이 작업은 Noise Lab에서 자동으로 수행되므로 개인이 '군중 속에 숨어' 있도록 하거나 더 많은 양의 노이즈를 추가하여 제한된 개인의 개인 정보를 보호할 수 있습니다.

노이즈 값이 낮다는 것은 이미 개인이 '군중 속에 숨길' 수 있는 방식으로 데이터 설정이 설계되었음을 나타냅니다. 즉, 개별 사용자 개인 정보 보호를 보장하기 위해 버킷에 충분한 수의 이벤트의 기여가 포함됩니다.

이 문장은 평균 백분율 오차 (APE)와 RMSRE_T (임곗값이 있는 제곱 평균 상대 오차) 모두에 해당됩니다.

APE (평균 오류 비율)

APE는 신호에 대한 노이즈의 비율, 즉 실제 요약 값입니다.p> APE 값이 낮을수록 신호 대 잡음비가 더 높아집니다.

수식

특정 요약 보고서에서 APE는 다음과 같이 계산됩니다.

APE를 표현하는 방정식입니다. 노이즈가 음수일 수 있으므로 절댓값이 필요합니다.

True는 실제 요약 값입니다. APE는 각 실제 요약 값에 대한 노이즈의 평균으로, 요약 보고서의 모든 항목에서 평균을 냅니다. 노이즈 실험실에서는 여기에 100을 곱해 백분율을 얻습니다.

장단점

버킷의 크기가 작을수록 APE의 최종 값에 불균형적인 영향을 줍니다. 이는 노이즈를 평가할 때 오해의 소지가 있을 수 있습니다. 이러한 이유로 APE의 이러한 제한을 완화하기 위해 고안된 또 다른 측정항목인 RMSRE_T를 추가했습니다. 자세한 내용은 예를 참고하세요.

코드

APE 계산의 소스 코드를 검토합니다.

RMSRE_T (임곗값이 있는 제곱 평균 상대 오차)

RMSRE_T (임곗값이 있는 제곱 평균 상대 오차)는 노이즈의 또 다른 측정치입니다.

RMSRE_T 해석 방법

RMSRE_T 값이 낮을수록 신호 대 잡음비가 더 좋습니다.
예를 들어 사용 사례에 허용되는 노이즈 비율이 20%이고 RMSRE_T가 0.2이면 노이즈 수준이 허용 범위에 속하게 됩니다.

수식

주어진 요약 보고서에서 RMSRE_T는 다음과 같이 계산됩니다.

RMSRE_T 방정식. 노이즈가 음수일 수 있으므로 절댓값이 필요합니다.

장단점

RMSRE_T는 APE보다 이해하기가 조금 더 복잡합니다. 하지만 요약 보고서에서 노이즈를 분석하는 데 APE보다 적합한 경우도 있다는 장점이 있습니다.

RMSRE_T가 더 안정적입니다. 'T'는 임곗값입니다. 'T'는 RMSRE_T 계산에서 전환수가 적고 크기가 작기 때문에 노이즈에 더 민감하는 가중치를 줄이는 데 사용됩니다. T를 사용하면 전환수가 적은 버킷에서 측정항목이 급증하지 않습니다. T가 5와 같으면 전환수가 0인 버킷에서 1만큼 작은 노이즈 값은 1보다 크게 표시되지 않습니다. 대신 T가 5와 같으므로 0.2로 제한되며 이는 1/5와 같습니다. 노이즈에 더 민감하여 작은 버킷에 가중치를 덜 주기 때문에 이 측정항목은 더 안정적이며 두 시뮬레이션을 더 쉽게 비교할 수 있습니다.
RMSRE_T를 사용하면 쉽게 집계할 수 있습니다. 여러 버킷의 RMSRE_T와 실제 개수를 알면 총합의 RMSRE_T를 계산할 수 있습니다. 이렇게 하면 이러한 결합된 값에 대해 RMSRE_T를 최적화할 수도 있습니다.

APE에서는 집계가 가능하지만 라플라스 노이즈 합계의 절댓값을 포함하기 때문에 이 공식은 매우 복잡합니다. 이렇게 하면 APE를 최적화하기가 더 어려워집니다.

코드

RMSRE_T 계산에 대한 소스 코드를 검토합니다.

예

버킷 3개가 포함된 요약 보고서:

버킷_1 = 노이즈: 10, trueSummaryValue: 100
버킷_2 = 노이즈: 20, trueSummaryValue: 100
버킷_3 = 노이즈: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

버킷 3개가 포함된 요약 보고서:

버킷_1 = 노이즈: 10, trueSummaryValue: 100
버킷_2 = 노이즈: 20, trueSummaryValue: 100
버킷_3 = 노이즈: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

버킷 3개가 포함된 요약 보고서:

버킷_1 = 노이즈: 10, trueSummaryValue: 100
버킷_2 = 노이즈: 20, trueSummaryValue: 100
버킷_3 = 노이즈: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + 무한대) / 3 = 무한대

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

고급 키 관리

DSP 또는 광고 측정 회사에는 여러 업종, 통화, 구매 가격을 아우르는 수천 명의 글로벌 광고 고객이 있을 수 있습니다. 즉, 광고주당 하나의 집계 키를 만들고 관리하는 것은 실용적이지 않을 수 있습니다. 또한 수천 명의 글로벌 광고주에 대한 노이즈의 영향을 제한할 수 있는 집계 가능한 최대 값 및 집계 예산을 선택하는 것은 쉽지 않습니다. 대신 다음 시나리오를 고려해 보겠습니다.

주요 전략 A

광고 기술 제공업체는 모든 광고 고객에 대해 하나의 키를 만들고 관리하기로 결정합니다. 모든 광고주와 통화를 통틀어 구매 범위는 소량, 고가의 구매부터 대량, 저가형 구매까지 다양합니다. 그 결과 다음과 같은 키가 생성됩니다.

	키 (여러 통화)
최대 집계 가능한 값	5,000,000
구매 금액 범위	[120~5000000]

주요 전략 B

광고 기술 제공업체는 모든 광고 고객에 관해 두 개의 키를 만들고 관리하기로 결정합니다. 통화별로 키를 구분하기로 결정합니다. 모든 광고주와 통화를 통틀어 구매 범위는 소량의 고가의 구매부터 대량, 저가의 구매까지 다양합니다. 통화별로 분리하면 두 개의 키가 생성됩니다.

	키 1 (USD)	키 2 (¥)
최대 집계 가능한 값	$40,000	5,000,000엔
구매 금액 범위	[120~40,000명]	[15,000~5,000,000명]

통화 값이 통화 간에 균일하게 분산되지 않으므로 키 전략 B는 키 전략 A보다 결과에서 노이즈가 적습니다. 예를 들어 USD로 표시된 구매 금액과 ¥ 단위로 표시된 구매가 기본 데이터를 변경하고 그 결과로 노이즈가 많은 출력을 생성하는 방법을 생각해 보세요.

주요 전략 C

광고 기술 제공업체는 모든 광고 고객에 대해 4개의 키를 생성 및 관리하고 통화 x 광고주 업종별로 키를 구분하기로 합니다.

	키 1 (USD x 고급 보석 광고주)	키 2 (¥ x 고급 보석 광고주)	키 3 (USD x 의류 소매업체 광고주)	키 4 (¥ x 의류 소매업체 광고주)
최대 집계 가능한 값	$40,000	5,000,000엔	$500	65,000엔
구매 금액 범위	[10,000~40,000명]	[1,250,000~5,000,000]	[120~500]	[15,000~65,000]

광고주 구매 가치가 광고주 간에 균일하게 분산되지 않으므로 키 전략 C는 키 전략 B보다 결과에 노이즈가 적습니다. 예를 들어 고급 보석 구매와 야구 모자 구매 시 야구 모자를 섞으면 기본 데이터가 어떻게 바뀌고 노이즈가 더해진 출력을 생성하는지 생각해 보세요.

출력의 노이즈를 줄이기 위해 여러 광고주의 공통성을 위해 공유된 최대 집계 값과 공유 배율을 만드는 것이 좋습니다. 예를 들어 광고주를 위해 아래의 다양한 전략을 실험해 볼 수 있습니다.

통화로 구분된 단일 전략 (USD, ¥, CAD 등)
광고주 업종 (보험, 자동차, 소매업 등)별로 구분된 하나의 전략
유사한 구매 가치 범위 ([100], [1000], [10000] 등)로 구분된 하나의 전략

광고주 공통성을 중심으로 핵심 전략을 만들면 키와 이에 상응하는 코드를 더 쉽게 관리할 수 있으며 신호 대 잡음 비율이 높아집니다. 여러 광고주 공통성으로 다양한 전략을 실험하여 코드 관리 대비 노이즈 영향을 극대화하는 데 있어 변곡점을 파악합니다.

고급 이상점 관리

두 광고주의 경우를 살펴보겠습니다.

광고주 A:
- 광고주 A 사이트의 모든 제품에서 구매 가격 가능성은 [120~1,000달러]이며 880달러 범위입니다.
- 구매 가격은 880달러 범위에 균일하게 분배되며, 구매 가격 중앙값에서 두 표준 편차를 벗어나는 이상점은 없습니다.
광고주 B:
- 광고주 B의 사이트에 있는 모든 제품에서 구매 가격 가능성은 [120~1,000달러]이며 880달러 범위입니다.
- 구매 가격이 $120~$500 범위에 크게 치우쳐 있습니다. $500~$1,000 범위에서 구매의 5% 만이 발생합니다.

참여 예산 요구사항과 최종 결과에 [노이즈가 적용되는 방법](/privacy-sandbox/relevance/attribution-reporting/understanding-noise/#how-noise-is-applied)을 고려할 때 광고주 B는 기본적으로 광고주 A보다 노이즈가 더 큽니다. 이는 광고주 B가 기본 계산에 영향을 미칠 가능성이 더 높기 때문입니다.

특정 키 설정으로 이 문제를 완화할 수 있습니다. 이상점 데이터를 관리하고 키의 구매 범위 전체에 구매 가치를 보다 균등하게 분배하는 데 도움이 되는 주요 전략을 테스트합니다.

광고주 B의 경우 두 개의 서로 다른 구매 가치 범위를 캡처하기 위해 두 개의 별도의 키를 만들 수 있습니다. 이 예에서 광고 기술은 이상점이 $500 구매 가치 위에 나타난다는 것을 확인했습니다. 이 광고주에 대해 별도의 키 두 개를 구현해 보세요.

키 구조 1 : $120~$500 사이의 구매만 캡처하는 키입니다 (총 구매량의 약 95% 에 해당).
키 구조 2: 500달러 이상의 구매만 포착하는 키(총 구매액의 최대 5% 에 해당)

이 핵심 전략을 구현하면 광고주 B의 노이즈를 더 효과적으로 관리하고 요약 보고서에서 광고주 B의 유용성을 극대화할 수 있습니다. 더 작은 새 범위를 감안할 때 이제 키 A와 키 B는 이전 단일 키의 각 키에서 더 균일하게 데이터를 분산합니다. 이렇게 하면 이전 단일 키의 각 키 출력에 미치는 노이즈 영향이 줄어듭니다.