Tìm hiểu về nhiễu trong báo cáo tóm tắt

Tìm hiểu về ý nghĩa của nhiễu, vị trí thêm nhiễu và mức độ ảnh hưởng đến hoạt động đo lường.

Báo cáo tóm tắt là kết quả tổng hợp của các báo cáo tổng hợp. Khi báo cáo tổng hợp được một công cụ thu thập phân phối theo lô và được dịch vụ tổng hợp xử lý, độ nhiễu (một lượng dữ liệu ngẫu nhiên) sẽ được thêm vào báo cáo tóm tắt thu được. Tiếng ồn được thêm vào để bảo vệ quyền riêng tư của người dùng. Mục tiêu của cơ chế này là tạo ra một khung có thể hỗ trợ việc đo lường riêng tư theo cách khác biệt.

Độ nhiễu được thêm vào báo cáo tóm tắt cuối cùng.

Giới thiệu về độ nhiễu trong báo cáo tóm tắt

Mặc dù hiện nay việc thêm âm thanh không phải là một phần của hoạt động đo lường quảng cáo, nhưng trong nhiều trường hợp, độ nhiễu được thêm vào sẽ không làm thay đổi đáng kể cách bạn diễn giải kết quả.

Có thể bạn nên xem xét vấn đề này theo cách sau: Bạn có tự tin để đưa ra quyết định dựa trên một phần dữ liệu nhất định nếu dữ liệu đó không gây nhiễu không?

Ví dụ: liệu một nhà quảng cáo có tự tin thay đổi chiến lược hoặc ngân sách chiến dịch của họ không, dựa trên thực tế là Chiến dịch A có 15 lượt chuyển đổi và Chiến dịch B có 16 lượt chuyển đổi?

Nếu câu trả lời là không thì nhiễu là không liên quan.

Việc bạn cần làm là định cấu hình việc sử dụng API sao cho:

  1. Câu trả lời cho câu hỏi trên là có.
  2. Tiếng ồn được quản lý theo cách không ảnh hưởng đáng kể đến khả năng đưa ra quyết định dựa trên một số dữ liệu nhất định. Bạn có thể áp dụng phương pháp này như sau: để đạt số lượt chuyển đổi tối thiểu dự kiến, bạn cần duy trì độ nhiễu của chỉ số đã thu thập dưới một tỷ lệ phần trăm nhất định.

Trong phần này và phần tiếp theo, chúng tôi sẽ trình bày các chiến lược để đạt được mục tiêu 2.

Khái niệm chính

Dịch vụ tổng hợp sẽ tăng độ nhiễu một lần cho mỗi giá trị tóm tắt (tức là một lần cho mỗi khoá) mỗi khi có yêu cầu báo cáo tóm tắt.

Các giá trị nhiễu này được lấy ngẫu nhiên từ một phân phối xác suất cụ thể, như thảo luận dưới đây.

Tất cả các yếu tố ảnh hưởng đến độ nhiễu đều dựa trên 2 khái niệm chính.

  1. Mức phân bổ độ nhiễu (thông tin chi tiết bên dưới) là như nhau bất kể giá trị tóm tắt là thấp hay cao. Do đó, giá trị tóm tắt càng cao thì độ nhiễu càng ít có khả năng ảnh hưởng so với giá trị này.

    Ví dụ: giả sử cả tổng giá trị giao dịch mua tổng hợp là 20.000 USD và tổng giá trị giao dịch mua tổng hợp là 200 USD đều phải tuân theo độ nhiễu được chọn từ cùng một gói phân phối.

    Giả sử độ nhiễu từ sự phân phối này thay đổi trong khoảng từ -100 đến +100.

    • Đối với giá trị mua hàng tóm tắt là 20.000 USD, độ nhiễu dao động trong khoảng từ 0 đến 100/20.000=0,5%.
    • Đối với giá trị giao dịch mua tóm tắt là 200 USD, độ nhiễu thay đổi trong khoảng từ 0 đến 100/200=50%.

    Do đó, độ nhiễu có thể có tác động thấp hơn đối với giá trị giao dịch mua tổng cộng 20.000 USD so với giá trị 200 USD. Nói một cách tương đối, 20.000 đô la có khả năng ít nhiễu hơn, nghĩa là nó có khả năng có tỷ lệ tín hiệu trên độ nhiễu cao hơn.

    Giá trị tổng hợp cao hơn có tác động độ nhiễu tương đối thấp hơn.

    Điều này có một vài ý nghĩa quan trọng trên thực tế được trình bày trong phần tiếp theo. Cơ chế này là một phần của thiết kế API và tác động thực tế sẽ lâu dài. Chúng sẽ tiếp tục đóng vai trò quan trọng khi các công nghệ quảng cáo thiết kế và đánh giá nhiều chiến lược tổng hợp.

  2. Mặc dù độ nhiễu được vẽ từ cùng một mức phân phối bất kể giá trị tóm tắt là gì, nhưng sự phân phối đó phụ thuộc vào một vài tham số. Một trong những tham số này, epsilon, có thể bị các công nghệ quảng cáo thay đổi trong bản dùng thử theo nguyên gốc đã kết thúc để đánh giá các mức điều chỉnh khác nhau về tiện ích/quyền riêng tư. Tuy nhiên, hãy coi khả năng điều chỉnh epsilon là tạm thời. Chúng tôi hoan nghênh ý kiến phản hồi của bạn về các trường hợp sử dụng và những giá trị của epsilon hoạt động hiệu quả.

Mặc dù không có quyền kiểm soát trực tiếp cách thêm độ nhiễu, nhưng một công ty công nghệ quảng cáo có thể tác động đến tác động của độ nhiễu đối với dữ liệu đo lường của mình. Trong phần tiếp theo, chúng ta sẽ tìm hiểu sâu về cách ảnh hưởng đến nhiễu trong thực tế.

Trước khi chúng ta thực hiện, hãy xem xét kỹ hơn cách áp dụng nhiễu.

Phóng to: cách áp dụng nhiễu

Một mức phân bổ tiếng ồn

Tiếng ồn được vẽ từ phân phối Laplace, với các thông số sau:

  • Giá trị trung bình (μ) bằng 0. Điều này có nghĩa là giá trị độ nhiễu có nhiều khả năng nhất là 0 (không thêm nhiễu) và giá trị nhiễu có khả năng nhỏ hơn giá trị ban đầu vì lớn hơn (giá trị này đôi khi được gọi là không thiên vị).
  • Thông số tỷ lệb = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET được xác định trong trình duyệt.
    • epsilon được khắc phục trong máy chủ tổng hợp.

Biểu đồ sau đây cho thấy hàm mật độ xác suất cho phân phối Laplace với μ=0, b = 20:

Hàm mật độ xác suất cho phân phối Laplace với μ=0, b = 20

Giá trị nhiễu ngẫu nhiên, phân phối độ nhiễu một lần

Giả sử một công nghệ quảng cáo yêu cầu báo cáo tóm tắt cho hai khoá tổng hợp là key1 và key2.

Dịch vụ tổng hợp chọn hai giá trị độ nhiễu là x1 và x2 theo cùng một mức phân phối độ nhiễu. X1 được thêm vào giá trị tóm tắt của khoá1 và x2 được thêm vào giá trị tóm tắt của khoá2.

Trong biểu đồ, chúng ta sẽ biểu diễn các giá trị độ nhiễu như nhau. Đây là cách đơn giản hoá; trong thực tế, các giá trị độ nhiễu sẽ khác nhau vì chúng được lấy ngẫu nhiên từ cấu hình phân phối.

Điều này minh hoạ rằng tất cả các giá trị nhiễu đều đến từ cùng một phân phối và độc lập với giá trị tóm tắt mà các giá trị đó áp dụng.

Các tính chất khác của nhiễu

Độ nhiễu được áp dụng cho mọi giá trị tóm tắt, kể cả các giá trị trống (0).

Ngay cả khi giá trị tóm tắt trống vẫn bị nhiễu.

Ví dụ: ngay cả khi giá trị tóm tắt thực sự của một khoá nhất định là 0, thì giá trị tóm tắt nhiễu mà bạn sẽ thấy trong báo cáo tóm tắt cho khoá này (rất có thể) sẽ không bằng 0.

Tiếng ồn có thể là số dương hoặc số âm.

Ví dụ về nhiễu tích cực và tiêu cực.

Ví dụ, đối với số tiền mua trước độ nhiễu là 327.000, độ nhiễu có thể là +6.000 hoặc -6.000 (đây là các giá trị ví dụ tuỳ ý).

Đang đánh giá độ nhiễu

Tính độ lệch chuẩn của độ nhiễu

Độ lệch chuẩn của nhiễu là:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Ví dụ:

Với epsilon = 10, độ lệch chuẩn của tiếng ồn là:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Đánh giá xem liệu sự khác biệt về kết quả đo lường có ý nghĩa hay không

Vì đã biết độ lệch chuẩn của độ nhiễu được thêm vào từng giá trị đầu ra bằng dịch vụ tổng hợp, nên bạn có thể xác định các ngưỡng thích hợp để so sánh nhằm xác định xem sự khác biệt ghi nhận được có phải là do độ nhiễu hay không.

Ví dụ: nếu độ nhiễu được thêm vào một giá trị xấp xỉ +/- 10 (có tính tỷ lệ) và mức chênh lệch giá trị giữa hai chiến dịch trên 100, thì có thể kết luận rằng sự khác biệt về giá trị được đo lường giữa mỗi chiến dịch không phải là chỉ do độ nhiễu.

Thu hút và chia sẻ ý kiến phản hồi

Bạn có thể tham gia và thử nghiệm với API này.

Các bước tiếp theo