Memahami derau dalam laporan ringkasan

Pelajari apa arti derau, di mana derau ditambahkan, dan bagaimana pengaruhnya terhadap upaya pengukuran Anda.

Laporan ringkasan adalah hasil dari agregasi laporan agregat. Jika laporan gabungan dikelompokkan oleh kolektor dan diproses oleh layanan agregasi, derau—sejumlah data acak—akan ditambahkan ke laporan ringkasan yang dihasilkan. Derau ditambahkan untuk melindungi privasi pengguna. Tujuan mekanisme ini adalah memiliki framework yang dapat mendukung pengukuran pribadi diferensial.

Derau ditambahkan dalam laporan ringkasan akhir.

Pengantar derau dalam laporan ringkasan

Meskipun jika penambahan derau biasanya tidak menjadi bagian dari pengukuran iklan saat ini, dalam banyak kasus, derau yang ditambahkan tidak akan secara substansial mengubah cara Anda menafsirkan hasil.

Mungkin membantu untuk memikirkannya dengan cara berikut: Apakah Anda akan percaya diri mengambil keputusan berdasarkan bagian data tertentu jika data itu tidak berisik?

Misalnya, apakah pengiklan merasa yakin untuk mengubah strategi atau anggaran kampanyenya, berdasarkan fakta bahwa Kampanye A memiliki 15 konversi dan Kampanye B memiliki 16 konversi?

Jika jawabannya adalah tidak, derau tidak relevan.

Yang perlu Anda lakukan adalah mengonfigurasi penggunaan API sedemikian rupa sehingga:

  1. Jawaban untuk pertanyaan di atas adalah ya.
  2. Derau dikelola dengan cara yang tidak secara signifikan memengaruhi kemampuan Anda untuk membuat keputusan berdasarkan data tertentu. Anda dapat melakukan pendekatan ini sebagai berikut: untuk jumlah minimum konversi yang diharapkan, Anda dapat mempertahankan derau dalam metrik yang dikumpulkan di bawah % tertentu.

Di bagian ini dan berikutnya, kita akan menguraikan strategi untuk mencapai 2.

Konsep inti

Layanan agregasi menambahkan derau satu kali ke setiap nilai ringkasan—yaitu, sekali per kunci—setiap kali laporan ringkasan diminta.

Nilai derau ini diambil secara acak dari distribusi probabilitas spesifik, yang dibahas di bawah ini.

Semua elemen yang memengaruhi derau bergantung pada dua konsep utama.

  1. Distribusi derau (detail di bawah) sama terlepas dari nilai ringkasan, rendah atau tinggi. Oleh karena itu, semakin tinggi nilai ringkasan, semakin kecil dampak yang mungkin ditimbulkan oleh derau, relatif terhadap nilai ini.

    Misalnya, asumsikan jika total nilai pembelian sebesar $20.000 dan total nilai pembelian gabungan sebesar $200 tunduk pada derau yang dipilih dari distribusi yang sama.

    Mari asumsikan noise dari distribusi ini bervariasi kira-kira antara -100 dan +100.

    • Untuk nilai pembelian ringkasan sebesar $20.000, derau bervariasi antara 0 dan 100/20.000=0,5%.
    • Untuk nilai pembelian ringkasan sebesar $200, derau bervariasi antara 0 dan 100/200=50%.

    Oleh karena itu, derau cenderung memiliki dampak yang lebih rendah pada nilai pembelian agregat $20.000 daripada nilai $200. Secara relatif, $20.000 cenderung lebih sedikit berisik, artinya kemungkinan memiliki rasio sinyal-ke-kebisingan yang lebih tinggi.

    Nilai gabungan yang lebih tinggi memiliki dampak derau yang relatif lebih rendah.

    Hal ini memiliki beberapa implikasi praktis penting yang diuraikan di bagian berikutnya. Mekanisme ini adalah bagian dari desain API, dan implikasi praktisnya adalah jangka panjang. Mereka akan terus memainkan peran penting saat teknologi iklan mendesain dan mengevaluasi berbagai strategi agregasi.

  2. Meskipun derau diambil dari distribusi yang sama terlepas dari nilai ringkasan, distribusi tersebut bergantung pada beberapa parameter. Salah satu parameter ini, epsilon, dapat diubah oleh teknologi iklan selama uji coba origin yang selesai untuk mengevaluasi berbagai penyesuaian utilitas/privasi. Namun, pertimbangkan kemampuan untuk menyesuaikan epsilon sebagai sementara. Kami menantikan masukan Anda tentang kasus penggunaan Anda dan nilai epsilon yang berfungsi dengan baik.

Meskipun perusahaan teknologi iklan tidak memiliki kontrol langsung atas cara derau ditambahkan, perusahaan tersebut dapat memengaruhi dampak derau pada data pengukurannya. Di bagian berikutnya, kita akan mempelajari bagaimana derau dapat dipengaruhi dalam praktik.

Sebelum melakukannya, mari kita pelajari lebih lanjut cara derau diterapkan.

Memperbesar: cara derau diterapkan

Distribusi satu derau

Derau diambil dari Distribusi Laplace, dengan parameter berikut:

  • Rata-rata (μ) dari 0. Ini berarti bahwa nilai derau yang paling mungkin adalah 0 (tidak ada derau yang ditambahkan), dan nilai derau cenderung lebih kecil daripada nilai asli karena lebih besar (ini kadang-kadang disebut unbias).
  • Parameter skala dari b = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET ditentukan di browser.
    • epsilon telah diperbaiki di server agregasi.

Diagram berikut menunjukkan fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20:

Fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20

Nilai derau acak, satu distribusi derau

Anggaplah teknologi iklan meminta laporan ringkasan untuk dua kunci agregasi, key1 dan key2.

Layanan agregasi memilih dua nilai derau x1 dan x2, mengikuti distribusi derau yang sama. x1 ditambahkan ke nilai ringkasan untuk key1, dan x2 ditambahkan ke nilai ringkasan untuk kunci2.

Dalam diagram, kita akan menyatakan nilai derau sebagai sesuatu yang identik. Ini adalah penyederhanaan; pada kenyataannya, nilai derau akan bervariasi, karena diambil secara acak dari distribusi.

Ini menggambarkan bahwa semua nilai derau berasal dari distribusi yang sama, dan independen dari nilai ringkasan yang diterapkan padanya.

Properti derau lainnya

Derau diterapkan ke setiap nilai ringkasan—termasuk yang kosong (0).

Bahkan nilai ringkasan kosong dapat terganggu.

Misalnya, meskipun nilai ringkasan sebenarnya untuk kunci tertentu adalah 0, nilai ringkasan derau yang akan Anda lihat dalam laporan ringkasan untuk kunci ini (kemungkinan besar) akan bukan 0.

Derau dapat berupa angka positif atau negatif.

Contoh derau positif dan negatif.

Misalnya, untuk jumlah pembelian pre-noise sebesar 327.000, noise mungkin +6.000 atau -6.000 (ini adalah nilai contoh arbitrer).

Mengevaluasi derau

Menghitung simpangan baku dari derau

Standar deviasi derau adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Contoh

Dengan epsilon = 10, standar deviasi kebisingan adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Mengevaluasi kapan perbedaan pengukuran signifikan

Karena Anda akan mengetahui simpangan baku dari derau yang ditambahkan ke setiap nilai output oleh layanan agregasi, Anda dapat menentukan nilai minimum yang sesuai sebagai perbandingan untuk menentukan apakah perbedaan yang diamati mungkin disebabkan oleh derau.

Misalnya, jika derau yang ditambahkan ke nilai sekitar +/- 10 (yang memperhitungkan penskalaan) dan perbedaan nilai antara dua kampanye lebih dari 100, dapat disimpulkan bahwa perbedaan nilai yang diukur di antara setiap kampanye bukan karena derau saja.

Berinteraksi dan berbagi masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya