Menangani derau

Pelajari cara menggunakan, memperhitungkan, dan mengurangi dampak derau dalam laporan gabungan Anda.

Sebelum memulai

Sebelum melanjutkan, untuk mendapatkan pemahaman mendalam tentang apa itu derau dan dampaknya, lihat Memahami derau dalam laporan ringkasan.

Kontrol Anda terhadap derau

Meskipun Anda tidak dapat langsung mengontrol derau yang ditambahkan ke laporan agregat, ada langkah-langkah yang dapat Anda ambil untuk meminimalkan efeknya. Bagian berikut menjelaskan strategi-strategi tersebut.

Tingkatkan skala sesuai anggaran kontribusi

Seperti yang dijelaskan dalam Memahami derau, derau yang diterapkan pada nilai ringkasan untuk setiap kunci didasarkan pada skala 0-65.536 (0-CONTRIBUTION_BUDGET).

Distribusi derau berdasarkan anggaran.

Oleh karena itu, untuk memaksimalkan sinyal yang relatif terhadap noise, Anda harus meningkatkan skala setiap nilai sebelum menetapkannya sebagai nilai agregat—yaitu, mengalikan setiap nilai dengan faktor tertentu, faktor penskalaan, sambil memastikannya tetap dalam anggaran kontribusi.

Kebisingan relatif dengan dan tanpa penskalaan.

Menghitung faktor penskalaan

Faktor penskalaan mewakili seberapa besar Anda ingin menskalakan nilai agregat tertentu. Nilainya harus berupa anggaran kontribusi dibagi dengan nilai agregat maksimum untuk kunci tertentu.

Menentukan faktor penskalaan berdasarkan anggaran kontribusi.

Misalnya, asumsikan pengiklan ingin mengetahui total nilai pembelian. Anda tahu bahwa perkiraan nilai pembelian maksimum dari setiap pembelian individual adalah $2.000, kecuali untuk beberapa pencilan yang Anda putuskan untuk diabaikan:

  • Hitung faktor penskalaan:
    • Untuk memaksimalkan rasio sinyal terhadap derau, Anda perlu menskalakan nilai ini menjadi 65.536 (anggaran kontribusi).
    • Cara ini menghasilkan faktor penskalaan 65.536 / 2.000, yaitu sekitar 32x. Dalam praktiknya, Anda dapat membulatkan faktor ini ke atas atau ke bawah.
  • Tingkatkan skala nilai Anda sebelum agregasi. Untuk setiap $1 pembelian, tambahkan metrik yang dilacak sebesar 32. Misalnya, untuk pembelian sebesar $120, tetapkan nilai gabungan sebesar 120*32 = 3.840.
  • Turunkan skala nilai Anda setelah agregasi. Setelah Anda menerima laporan ringkasan yang berisi nilai pembelian yang dijumlahkan dari beberapa pengguna, perkecil nilai ringkasan menggunakan faktor penskalaan yang Anda gunakan sebelum agregasi. Dalam contoh ini, kita telah menggunakan faktor penskalaan 32 pra-agregasi, jadi kita perlu membagi nilai ringkasan yang diterima dalam laporan ringkasan dengan 32. Oleh karena itu, jika nilai pembelian ringkasan untuk kunci yang diberikan dalam laporan ringkasan adalah 76.800, nilai pembelian ringkasan (dengan derau) adalah 76.800/32 = $2.400.

Bagi anggaran Anda

Jika Anda memiliki beberapa sasaran pengukuran—misalnya, jumlah pembelian dan nilai pembelian—Anda sebaiknya membagi anggaran untuk sasaran tersebut.

Dalam hal ini, faktor penskalaan Anda akan berbeda untuk nilai agregat yang berbeda, bergantung pada perkiraan maksimum dari nilai gabungan tertentu.

Baca detailnya di Memahami kunci agregasi.

Misalnya, asumsikan Anda melacak jumlah pembelian dan nilai pembelian, dan Anda memutuskan untuk mengalokasikan anggaran secara merata.

65.536 / 2 = 32.768 dapat dialokasikan per jenis pengukuran dan per sumber.

  • Jumlah pembelian:
    • Anda hanya melacak satu pembelian, sehingga jumlah maksimum pembelian untuk konversi tertentu adalah 1.
    • Oleh karena itu, Anda memutuskan untuk menetapkan faktor penskalaan untuk jumlah pembelian menjadi 32.768 / 1 = 32.768.
  • Nilai pembelian:
    • Anggaplah nilai pembelian maksimum yang diharapkan dari setiap pembelian adalah $2.000.
    • Oleh karena itu, Anda memutuskan untuk menetapkan faktor penskalaan untuk nilai pembelian menjadi 32.768 / 2.000 = 16,384 atau sekitar 16.

Tombol agregasi yang lebih kasar meningkatkan rasio sinyal terhadap kebisingan

Karena kunci kasar menangkap lebih banyak peristiwa konversi daripada kunci terperinci, kunci kasar umumnya menghasilkan nilai ringkasan yang lebih tinggi.

Nilai ringkasan yang lebih tinggi tidak terlalu terpengaruh oleh derau daripada nilai yang lebih rendah; derau pada nilai ini cenderung lebih rendah, relatif terhadap nilai ini.

Nilai yang dikumpulkan dengan kunci yang lebih kasar cenderung relatif tidak berisik daripada nilai yang dikumpulkan dengan kunci yang lebih terperinci.

Contoh

Jika semua hal lainnya sama, kunci yang melacak nilai pembelian secara global (dijumlahkan di semua negara) akan menghasilkan nilai pembelian ringkasan yang lebih tinggi (dan jumlah konversi ringkasan yang lebih tinggi) daripada kunci yang melacak konversi di tingkat suatu negara.

Oleh karena itu, derau relatif pada total nilai pembelian untuk negara tertentu akan lebih tinggi daripada derau relatif pada total nilai pembelian untuk semua negara.

Demikian pula, semua item lainnya tetap sama, total nilai pembelian sepatu lebih rendah dari nilai total pembelian semua item (termasuk sepatu).

Oleh karena itu, derau relatif pada total nilai pembelian untuk sepatu akan lebih tinggi daripada derau relatif pada total nilai pembelian untuk semua item.

Dampak derau dengan tombol terperinci vs. kasar.

Meringkas nilai ringkasan (rollup) juga menjumlahkan deraunya

Dengan menjumlahkan nilai ringkasan dari laporan ringkasan untuk mengakses data pada tingkat yang lebih tinggi, Anda juga menjumlahkan derau dari nilai ringkasan ini.

Tingkat derau dengan kunci terperinci dengan penggabungan dibandingkan dengan kunci kasar tanpa penggabungan

Mari kita lihat dua pendekatan yang berbeda: - Pendekatan A: Anda menyertakan ID Geografi di kunci Anda. Laporan ringkasan menampilkan kunci tingkat ID geografis, yang masing-masing dikaitkan dengan nilai pembelian ringkasan pada tingkat ID Geografis tertentu. - Pendekatan B: Anda tidak menyertakan ID geografi di kunci Anda. Laporan ringkasan secara langsung menampilkan nilai pembelian ringkasan untuk semua ID / lokasi geografi.

Untuk mengakses nilai pembelian tingkat negara: - Dengan pendekatan A, Anda menjumlahkan nilai ringkasan tingkat ID geografis dan juga menjumlahkan nilai tersebut. Hal ini kemungkinan akan menyebabkan lebih banyak derau yang ditambahkan ke nilai pembelian tingkat geografis akhir. - Dengan pendekatan B, Anda langsung melihat data yang ditampilkan dalam laporan ringkasan. Derau hanya ditambahkan sekali ke data tersebut.

Oleh karena itu, nilai pembelian ringkasan untuk ID geografis tertentu cenderung lebih berisik dengan pendekatan A.

Demikian pula, menyertakan dimensi tingkat kode pos di kunci Anda kemungkinan akan memberikan hasil yang lebih berisik daripada menggunakan kunci yang lebih kasar dengan dimensi tingkat wilayah.

Melakukan agregasi dalam jangka waktu yang lebih lama akan meningkatkan rasio sinyal terhadap kebisingan

Meminta laporan ringkasan lebih jarang berarti bahwa setiap nilai ringkasan kemungkinan akan lebih tinggi dibandingkan jika Anda lebih sering meminta laporan; lebih banyak konversi cenderung terjadi dalam rentang waktu yang lebih lama.

Seperti yang disebutkan sebelumnya, semakin tinggi nilai ringkasan, semakin rendah kemungkinan derau relatif. Oleh karena itu, lebih jarang meminta laporan ringkasan akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi (lebih baik).

Meminta laporan ringkasan lebih jarang akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi

Berikut adalah contoh untuk menggambarkan:

  • Jika Anda meminta laporan ringkasan per jam selama 24 jam, lalu menjumlahkan nilai ringkasan dari setiap laporan per jam untuk mengakses data tingkat hari, derau akan ditambahkan 24 kali.
  • Dalam satu laporan ringkasan harian, derau hanya ditambahkan sekali.

Epsilon lebih tinggi, derau lebih rendah

Makin tinggi nilai epsilon, makin rendah noise dan makin rendah perlindungan privasi.

Memanfaatkan pemfilteran dan penghapusan duplikat

Bagian penting dari mengalokasikan anggaran di antara kunci yang berbeda adalah memahami berapa kali peristiwa tertentu dapat terjadi. Misalnya, pengiklan mungkin hanya tertarik dengan satu pembelian untuk setiap klik, tetapi mungkin tertarik dengan hingga 3 konversi "tampilan halaman produk". Untuk mendukung kasus penggunaan tersebut, Anda juga dapat memanfaatkan fitur API berikut yang memungkinkan Anda mengontrol jumlah laporan yang dibuat dan konversi mana yang dihitung:

Bereksperimen dengan epsilon

Teknologi iklan dapat menetapkan epsilon ke nilai yang lebih besar dari 0 dan hingga dan termasuk 64. Rentang ini memungkinkan pengujian yang fleksibel. Nilai epsilon yang lebih rendah memberikan perlindungan privasi yang lebih baik. Kami sarankan Anda memulai dengan epsilon=10.

Rekomendasi untuk bereksperimen

Kami merekomendasikan hal berikut: - Mulai dengan epsilon = 10. - Jika ini menyebabkan masalah utilitas penting, tingkatkan epsilon secara bertahap. - Bagikan masukan Anda tentang titik belok tertentu yang mungkin Anda temukan terkait dengan kegunaan data.

Berinteraksi dan berbagi masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya