การตรวจสอบความเป็นส่วนตัวใน Ads Data Hub

ความเป็นส่วนตัวของผู้ใช้ปลายทางคือหัวใจสำคัญของทุกสิ่งที่ Ads Data Hub ทำ ซึ่งเป็น รากฐานที่แพลตฟอร์มของเราสร้างขึ้น เพื่อช่วยรักษาความเป็นส่วนตัวดังกล่าวและช่วยให้ลูกค้าปฏิบัติตามกฎระเบียบ เราจึงกำหนดการตรวจสอบและข้อจำกัดบางอย่าง ซึ่งออกแบบมาเพื่อช่วยป้องกันการส่งข้อมูลเกี่ยวกับผู้ใช้แต่ละราย1 ในข้อมูลที่คุณได้รับจากแพลตฟอร์ม

ต่อไปนี้คือภาพรวมของฟีเจอร์ด้านความเป็นส่วนตัวของ Ads Data Hub พร้อมรายละเอียดเพิ่มเติม ในส่วนที่ตามมา

  • การตรวจสอบแบบคงที่จะตรวจสอบคำสั่งในการค้นหาเพื่อดูข้อกังวลด้านความเป็นส่วนตัวที่ชัดเจน และเร่งด่วน
  • งบประมาณการเข้าถึงข้อมูลจะจำกัดจำนวนครั้งทั้งหมดที่คุณเข้าถึง ข้อมูลที่กำหนดได้
  • การตรวจสอบการรวมช่วยให้มั่นใจว่าทุกแถวมีจำนวนผู้ใช้มากพอ ที่จะปกป้องความเป็นส่วนตัวของผู้ใช้ปลายทาง
  • การตรวจสอบความแตกต่าง (หรือ "การตรวจสอบความแตกต่าง") จะเปรียบเทียบชุดผลลัพธ์เพื่อช่วยป้องกันไม่ให้คุณรวบรวมข้อมูลเกี่ยวกับผู้ใช้แต่ละรายโดยการเปรียบเทียบข้อมูลจากชุดผู้ใช้หลายชุด
  • การแทรกเสียงรบกวนเป็นอีกทางเลือกหนึ่งแทนการตรวจสอบความแตกต่าง การเพิ่มสัญญาณรบกวนแบบสุ่มลงในSELECTอนุประโยคการรวมของคําค้นหาจะช่วยปกป้อง ความเป็นส่วนตัวของผู้ใช้ในขณะที่ให้ผลลัพธ์ที่แม่นยำอย่างสมเหตุสมผล ซึ่งจะช่วยลด ความจําเป็นในการตรวจสอบความแตกต่าง และลดเกณฑ์การรวมที่จําเป็น สําหรับเอาต์พุต

เมื่อผลลัพธ์ไม่ผ่านการตรวจสอบความเป็นส่วนตัว Ads Data Hub จะแสดงหรือ ส่งคืนข้อความด้านความเป็นส่วนตัวเพื่อแจ้งให้คุณทราบว่ามีการกรองแถว ซึ่งอาจเป็นอะไรก็ได้ตั้งแต่แถวเดียวไปจนถึงชุดผลลัพธ์ทั้งหมด เพื่อให้ยอดรวมการรายงานยังคงถูกต้อง ให้ใช้สรุปแถวที่กรองแล้วเพื่อนับข้อมูลจาก2แถวที่ถูกทิ้ง

การตรวจสอบเบื้องต้น

การตรวจสอบแบบคงที่จะตรวจสอบคำสั่งในคําค้นหาเพื่อหาข้อกังวลด้านความเป็นส่วนตัวที่ชัดเจนและในทันที เช่น การส่งออกตัวระบุผู้ใช้ ฟังก์ชันใดๆ ของตัวระบุผู้ใช้ หรือการใช้ฟังก์ชันที่ไม่ได้รับอนุญาตในฟิลด์ที่มีข้อมูลระดับผู้ใช้ หากต้องการหลีกเลี่ยงข้อผิดพลาดของคำค้นหาจากการตรวจสอบแบบคงที่ โปรดอ่านแนวทางปฏิบัติแนะนำและทำความเข้าใจฟังก์ชันที่อนุญาต

จำนวนครั้งที่จำกัดในการเข้าถึงข้อมูล

งบประมาณการเข้าถึงข้อมูลจะจำกัดจำนวนครั้งทั้งหมดที่คุณเข้าถึงข้อมูล ที่กำหนดได้ ผู้ใช้ที่ใกล้จะใช้งบประมาณจนหมดจะได้รับการแจ้งเตือน พร้อมข้อความด้านความเป็นส่วนตัวที่มี ประเภท DATA_ACCESS_BUDGET_IS_NEARLY_EXHAUSTED คุณสามารถตรวจสอบงบประมาณได้โดยใช้จุดแรกเข้างบประมาณการเข้าถึงข้อมูล หรือโดยสังเกตการแจ้งเตือนงบประมาณใน UI

ข้อกำหนดในการรวบรวม

หัวใจสำคัญของการตรวจสอบความเป็นส่วนตัวของ Ads Data Hub คือเกณฑ์การรวมผู้ใช้ สําหรับการค้นหาส่วนใหญ่ คุณจะรับข้อมูลการรายงานเกี่ยวกับผู้ใช้ 50 คนขึ้นไปได้เท่านั้น อย่างไรก็ตาม คุณสามารถใช้การค้นหาที่เข้าถึงเฉพาะการคลิกและ Conversion เพื่อ รายงานเกี่ยวกับผู้ใช้ 10 รายขึ้นไปได้

แนวทางปฏิบัติแนะนำ: กำหนดค่าสรุปแถวที่กรองแล้วเพื่อรายงานข้อมูลที่ ละเว้น ซึ่งจะช่วยรักษาเกณฑ์พื้นฐานที่สอดคล้องกันในรายงาน

ในตัวอย่างต่อไปนี้ ระบบจะกรองแถวที่มีแคมเปญ 125 ออกจากผลลัพธ์สุดท้าย เนื่องจากรวมผลลัพธ์จากผู้ใช้ 48 ราย ซึ่งต่ำกว่าจำนวนผู้ใช้ขั้นต่ำที่ 50 ราย

รหัสแคมเปญ ผู้ใช้ การแสดงผล
123 314 928
124 2718 5772
125 48 353

โหมดความเป็นส่วนตัว

Ads Data Hub มีโหมดความเป็นส่วนตัว 2 โหมด ได้แก่ การตรวจสอบความแตกต่างและการแทรกสัญญาณรบกวน ส่วนต่อไปนี้จะอธิบายและเปรียบเทียบโหมดเหล่านี้

ใช้การตรวจสอบความแตกต่าง

การตรวจสอบความแตกต่างช่วยให้มั่นใจได้ว่าระบบจะไม่ระบุตัวตนของผู้ใช้ผ่าน การเปรียบเทียบผลลัพธ์ที่รวบรวมมาอย่างเพียงพอหลายรายการด้วยวิธีต่อไปนี้

  • โดยจะเปรียบเทียบผลลัพธ์จากงานที่คุณกำลังเรียกใช้กับผลลัพธ์ก่อนหน้า
  • โดยจะเปรียบเทียบแถวภายในชุดผลลัพธ์เดียวกัน

การละเมิดการตรวจสอบความแตกต่างอาจเกิดจากการเปลี่ยนแปลงข้อมูลพื้นฐาน ระหว่างงาน 2 งาน เมื่อเปรียบเทียบผลลัพธ์ของงานกับผลลัพธ์ก่อนหน้า Ads Data Hub จะมองหาช่องโหว่ที่ระดับผู้ใช้แต่ละราย ด้วยเหตุนี้ แม้แต่ผลลัพธ์จากแคมเปญต่างๆ หรือผลลัพธ์ที่รายงานจำนวนผู้ใช้เท่ากันก็สามารถกรองได้หากมีผู้ใช้ที่ซ้ำกันจำนวนมาก

ในทางกลับกัน ชุดผลลัพธ์ที่รวบรวม 2 ชุดอาจมีจำนวนผู้ใช้เท่ากัน (ดูเหมือนจะเหมือนกัน) แต่ไม่ได้แชร์ผู้ใช้แต่ละราย จึงเป็นไปตามข้อกำหนดด้านความเป็นส่วนตัว ในกรณีนี้ ระบบจะไม่กรองชุดผลลัพธ์ดังกล่าว

Ads Data Hub ใช้ข้อมูลจากผลลัพธ์ที่ผ่านมาเมื่อพิจารณา ช่องโหว่ของผลลัพธ์ใหม่ ซึ่งหมายความว่าการเรียกใช้คําค้นหาเดียวกันซ้ำๆ จะสร้างข้อมูลเพิ่มเติมสําหรับการตรวจสอบความแตกต่างเพื่อใช้เมื่อพิจารณาช่องโหว่ของผลลัพธ์ใหม่ นอกจากนี้ ข้อมูลพื้นฐานอาจมีการเปลี่ยนแปลง ซึ่งทําให้เกิดการละเมิดการตรวจสอบความเป็นส่วนตัวในคําค้นหาที่คิดว่าเสถียร

เมื่อผลลัพธ์ระดับงานแตกต่างกันอย่างเพียงพอ แต่แถวแต่ละแถวคล้ายกับแถวในงานก่อนหน้า Ads Data Hub จะกรองแถวที่คล้ายกัน ใน ตัวอย่างนี้ ระบบจะกรองแถวที่มีแคมเปญ 123 ในผลลัพธ์ของงานที่ 2 เนื่องจากแตกต่างจากผลลัพธ์ก่อนหน้าเพียงผู้ใช้รายเดียว

งาน 1
รหัสแคมเปญ ผู้ใช้
123 400
124 569
งาน 2
รหัสแคมเปญ ผู้ใช้
123 401
224 1325

หากผลรวมของผู้ใช้ในทุกแถวในชุดผลลัพธ์คล้ายกับผลรวมจากงานก่อนหน้า Ads Data Hub จะกรองชุดผลลัพธ์ทั้งหมด ใน ตัวอย่างนี้ ระบบจะกรองผลลัพธ์ทั้งหมดจากงานที่ 2

งาน 1
รหัสแคมเปญ ผู้ใช้
123 400
124 1367
งาน 2
รหัสแคมเปญ ผู้ใช้
123 402
124 1367

ใช้ Noise Injection

การแทรกสัญญาณรบกวนเป็นเทคนิคที่ใช้เพื่อปกป้องความเป็นส่วนตัวของผู้ใช้เมื่อทำการค้นหาในฐานข้อมูล โดยจะทำงานด้วยการเพิ่มสัญญาณรบกวนแบบสุ่มลงในSELECT อนุประโยคการรวมของคำค้นหา การเพิ่มสัญญาณรบกวนนี้จะช่วยปกป้องความเป็นส่วนตัวของผู้ใช้ในขณะที่ให้ผลลัพธ์ที่แม่นยำพอสมควร จึงไม่จำเป็นต้องตรวจสอบความแตกต่างและลดเกณฑ์การรวมที่จำเป็น สำหรับเอาต์พุต คําค้นหาที่มีอยู่ส่วนใหญ่จะเรียกใช้ได้ในโหมดสัญญาณรบกวนโดยมีข้อจํากัดบางอย่าง ดูข้อมูลเพิ่มเติมเกี่ยวกับโหมดเสียงและวิธีที่การแทรกเสียงรบกวนส่งผลต่อข้อกำหนดด้านความเป็นส่วนตัวได้ที่การแทรกเสียงรบกวน

เปรียบเทียบการตรวจสอบความแตกต่างกับการแทรกสัญญาณรบกวน

ข้อมูลจริง
รหัสแคมเปญ จำนวนการแสดงผล
101 35
102 63
201 142
202 21
301 56
302 99
ผลลัพธ์โดยใช้การตรวจสอบความแตกต่าง
รหัสแคมเปญ จำนวนการแสดงผล
101 35
102 63
201 142
202 21
301 56
302 99
ผลลัพธ์ที่ใช้ Noise Injection
รหัสแคมเปญ จำนวนการแสดงผล
101 37.8373
102 60.9104
201 182.0955
202 26.2332
301 58.0871
302 97.5018
ตัวอย่างแคมเปญ 101 ในโหมด Noise Injection
รหัสแคมเปญ การแสดงผลจริง เพิ่มเสียงรบกวนแล้ว การแสดงผลที่ส่งคืน (ANON_COUNT)
101 35 2.8373 37.8373

ข้อมูลสรุปแถวที่กรอง

สรุปแถวที่กรองจะรวบรวมข้อมูลที่กรองเนื่องจากการตรวจสอบความเป็นส่วนตัว ระบบจะรวมข้อมูลจากแถวที่กรองแล้วและเพิ่มลงในแถวที่ครอบคลุมทั้งหมด แม้ว่าจะวิเคราะห์ข้อมูลที่กรองแล้วเพิ่มเติมไม่ได้ แต่ข้อมูลนี้จะแสดงสรุปของปริมาณข้อมูลที่กรองออกจากผลลัพธ์

การกรองเพื่อความเป็นส่วนตัวอย่างชัดเจน

ในกรณีที่คุณต้องแบ่งคำค้นหาออกเป็นส่วนๆ แต่ต้องการรวมผลลัพธ์ที่ รวบรวมไว้ คุณสามารถใช้การตรวจสอบความเป็นส่วนตัวกับคำค้นหาขนาดเล็กหลายรายการอย่างชัดเจน แล้วจึงรวบรวมผลลัพธ์เหล่านั้นเข้าด้วยกันอย่างปลอดภัยด้านความเป็นส่วนตัว

ตัวอย่างกรณีการใช้งาน

  • คุณเป็นผู้ลงโฆษณาที่กําลังมองหา Conversion ทั้งหมดตามประเภทเหตุการณ์การระบุแหล่งที่มา ในบัญชี Google Ads ที่ลิงก์ไว้ ซึ่งรวมถึงข้อมูล EEA
  • คุณเป็นพาร์ทเนอร์การวัดผลที่กําลังมองหา Conversion ทั้งหมดตามประเภทเหตุการณ์การระบุแหล่งที่มาในบัญชี Google Ads ที่ลิงก์ไว้

หากต้องการทราบผลรวมของ Conversion สำหรับบัญชี Google Ads คุณสามารถเขียนคำสั่งใหม่โดยใช้คําสั่ง OPTIONS(privacy_checked_export=TRUE) เพื่อใช้การตรวจสอบความเป็นส่วนตัว กับบริการของ Google แต่ละรายการแยกกัน

การเขียนใหม่ในตัวอย่างในส่วนนี้จะดำเนินการต่อไปนี้

  1. โดยจะค้นหาแต่ละบริการของ Google แยกกัน และใช้การตรวจสอบความเป็นส่วนตัวกับชุดผลลัพธ์ระดับกลางแต่ละชุดอย่างชัดเจน
  2. โดยจะสร้างตารางชั่วคราวแยกต่างหาก สำหรับผลลัพธ์ที่ผ่านการตรวจสอบความเป็นส่วนตัวของบริการแต่ละอย่างของ Google ได้แก่ YouTube, Gmail และ เครือข่าย
  3. โดยจะรวบรวมและรวมจํานวน Conversion ที่ผ่านการตรวจสอบความเป็นส่วนตัวจากตารางชั่วคราว
CREATE TEMP TABLE youtube_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_youtube
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

CREATE TEMP TABLE network_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_network
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

CREATE TEMP TABLE gmail_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_gmail
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

SELECT
 campaign_id,
 attribution_event_type,
 SUM(num_convs) AS num_convs
FROM (
 SELECT * FROM youtube_agg
 UNION ALL
 SELECT * FROM network_agg
 UNION ALL
 SELECT * FROM gmail_agg
)
GROUP BY campaign_id, attribution_event_type

โปรดทราบว่าคําค้นหานี้ไม่ได้ใช้ JOIN เพื่อรวมข้อมูลระหว่างตารางโดยตรง แต่จะทําการค้นหาแต่ละตารางก่อน จากนั้นจะใช้การตรวจสอบความเป็นส่วนตัว กับแต่ละตารางกลาง แล้วใช้ UNION เพื่อรวมค่าที่ตรวจสอบความเป็นส่วนตัวแล้ว

ที่ปรึกษาด้านคำค้นหา

หาก SQL ใช้ได้ แต่มีแนวโน้มที่จะทริกเกอร์การกรองมากเกินไป query advisor จะแสดงคำแนะนำที่นำไปใช้ได้จริงในระหว่างกระบวนการพัฒนาคำค้นหา เพื่อช่วยให้คุณหลีกเลี่ยงผลลัพธ์ที่ไม่พึงประสงค์

ทริกเกอร์มีรูปแบบต่อไปนี้

วิธีใช้คำแนะนำในการค้นหา

  • UI คำแนะนำจะปรากฏในตัวแก้ไขคำค้นหา เหนือข้อความคำค้นหา
  • API ใช้วิธี customers.analysisQueries.validate

  1. นอกเหนือจากข้อมูลที่ผู้ใช้ยินยอมให้แชร์ เช่น ในกรณีของผู้เข้าร่วมการวิจัย 

  2. เว้นแต่จะถูกป้องกันโดยข้อจำกัดด้านความเป็นส่วนตัว เช่น เมื่อผู้ใช้ในสรุปแถวที่กรองแล้วไม่เป็นไปตามข้อกำหนดการรวบรวม