Quy trình kiểm tra quyền riêng tư trong Trung tâm dữ liệu quảng cáo

Quyền riêng tư của người dùng cuối là trọng tâm trong mọi hoạt động của Ads Data Hub; đây là nền tảng mà chúng tôi xây dựng nên. Để giúp duy trì quyền riêng tư đó và giúp khách hàng tuân thủ quy định, chúng tôi áp dụng một số quy trình kiểm tra và hạn chế nhất định, được thiết kế để giúp ngăn chặn việc truyền dữ liệu về người dùng cá nhân1 trong dữ liệu mà bạn nhận được từ nền tảng.

Sau đây là thông tin tổng quan về các tính năng bảo vệ quyền riêng tư của Ads Data Hub, với thông tin chi tiết hơn trong các phần tiếp theo:

  • Kiểm tra tĩnh sẽ xem xét các câu lệnh trong truy vấn của bạn để tìm ra những vấn đề rõ ràng và tức thời về quyền riêng tư.
  • Ngân sách truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định.
  • Các bước kiểm tra tổng hợp đảm bảo rằng mỗi hàng chứa đủ số lượng người dùng để bảo vệ quyền riêng tư của người dùng cuối.
  • Kiểm tra chênh lệch (hoặc "kiểm tra chênh lệch") so sánh các tập hợp kết quả để giúp bạn ngăn chặn việc thu thập thông tin về từng người dùng bằng cách so sánh dữ liệu của nhiều tập hợp người dùng.
  • Chèn tiếng ồn là một phương án thay thế cho việc kiểm tra sự khác biệt. Việc thêm nhiễu ngẫu nhiên vào một mệnh đề tổng hợp SELECT của một truy vấn sẽ bảo vệ quyền riêng tư của người dùng trong khi vẫn cung cấp kết quả tương đối chính xác, loại bỏ nhu cầu kiểm tra sự khác biệt và giảm ngưỡng tổng hợp bắt buộc cho đầu ra.

Khi một kết quả không vượt qua được các tiêu chí kiểm tra để đảm bảo quyền riêng tư, Ads Data Hub sẽ hiển thị hoặc trả về một thông báo về quyền riêng tư cho bạn biết rằng một hàng đã bị lọc. Đây có thể là bất cứ thứ gì, từ một hàng duy nhất đến toàn bộ tập kết quả. Để đảm bảo tổng số trong báo cáo của bạn vẫn chính xác, hãy sử dụng bản tóm tắt hàng được lọc để tính dữ liệu từ các hàng bị loại bỏ2.

Kiểm tra tĩnh

Các quy trình kiểm tra tĩnh sẽ xem xét các câu lệnh trong truy vấn của bạn để tìm những vấn đề rõ ràng và tức thời về quyền riêng tư, chẳng hạn như xuất giá trị nhận dạng người dùng, mọi hàm của giá trị nhận dạng người dùng hoặc sử dụng các hàm không được phép trên những trường chứa dữ liệu ở cấp người dùng. Để tránh lỗi truy vấn do các quy trình kiểm tra tĩnh, hãy xem các phương pháp hay nhất và tìm hiểu những hàm được phép.

Hạn mức truy cập dữ liệu

Hạn mức truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định. Người dùng sắp hết ngân sách sẽ nhận được thông báo về quyền riêng tư có loại DATA_ACCESS_BUDGET_IS_NEARLY_EXHAUSTED. Bạn có thể theo dõi hạn mức bằng điểm truy cập hạn mức truy cập dữ liệu hoặc bằng cách theo dõi thông báo về hạn mức trong giao diện người dùng.

Yêu cầu về việc tổng hợp

Ngưỡng tổng hợp người dùng là yếu tố cốt lõi trong các quy trình kiểm tra quyền riêng tư của Ads Data Hub. Đối với hầu hết các truy vấn, bạn chỉ có thể nhận dữ liệu báo cáo về từ 50 người dùng trở lên. Tuy nhiên, bạn có thể dùng những truy vấn chỉ truy cập vào lượt nhấp và lượt chuyển đổi để báo cáo về 10 người dùng trở lên.

Phương pháp hay nhất: Định cấu hình bản tóm tắt hàng được lọc để báo cáo về dữ liệu đã bị bỏ qua. Điều này giúp duy trì một đường cơ sở nhất quán trong các báo cáo của bạn.

Trong ví dụ sau, hàng chứa chiến dịch 125 sẽ bị lọc khỏi kết quả cuối cùng, vì hàng này tổng hợp kết quả của 48 người dùng, thấp hơn mức tối thiểu là 50 người dùng.

Mã chiến dịch Người dùng Số lượt hiển thị
123 314 928
124 2718 5772
125 48 353

Chế độ riêng tư

Ads Data Hub cung cấp hai chế độ đảm bảo quyền riêng tư: kiểm tra sự khác biệtchèn nhiễu. Các phần sau đây mô tả và so sánh những chế độ này.

Sử dụng công cụ kiểm tra sự khác biệt

Các bước kiểm tra sự khác biệt giúp đảm bảo rằng người dùng không thể bị nhận dạng thông qua việc so sánh nhiều kết quả được tổng hợp đầy đủ theo những cách sau:

  • Chúng so sánh kết quả của công việc mà bạn đang chạy với kết quả trước đó.
  • Chúng so sánh các hàng trong cùng một tập hợp kết quả.

Các thay đổi đối với dữ liệu cơ bản giữa hai công việc có thể kích hoạt lỗi kiểm tra chênh lệch. Khi so sánh kết quả của một công việc với kết quả trước đó, Ads Data Hub sẽ tìm kiếm các điểm yếu ở cấp độ người dùng riêng lẻ. Do đó, ngay cả kết quả từ các chiến dịch khác nhau hoặc kết quả báo cáo cùng số lượng người dùng cũng có thể bị lọc nếu có số lượng lớn người dùng trùng lặp.

Mặt khác, hai tập hợp kết quả tổng hợp có thể có cùng số lượng người dùng (xuất hiện giống hệt nhau) nhưng không dùng chung người dùng riêng lẻ, do đó, chúng sẽ an toàn về quyền riêng tư. Trong trường hợp này, chúng sẽ không bị lọc.

Trung tâm dữ liệu quảng cáo sử dụng dữ liệu từ kết quả trong quá khứ của bạn khi xem xét lỗ hổng của một kết quả mới. Điều này có nghĩa là việc chạy cùng một truy vấn nhiều lần sẽ tạo ra nhiều dữ liệu hơn để các quy trình kiểm tra sự khác biệt sử dụng khi xem xét lỗ hổng của một kết quả mới. Ngoài ra, dữ liệu cơ bản có thể thay đổi, dẫn đến các truy vấn bị cho là ổn định vi phạm quy trình kiểm tra quyền riêng tư.

Khi kết quả ở cấp độ công việc khác biệt đáng kể, nhưng một hàng riêng lẻ tương tự như một hàng trong công việc trước đó, thì Ads Data Hub sẽ lọc hàng tương tự đó. Trong ví dụ này, hàng chứa chiến dịch 123 trong kết quả của công việc thứ hai sẽ được lọc, vì hàng này khác với kết quả trước đó ở một người dùng duy nhất.

Công việc 1
Mã chiến dịch Người dùng
123 400
124 569
Công việc 2
Mã chiến dịch Người dùng
123 401
224 1325

Nếu tổng số người dùng trong tất cả các hàng trong một tập kết quả tương tự như tổng số người dùng trong một công việc trước đó, thì Trung tâm dữ liệu quảng cáo sẽ lọc toàn bộ tập kết quả. Trong ví dụ này, tất cả kết quả từ công việc thứ hai sẽ được lọc.

Công việc 1
Mã chiến dịch Người dùng
123 400
124 1367
Công việc 2
Mã chiến dịch Người dùng
123 402
124 1367

Sử dụng tính năng thêm nhiễu

Chèn nhiễu là một kỹ thuật được dùng để bảo vệ quyền riêng tư của người dùng khi truy vấn cơ sở dữ liệu. Cơ chế này hoạt động bằng cách thêm nhiễu ngẫu nhiên vào một mệnh đề tổng hợp SELECT của một truy vấn. Độ nhiễu này bảo vệ quyền riêng tư của người dùng trong khi vẫn cung cấp kết quả tương đối chính xác, loại bỏ nhu cầu kiểm tra sự khác biệt và giảm ngưỡng tổng hợp bắt buộc cho đầu ra. Hầu hết các truy vấn hiện có đều có thể được thực thi ở chế độ nhiễu, nhưng vẫn có một số hạn chế. Để tìm hiểu thêm về chế độ nhiễu và cách tính năng chèn nhiễu ảnh hưởng đến các yêu cầu về quyền riêng tư, hãy xem phần Chèn nhiễu.

So sánh các bước kiểm tra chênh lệch với tính năng thêm nhiễu

Dữ liệu thực tế
Mã chiến dịch Số lượt hiển thị
101 35
102 63
201 142
202 21
301 56
302 99
Kết quả sử dụng quy trình kiểm tra sự khác biệt
Mã chiến dịch Số lượt hiển thị
101 35
102 63
201 142
202 21
301 56
302 99
Kết quả sử dụng tính năng chèn nhiễu
Mã chiến dịch Số lượt hiển thị
101 37,8373
102 60,9104
201 182,0955
202 26,2332
301 58,0871
302 97,5018
Ví dụ về Chiến dịch 101 ở chế độ nhiễu
Mã chiến dịch Số lượt hiển thị thực tế Đã thêm tiếng ồn Số lượt hiển thị được trả về (ANON_COUNT)
101 35 2,8373 37,8373

Nội dung tóm tắt về hàng đã lọc

Bản tóm tắt hàng đã lọc tổng hợp dữ liệu đã được lọc do các tiêu chí kiểm tra quyền riêng tư. Dữ liệu từ các hàng đã lọc sẽ được cộng lại và thêm vào một hàng chung. Mặc dù không thể phân tích thêm dữ liệu đã lọc, nhưng dữ liệu này cung cấp thông tin tóm tắt về lượng dữ liệu đã được lọc khỏi kết quả.

Lọc nội dung phản cảm để bảo vệ quyền riêng tư

Trong trường hợp cần chia nhỏ truy vấn nhưng muốn kết hợp các kết quả tổng hợp, bạn có thể áp dụng rõ ràng các quy trình kiểm tra quyền riêng tư cho một số truy vấn nhỏ hơn, sau đó tổng hợp các kết quả đó lại với nhau theo cách đảm bảo quyền riêng tư.

Ví dụ về các trường hợp sử dụng:

  • Bạn là một nhà quảng cáo đang tìm kiếm tất cả lượt chuyển đổi theo loại sự kiện phân bổ trong tài khoản Google Ads được liên kết, bao gồm cả dữ liệu ở Khu vực kinh tế Châu Âu (EEA).
  • Bạn là đối tác đo lường đang tìm kiếm tất cả lượt chuyển đổi theo loại sự kiện phân bổ trong tài khoản Google Ads được liên kết.

Để nhận được tổng số lượt chuyển đổi cho tài khoản Google Ads của mình, bạn có thể viết lại truy vấn bằng cách sử dụng một mệnh đề OPTIONS(privacy_checked_export=TRUE) để áp dụng các quy trình kiểm tra quyền riêng tư cho từng dịch vụ của Google.

Ví dụ về việc viết lại trong phần này thực hiện những việc sau:

  1. Thao tác này sẽ truy vấn từng dịch vụ của Google một cách riêng lẻ, áp dụng rõ ràng các quy trình kiểm tra quyền riêng tư cho từng tập hợp kết quả trung gian.
  2. Thao tác này sẽ tạo một bảng tạm thời riêng cho kết quả đã kiểm tra quyền riêng tư của từng dịch vụ của Google: YouTube, Gmail và Mạng.
  3. Thao tác này tổng hợp và tính tổng số lượt chuyển đổi đã được kiểm tra quyền riêng tư từ các bảng tạm thời.
CREATE TEMP TABLE youtube_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_youtube
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

CREATE TEMP TABLE network_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_network
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

CREATE TEMP TABLE gmail_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_gmail
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

SELECT
 campaign_id,
 attribution_event_type,
 SUM(num_convs) AS num_convs
FROM (
 SELECT * FROM youtube_agg
 UNION ALL
 SELECT * FROM network_agg
 UNION ALL
 SELECT * FROM gmail_agg
)
GROUP BY campaign_id, attribution_event_type

Xin lưu ý rằng truy vấn này không sử dụng JOIN để kết hợp trực tiếp dữ liệu giữa các bảng, mà thay vào đó, trước tiên, truy vấn sẽ thực hiện cho từng bảng, áp dụng các quy trình kiểm tra quyền riêng tư cho từng bảng trung gian, sau đó sử dụng UNION để tính tổng các giá trị đã kiểm tra quyền riêng tư.

Cố vấn truy vấn

Nếu SQL của bạn hợp lệ nhưng có thể kích hoạt quá trình lọc quá mức, thì trình tư vấn truy vấn sẽ đưa ra lời khuyên hữu ích trong quá trình phát triển truy vấn để giúp bạn tránh kết quả không mong muốn.

Các điều kiện kích hoạt bao gồm những mẫu sau:

Cách sử dụng trình tư vấn truy vấn:

  • Giao diện người dùng. Các đề xuất sẽ xuất hiện trong trình chỉnh sửa truy vấn, phía trên văn bản truy vấn.
  • API. Sử dụng phương thức customers.analysisQueries.validate.

  1. Ngoài dữ liệu mà họ đã đồng ý chia sẻ, chẳng hạn như trong trường hợp đối tượng nghiên cứu. 

  2. Trừ phi bị hạn chế về quyền riêng tư, chẳng hạn như khi người dùng trong bản tóm tắt hàng được lọc không đáp ứng các yêu cầu về việc tổng hợp.