Quyền riêng tư của người dùng cuối là trọng tâm trong mọi hoạt động của Ads Data Hub; đây là nền tảng mà chúng tôi xây dựng nên. Để giúp duy trì quyền riêng tư đó và giúp khách hàng tuân thủ quy định, chúng tôi áp dụng một số quy trình kiểm tra và hạn chế nhất định, được thiết kế để giúp ngăn chặn việc truyền dữ liệu về người dùng cá nhân1 trong dữ liệu mà bạn nhận được từ nền tảng.
Sau đây là thông tin tổng quan về các tính năng bảo vệ quyền riêng tư của Ads Data Hub, với thông tin chi tiết hơn trong các phần tiếp theo:
- Kiểm tra tĩnh sẽ xem xét các câu lệnh trong truy vấn của bạn để tìm ra những vấn đề rõ ràng và tức thời về quyền riêng tư.
- Ngân sách truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định.
- Các bước kiểm tra tổng hợp đảm bảo rằng mỗi hàng chứa đủ số lượng người dùng để bảo vệ quyền riêng tư của người dùng cuối.
- Kiểm tra chênh lệch (hoặc "kiểm tra chênh lệch") so sánh các tập hợp kết quả để giúp bạn ngăn chặn việc thu thập thông tin về từng người dùng bằng cách so sánh dữ liệu của nhiều tập hợp người dùng.
- Chèn tiếng ồn là một phương án thay thế cho việc kiểm tra sự khác biệt.
Việc thêm nhiễu ngẫu nhiên vào một mệnh đề tổng hợp
SELECTcủa một truy vấn sẽ bảo vệ quyền riêng tư của người dùng trong khi vẫn cung cấp kết quả tương đối chính xác, loại bỏ nhu cầu kiểm tra sự khác biệt và giảm ngưỡng tổng hợp bắt buộc cho đầu ra.
Khi một kết quả không vượt qua được các tiêu chí kiểm tra để đảm bảo quyền riêng tư, Ads Data Hub sẽ hiển thị hoặc trả về một thông báo về quyền riêng tư cho bạn biết rằng một hàng đã bị lọc. Đây có thể là bất cứ thứ gì, từ một hàng duy nhất đến toàn bộ tập kết quả. Để đảm bảo tổng số trong báo cáo của bạn vẫn chính xác, hãy sử dụng bản tóm tắt hàng được lọc để tính dữ liệu từ các hàng bị loại bỏ2.
Kiểm tra tĩnh
Các quy trình kiểm tra tĩnh sẽ xem xét các câu lệnh trong truy vấn của bạn để tìm những vấn đề rõ ràng và tức thời về quyền riêng tư, chẳng hạn như xuất giá trị nhận dạng người dùng, mọi hàm của giá trị nhận dạng người dùng hoặc sử dụng các hàm không được phép trên những trường chứa dữ liệu ở cấp người dùng. Để tránh lỗi truy vấn do các quy trình kiểm tra tĩnh, hãy xem các phương pháp hay nhất và tìm hiểu những hàm được phép.
Hạn mức truy cập dữ liệu
Hạn mức truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định. Người dùng sắp hết ngân sách sẽ nhận được thông báo về quyền riêng tư có loại DATA_ACCESS_BUDGET_IS_NEARLY_EXHAUSTED. Bạn có thể theo dõi hạn mức bằng điểm truy cập hạn mức truy cập dữ liệu hoặc bằng cách theo dõi thông báo về hạn mức trong giao diện người dùng.
Yêu cầu về việc tổng hợp
Ngưỡng tổng hợp người dùng là yếu tố cốt lõi trong các quy trình kiểm tra quyền riêng tư của Ads Data Hub. Đối với hầu hết các truy vấn, bạn chỉ có thể nhận dữ liệu báo cáo về từ 50 người dùng trở lên. Tuy nhiên, bạn có thể dùng những truy vấn chỉ truy cập vào lượt nhấp và lượt chuyển đổi để báo cáo về 10 người dùng trở lên.
- Những sự kiện có mã nhận dạng người dùng bằng 0 được tính là một người dùng duy nhất đối với ngưỡng tổng hợp, bất kể có bao nhiêu người dùng thực tế đã tạo sự kiện.
- Những người dùng có mã nhận dạng rỗng sẽ không được tính vào ngưỡng tổng hợp.
- Tìm hiểu cách chế độ khử tiếng ồn ảnh hưởng đến các yêu cầu về việc tổng hợp.
Phương pháp hay nhất: Định cấu hình bản tóm tắt hàng được lọc để báo cáo về dữ liệu đã bị bỏ qua. Điều này giúp duy trì một đường cơ sở nhất quán trong các báo cáo của bạn.
Trong ví dụ sau, hàng chứa chiến dịch 125 sẽ bị lọc khỏi kết quả cuối cùng, vì hàng này tổng hợp kết quả của 48 người dùng, thấp hơn mức tối thiểu là 50 người dùng.
| Mã chiến dịch | Người dùng | Số lượt hiển thị |
|---|---|---|
| 123 | 314 | 928 |
| 124 | 2718 | 5772 |
| 125 | 48 | 353 |
Chế độ riêng tư
Ads Data Hub cung cấp hai chế độ đảm bảo quyền riêng tư: kiểm tra sự khác biệt và chèn nhiễu. Các phần sau đây mô tả và so sánh những chế độ này.
Sử dụng công cụ kiểm tra sự khác biệt
Các bước kiểm tra sự khác biệt giúp đảm bảo rằng người dùng không thể bị nhận dạng thông qua việc so sánh nhiều kết quả được tổng hợp đầy đủ theo những cách sau:
- Chúng so sánh kết quả của công việc mà bạn đang chạy với kết quả trước đó.
- Chúng so sánh các hàng trong cùng một tập hợp kết quả.
Các thay đổi đối với dữ liệu cơ bản giữa hai công việc có thể kích hoạt lỗi kiểm tra chênh lệch. Khi so sánh kết quả của một công việc với kết quả trước đó, Ads Data Hub sẽ tìm kiếm các điểm yếu ở cấp độ người dùng riêng lẻ. Do đó, ngay cả kết quả từ các chiến dịch khác nhau hoặc kết quả báo cáo cùng số lượng người dùng cũng có thể bị lọc nếu có số lượng lớn người dùng trùng lặp.
Mặt khác, hai tập hợp kết quả tổng hợp có thể có cùng số lượng người dùng (xuất hiện giống hệt nhau) nhưng không dùng chung người dùng riêng lẻ, do đó, chúng sẽ an toàn về quyền riêng tư. Trong trường hợp này, chúng sẽ không bị lọc.
Trung tâm dữ liệu quảng cáo sử dụng dữ liệu từ kết quả trong quá khứ của bạn khi xem xét lỗ hổng của một kết quả mới. Điều này có nghĩa là việc chạy cùng một truy vấn nhiều lần sẽ tạo ra nhiều dữ liệu hơn để các quy trình kiểm tra sự khác biệt sử dụng khi xem xét lỗ hổng của một kết quả mới. Ngoài ra, dữ liệu cơ bản có thể thay đổi, dẫn đến các truy vấn bị cho là ổn định vi phạm quy trình kiểm tra quyền riêng tư.
Khi kết quả ở cấp độ công việc khác biệt đáng kể, nhưng một hàng riêng lẻ tương tự như một hàng trong công việc trước đó, thì Ads Data Hub sẽ lọc hàng tương tự đó. Trong ví dụ này, hàng chứa chiến dịch 123 trong kết quả của công việc thứ hai sẽ được lọc, vì hàng này khác với kết quả trước đó ở một người dùng duy nhất.
|
|
||||||||||||||||
Nếu tổng số người dùng trong tất cả các hàng trong một tập kết quả tương tự như tổng số người dùng trong một công việc trước đó, thì Trung tâm dữ liệu quảng cáo sẽ lọc toàn bộ tập kết quả. Trong ví dụ này, tất cả kết quả từ công việc thứ hai sẽ được lọc.
|
|
||||||||||||||||
Sử dụng tính năng thêm nhiễu
Chèn nhiễu là một kỹ thuật được dùng để bảo vệ quyền riêng tư của người dùng khi truy vấn cơ sở dữ liệu. Cơ chế này hoạt động bằng cách thêm nhiễu ngẫu nhiên vào một mệnh đề tổng hợp SELECT của một truy vấn. Độ nhiễu này bảo vệ quyền riêng tư của người dùng trong khi vẫn cung cấp kết quả tương đối chính xác, loại bỏ nhu cầu kiểm tra sự khác biệt và giảm ngưỡng tổng hợp bắt buộc cho đầu ra. Hầu hết các truy vấn hiện có đều có thể được thực thi ở chế độ nhiễu, nhưng vẫn có một số hạn chế. Để tìm hiểu thêm về chế độ nhiễu và cách tính năng chèn nhiễu ảnh hưởng đến các yêu cầu về quyền riêng tư, hãy xem phần Chèn nhiễu.
So sánh các bước kiểm tra chênh lệch với tính năng thêm nhiễu
|
|
||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||
Nội dung tóm tắt về hàng đã lọc
Bản tóm tắt hàng đã lọc tổng hợp dữ liệu đã được lọc do các tiêu chí kiểm tra quyền riêng tư. Dữ liệu từ các hàng đã lọc sẽ được cộng lại và thêm vào một hàng chung. Mặc dù không thể phân tích thêm dữ liệu đã lọc, nhưng dữ liệu này cung cấp thông tin tóm tắt về lượng dữ liệu đã được lọc khỏi kết quả.
Lọc nội dung phản cảm để bảo vệ quyền riêng tư
Trong trường hợp cần chia nhỏ truy vấn nhưng muốn kết hợp các kết quả tổng hợp, bạn có thể áp dụng rõ ràng các quy trình kiểm tra quyền riêng tư cho một số truy vấn nhỏ hơn, sau đó tổng hợp các kết quả đó lại với nhau theo cách đảm bảo quyền riêng tư.
Ví dụ về các trường hợp sử dụng:
- Bạn là một nhà quảng cáo đang tìm kiếm tất cả lượt chuyển đổi theo loại sự kiện phân bổ trong tài khoản Google Ads được liên kết, bao gồm cả dữ liệu ở Khu vực kinh tế Châu Âu (EEA).
- Bạn là đối tác đo lường đang tìm kiếm tất cả lượt chuyển đổi theo loại sự kiện phân bổ trong tài khoản Google Ads được liên kết.
Để nhận được tổng số lượt chuyển đổi cho tài khoản Google Ads của mình, bạn có thể viết lại truy vấn bằng cách sử dụng một mệnh đề OPTIONS(privacy_checked_export=TRUE) để áp dụng các quy trình kiểm tra quyền riêng tư cho từng dịch vụ của Google.
Ví dụ về việc viết lại trong phần này thực hiện những việc sau:
- Thao tác này sẽ truy vấn từng dịch vụ của Google một cách riêng lẻ, áp dụng rõ ràng các quy trình kiểm tra quyền riêng tư cho từng tập hợp kết quả trung gian.
- Thao tác này sẽ tạo một bảng tạm thời riêng cho kết quả đã kiểm tra quyền riêng tư của từng dịch vụ của Google: YouTube, Gmail và Mạng.
- Thao tác này tổng hợp và tính tổng số lượt chuyển đổi đã được kiểm tra quyền riêng tư từ các bảng tạm thời.
CREATE TEMP TABLE youtube_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
impression_data.campaign_id,
attribution_event_type,
COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_youtube
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;
CREATE TEMP TABLE network_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
impression_data.campaign_id,
attribution_event_type,
COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_network
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;
CREATE TEMP TABLE gmail_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
impression_data.campaign_id,
attribution_event_type,
COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_gmail
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;
SELECT
campaign_id,
attribution_event_type,
SUM(num_convs) AS num_convs
FROM (
SELECT * FROM youtube_agg
UNION ALL
SELECT * FROM network_agg
UNION ALL
SELECT * FROM gmail_agg
)
GROUP BY campaign_id, attribution_event_type
Xin lưu ý rằng truy vấn này không sử dụng JOIN để kết hợp trực tiếp dữ liệu giữa các bảng, mà thay vào đó, trước tiên, truy vấn sẽ thực hiện cho từng bảng, áp dụng các quy trình kiểm tra quyền riêng tư cho từng bảng trung gian, sau đó sử dụng UNION để tính tổng các giá trị đã kiểm tra quyền riêng tư.
Cố vấn truy vấn
Nếu SQL của bạn hợp lệ nhưng có thể kích hoạt quá trình lọc quá mức, thì trình tư vấn truy vấn sẽ đưa ra lời khuyên hữu ích trong quá trình phát triển truy vấn để giúp bạn tránh kết quả không mong muốn.
Các điều kiện kích hoạt bao gồm những mẫu sau:
- Kết hợp các truy vấn phụ được tổng hợp
- Kết hợp dữ liệu chưa được tổng hợp với những người dùng có thể khác nhau
- Bảng tạm được xác định đệ quy
Cách sử dụng trình tư vấn truy vấn:
- Giao diện người dùng. Các đề xuất sẽ xuất hiện trong trình chỉnh sửa truy vấn, phía trên văn bản truy vấn.
- API. Sử dụng phương thức
customers.analysisQueries.validate.
-
Ngoài dữ liệu mà họ đã đồng ý chia sẻ, chẳng hạn như trong trường hợp đối tượng nghiên cứu. ↩
-
Trừ phi bị hạn chế về quyền riêng tư, chẳng hạn như khi người dùng trong bản tóm tắt hàng được lọc không đáp ứng các yêu cầu về việc tổng hợp. ↩