סקירה כללית של Topics API

Topics API מאפשר פרסום מבוסס-עניין (IBA) ללא צורך במעקב אחר האתרים שבהם משתמש מבקר.

סטטוס הטמעה

מה זה Topics API?

Topics API הוא מנגנון של ארגז חול לפרטיות שמטרתו לשמור על הפרטיות, ובמקביל לאפשר לדפדפן לשתף עם צדדים שלישיים מידע לגבי תחומי העניין של המשתמש. הוא מאפשר פרסום מבוסס-עניין (IBA) ללא צורך במעקב אחר האתרים שבהם משתמש מבקר.

פרסום המבוסס על תחומי עניין הוא מושג מפתח ב-Topics API. זהו סוג של פרסום מותאם אישית שבו מודעה נבחרת למשתמש על סמך תחומי העניין שלו, שמוסקו על סמך האתרים שבהם הוא ביקר לאחרונה. פרסום זה שונה מפרסום לפי הקשר, שמטרתו להתאים מודעות לתוכן של הדף שבו המשתמש מבקר.

פרסום מבוסס-עניין יכול לעזור הן למפרסמים (אתרים שרוצים לפרסם את המוצרים או השירותים שלהם) וגם לבעלי אתרים (אתרים הנעזרים במודעות כדי לייצר רווח מהתוכן שלהם):

  • פרסום לפי תחומי עניין יכול לעזור למפרסמים להגיע ללקוחות פוטנציאליים.
  • פרסום לפי תחומי עניין מאפשר להשלים מידע לפי הקשר כדי לעזור לבעלי תוכן דיגיטלי להשתמש בפרסום כדי לממן אתרים.

Topics API מספק צורה חדשה של פרסום מבוסס-עניין באמצעות נושאים (קטגוריות עניין) המוקצים לדפדפן על סמך פעילות המשתמש האחרונה. הנושאים האלה משמשים כתוספת למידע ההקשרי, כדי לעזור בבחירת המודעות המתאימות.

איך זה עובד

בעבר נעשה שימוש בקובצי cookie של צד שלישי ובמנגנונים אחרים כדי לעקוב אחר התנהגות הגלישה של משתמשים באתרים שונים, כדי להסיק מהם הנושאים שמעניינים אותך. המנגנונים האלה מופסקים בהדרגתיות.

באמצעות Topics API, הדפדפן קולט ומתעד נושאים שנראים מעניינים את המשתמש, על סמך פעילות הגלישה שלו. המידע הזה מתועד במכשיר של המשתמש. לאחר מכן, Topics API יכול להעניק לקוראי ה-API (למשל פלטפורמות פרסום דיגיטלי) גישה לתחומי העניין של המשתמש, אבל בלי לחשוף מידע נוסף על פעילות הגלישה של המשתמש.

תצפית על נושאי אב

החל מגרסה 114 של Chrome, כשמתקשר צופה בנושא עבור משתמש בדף מסוים, הדפדפן מתייחס גם למתקשר כמי שבחן את כל האבות הקדמונים של הנושא.

לדוגמה, אם הדפדפן מתעד שמתקשר מזהה את Shopping/Apparel/Footwear/Boots עבור משתמש, אז גם האבות הקדמונים של הנושא הזה נחשבים כתצפיות: Shopping/Apparel/Footwear, Shopping/Apparel ו-Shopping.

בעבר, כדי שהדפדפן יתייחס לכך שהמתקשר צפה (לדוגמה) ב-Shopping/Apparel, ה-API היה צריך להחזיר את הנושא הספציפי הזה כפי שתועד הנושא. כלומר, אם הפרמטר Shopping/Apparel יזוהה אצל משתמש בדף מסוים ובתגובה Shopping/Apparel/Footwear/Boots בדף אחר, ה-API יתייחס ל-Shopping/Apparel כאל תוכן שנצפה בשני הדפים.

תקופות

כמובן ש-Topics API חייב לוודא שנושאי העניין שהוא מספק מתעדכנים. הדפדפן מסיק נושאים עבור המשתמש על סמך פעילות הגלישה שלו במהלך תקופה שנקראת תקופה של זמן מערכת, נכון לעכשיו: שבוע אחד. לכל משתמש יש תקופות זמן משלו (תקופות זמן הן 'לכל משתמש') ושעת ההתחלה הראשונית אקראית. בכל תקופת זמן לקביעת נושאים, הנושא נבחר באופן אקראי מתוך חמשת הנושאים המובילים של המשתמש באותה תקופת זמן. כדי לשפר את השמירה על הפרטיות ולהבטיח שכל הנושאים מוצגים, יש סיכוי של 5% שהנושא ייבחר באופן אקראי מתוך כל הנושאים האפשריים בטקסונומיה של תחומי עניין.

ב-Topics API יש שלוש משימות עיקריות:

  • מיפוי של הפעילות בדפדפן לפי נושאים שמעניינים אותך. בעזרת העיצוב הנוכחי של Topics API, הנושאים מושקים משמות המארחים של הדפים שבהם המשתמש מבקר. לדוגמה, הנושא שהמערכת מסיקה לאתר לגבי אקווריומים יכול להיות /חיות מחמד ובעלי חיים/חיות מחמד/דגים ואקווריומים.
  • חשבו את הנושאים המובילים למשתמש על סמך פעילות הגלישה שלו מהזמן האחרון.
  • מספקים מנגנונים לגישה לנושאים שמעניינים את המשתמש כרגע, כדי לעזור בבחירת המודעות המתאימות.

Topics API מספק נושאים קלים להבנה שבני אדם יכולים לקרוא, כך שניתן לספק למשתמשים אמצעי בקרה משמעותיים.

איך מתבצע האיסוף והבחירה של הנושאים

הנושאים נבחרים מתוך טקסונומיה המורכבת מקטגוריות היררכיות כגון /אומנות ובידור/מוזיקה ואודיו/סול ו-R&B ו/עסקים ותעשייה/חקלאות ויער. הנושאים האלה נאספו על ידי Chrome לצורך בדיקות ראשוניות, אבל כשהמטרה היא שהטקסונומיה תהפוך למשאב שמתוחזק על ידי שותפים מהימנים של הסביבה העסקית. הטקסונומיה צריכה להיות קטנה מספיק כדי שדפדפנים של משתמשים רבים ישויכו לכל נושא. כרגע מספר הנושאים הוא 349, אבל אנחנו מצפים שהמספר הסופי של הנושאים יהיה בין כמה מאות לכמה אלפים.

כדי להימנע מקטגוריות רגישות, הנושאים חייבים להיות גלויים לכולם, נאספים על ידי בודקים אנושיים, והם צריכים להיות עדכניים. הטקסונומיה הראשונית שהוצעה לבדיקה על ידי Chrome נוצרה על ידי אנשים כדי להחריג קטגוריות שנחשבות בדרך כלל רגישות, כמו מוצא אתני או נטייה מינית.

עבור 50,000 אתרים מובילים, ההטמעה של Topics API ב-Chrome משתמשת ברשימת שינויים שנאספה באופן ידני וזמינה באופן ציבורי כדי למפות שמות מארחים לנושאים. לגבי אתרים אחרים, Topics API משתמש במודל של למידת מכונה כדי להסיק נושאים משמות מארחים.

במסגרת היישום של Topics API ב-Chrome, מתבצעת הורדה של קובץ TensorFlow Lite שמייצג את המודל, כדי שאפשר יהיה להשתמש בו באופן מקומי במכשיר של המשתמש.

אפשר לגשת לקובץ המודל של TensorFlow Lite ולנושאים שהוסקו לגבי שמות המארחים מ-chrome://topics-internals.

בתרשים הבא מוצגת דוגמה פשוטה שממחישה איך Topics API יכול לעזור לפלטפורמת פרסום דיגיטלי לבחור מודעה מתאימה. הדוגמה מבוססת על ההנחה שלדפדפן של המשתמש כבר יש מודל למיפוי שמות מארחים של אתרים לפי נושאים.

תרשים שמוצגים בו השלבים במחזור החיים של Topics API, ממשתמש שמבקר באתרים ועד למודעה שמוצגת.
תרשים מחזור החיים של Topics API מציג את שלבי הפעולות של ה-API מנקודת מבט ברמה גבוהה.

מתקשרים ל-API מקבלים רק נושאים שהם צפו בהם

אחד מיעדי העיצוב של Topics API הוא לאפשר פרסום המבוסס על תחומי עניין, בלי לשתף מידע עם יותר ישויות ממה שאפשר לעשות כרגע באמצעות קובצי cookie של צד שלישי. Topics API תוכנן כך שאפשר להחזיר נושאים רק לקוראי API שכבר בדקו אותם, במסגרת זמן מוגבלת. נניח שמתקשר ל-API צפה בנושא של משתמש אם הוא קרא לשיטה document.browsingTopics() בקוד שכלול באתר ש-Topics API מיפה לנושא הזה.

ה-API מחזיר רק נושאים שזוהו על ידי מבצע הקריאה החוזרת במהלך שלוש התקופות האחרונות. הפעולה הזו עוזרת למנוע שיתוף של מידע על המשתמש עם יותר ישויות מאשר עם הטכנולוגיות שה-API מחליף (כולל קובצי cookie של צד שלישי).

מספר הנושאים שמוחזרים תלוי במספר הנושאים שהמתקשר ב-API צפה בהם בעבר ובמספר הנושאים שזמינים למשתמש (כמו מספר השבועות שנצברו). ניתן להחזיר כל מקום בין אפס לשלושה נושאים, מכיוון שניתן לציין נושא אחד עבור כל אחת משלוש התקופות האחרונות

מידע נוסף על אופן השימוש ב-Topics API והבדיקה שלו זמין במדריך למפתחים של Topics API.

איך ה-API מפחית את השימוש בטביעת אצבע דיגיטלית (fingerprinting)

Topics API כולל מספר מנגנונים שעוזרים לוודא שקשה לזהות מחדש מספר משמעותי של משתמשים בכל האתרים באמצעות Topics API בלבד:

  • מכיוון שהטקסונומיה של 'נושאים' מספקת נושאים ברמת פירוט גס, צפוי להיות מספר גדול של משתמשים בכל נושא. למעשה, יש מספר מינימלי מובטח של משתמשים לכל נושא, מפני ש-5% מהזמן שהנושא שהוחזר הוא אקראי.
  • הנושאים מוחזרים באופן אקראי מתוך חמשת הנושאים המובילים של המשתמש.
  • אם משתמש מבקר לעתים קרובות באותו אתר (לדוגמה, מדי שבוע) קוד שפועל באתר יכול ללמוד נושא חדש אחד בכל שבוע, לכל היותר.
  • אתרים שונים יקבלו נושאים שונים עבור אותו משתמש באותה תקופה. יש סיכוי של 1 לחמישה שהנושא שהוחזר למשתמש באתר אחד תואם לנושא שהוחזר עבורו באתר אחר. לכן קשה יותר לקבוע אם מדובר באותו משתמש.
  • הנושאים מתעדכנים עבור המשתמש פעם בשבוע, מה שמגביל את קצב השיתוף של המידע. במילים אחרות, ה-API לא מספק עדכוני נושא לעיתים קרובות מדי כדי לצמצם את הסיכון ליצירה של טביעת אצבע דיגיטלית (fingerprinting).
  • נושא יוחזר רק עבור קורא API שצפה בעבר באותו נושא עבור אותו משתמש לאחרונה. הגישה הזו עוזרת להגביל את הפוטנציאל של ישויות ללמוד (או לשתף) מידע על תחומי עניין של משתמשים שהם לא זיהו בעצמכם.

איך ה-API מטפל בבעיות שקשורות ל-FLoC

גרסת המקור לניסיון של FLoC בשנת 2021 קיבלה מגוון רחב של משובים ממומחים בתחומי טכנולוגיית הפרסום והסביבה העסקית של האינטרנט. באופן ספציפי, היו חשש שקבוצות בעלות מאפיינים משותפים של FLoC יכולות לשמש כפלטפורמה ליצירה של טביעת אצבע דיגיטלית (fingerprinting) לזיהוי משתמשים או לחשוף את הקשר שלהם לקטגוריה רגישה. בוצעו גם קריאות לשיפור השקיפות וההבנה של FLoC למשתמשים.

Topics API עוצב בהתאם למשוב הזה. המטרה היא לחקור דרכים אחרות לתמיכה בפרסום מבוסס-עניין, עם שקיפות משופרת, הבטחה גבוהה יותר על פרטיות וגישה שונה לקטגוריות רגישות.

השלבים הבאים

למידע נוסף על נושאים ועל איך הם עובדים

אם אתם מפתחים טכנולוגיות פרסום, אתם יכולים לנסות ולהשתתף ב-Topics API. כדי לקבל מידע מפורט יותר, אפשר לעיין במדריך למפתחים.

עניין ושיתוף משוב