סוגי נתונים וסוגים סמנטיים

כשיוצרים מחבר קהילה, לכל שדה שמגדירים בסכימה נדרש סוג נתונים. סוג הנתונים מגדיר את הסוג הפשוט של השדה, למשל BOOLEAN, STRING, NUMBER וכו'.

בנוסף לסוגי נתונים, ב-Looker Studio נעשה שימוש גם בסוגים סמנטיים. סוגים סמנטיים עוזרים לתאר את סוג המידע שהנתונים מייצגים. לדוגמה, שדה עם סוג הנתונים NUMBER עשוי לייצג באופן סמנטי סכום או אחוז של המטבע, ושדה עם סוג הנתונים STRING עשוי לייצג עיר מסוימת מבחינה סמנטית. כדי לראות אילו סוגים סמנטיים זמינים, עיינו בתיעוד בנושא סוגים סמנטיים.

הסכימה של מחבר הקהילה והשדות ב-Looker Studio

כשמגדירים את הסכימה למחבר הקהילה, יש מאפיינים שונים לכל שדה שקובעים את אופן הייצוג והשימוש של השדה ב-Looker Studio. לדוגמה:

  • ה-conceptType מוגדר בסכימת המחבר באמצעות המאפיין conceptType. המאפיין הזה קובע אם השדה יטופל כמאפיין או כמדד. הסבר על ההבדל בין מדדים ומאפיינים זמין במאמר מאפיינים וערכים.
  • אפשר להגדיר את הסוג הסמנטי בסכימת המחבר או לזהות אותו באופן אוטומטי ב-Looker Studio, על סמך מאפיין סוג הנתונים שהוגדר במחבר וערכי הנתונים שהמחבר מחזיר. במאמר זיהוי אוטומטי של סוג סמנטי מוסבר איך זה עובד.
  • סוג הצבירה קובע אם אפשר לצבור מחדש ערכי מדדים (המערכת מתעלמת מהמאפיינים). אם מגדירים את המאפיין semantics.isReaggregatable לערך true, ברירת המחדל של הצבירה SUM היא הערך, אחרת הוא מוגדר ל-Auto. בעזרת המאפיין defaultAggregationType אפשר להגדיר באופן ידני את סוג הצבירה כברירת מחדל לשדות שנצברים.

כשמגדירים ומתחברים באמצעות מחבר ב-Looker Studio, עורך השדות מציג את הסכימה המלאה של המחבר על סמך האופן שבו הגדרתם את המאפיינים שלמעלה. אם כללתם את הסוגים הסמנטיים, הם יוצגו כפי שהגדרתם. אם משתמשים בזיהוי אוטומטי של סוג סמנטי, השדות יוצגו כפי שזוהו. מסך השדות

הגדרת מידע סמנטי

יש שתי דרכים להגדיר מידע סמנטי. אפשר להגדיר סמנטיקה של שדות באופן ידני או להסתמך על Looker Studio לזיהוי אוטומטי.

לדוגמה, אם יש לכם מספר שמייצג מבחינה סמנטית את דולר ארה"ב, Looker Studio לא יוכל לזהות את הסוג הסמנטי הזה באופן אוטומטי. בנוסף, הזיהוי הסמנטי האוטומטי מחייב את Looker Studio לבצע קריאות לאחזור נתונים לכל שדה בסכימה. אם תציינו את הסכימה באופן ידני, לא יתבצעו קריאות לאחזור נתונים. אם אתם יודעים מה הסוג הסמנטי (למשל מטבע, אחוז, תאריך וכו') של הנתונים, מומלץ להגדיר זאת במפורש בסכימה כדי לשפר את הדיוק ואת הביצועים.

הגדרה ידנית של סוגים סמנטיים (מומלץ)

אם אתם יודעים את הסוגים הסמנטיים שלכם, תוכלו להגדיר ידנית את semantics לכל שדה בסכימה. הפרטים המלאים על המאפיינים הזמינים לכם זמינים בדף פירוט השדות. אם בוחרים להגדיר סוגים סמנטיים ידניים, מומלץ להגדיר את הערכים semanticType ו-semanticGroup לכל שדה. אם מוסיפים ידנית את המאפיינים האלה, תהליך הזיהוי האוטומטי של הסוג הסמנטי לא יפעל. אם הגדרתם ידנית חלק מהשדות אבל לא את כולם, השדות שלא ציינתם כברירת מחדל הם Text, Number או Boolean בהתאם לdataType שצוין בשדה.

דוגמה לסכימה פשוטה שמגדירה סוגים סמנטיים באופן ידני. המאפיין Income מוגדר כמטבע, והערך Filing Year מוגדר כתאריך.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

פתרון בעיות בנושא סוגים סמנטיים ידניים

אם תגדירו את הסוגים הסמנטיים בצורה שגויה לנתונים הבסיסיים, הם לא יפעלו כמו שצריך. לפעמים קשה לבדוק את זה, אבל יש כמה דברים שאפשר לעשות כדי לאתר בעיות.

  1. מחזירים 2 או 3 שורות מהנתונים במקום את כולם, ואז בודקים אותם באופן ידני.
  2. יוצרים טבלה ב-Looker Studio שמשתמשת רק בשדה שמנסים לבדוק.
  3. חשוב לשים לב לשדות Geo ו-Date כי הפורמט שלהם הוא המחמיר ביותר.

זיהוי אוטומטי של סוג סמנטי

אם לא הגדרתם סוגים סמנטיים, מערכת Looker Studio תנסה לזהות אותם באופן אוטומטי על סמך המאפיין data type והפורמט של ערכי הנתונים שהמחבר מחזיר.

אלה השלבים בתהליך הזיהוי האוטומטי:

  1. מבקשים את הסכימה על ידי הרצת הפונקציה getSchema של מחבר הקהילה.
  2. מבצעים איטרציה באמצעות קבוצות של שדות שהוגדרו בסכימת המחבר והבעיה getData מבקשת את השדות. הבקשות של getData מבוצעות כשהפרמטר sampleExtraction מוגדר ל-true כדי לציין שהבקשות לנתונים נועדו למטרות זיהוי סמנטי.
  3. מזהים את הסוג הסמנטי של השדה בהתאם לסוג הנתונים בשדה ולפורמט של הערך שהוחזר מהבקשה getData.

אפשרויות לטיפול בזיהוי אוטומטי של סוג סמנטי

כש-Looker Studio מפעיל את הפונקציה getData של מחבר קהילה לצורך זיהוי סמנטי, הבקשה הנכנסת תכיל נכס sampleExtraction שיוגדר כ-true. הנתונים שהמחבר מחזיר משמשים רק את Looker Studio לזיהוי הסוג הסמנטי של השדה. הערך לא ישמש לאף מטרה אחרת, ולכן לא נדרשים נתונים בפועל מהמקור החיצוני.

יש כמה דרכים לשפר את הזיהוי של הסוג הסמנטי בקוד:

  • מומלץ: העברת ערכים מוגדרים מראש
    החזרת ערך מוגדר מראש לכל שדה שמייצג בצורה הטובה ביותר את הסוג הסמנטי של השדה, ו-Looker Studio ידוע כי הוא מזוהה כראוי. לדוגמה, אם הסוג הסמנטי של השדה הוא Country, צריך להחזיר ערך כמו IT עבור איטליה. היתרון השני של הגישה הזו הוא שהגישה הזו מהירה בהרבה, כי אין צורך לשלוח בקשות HTTP לשירות הצד השלישי כדי לקבל נתונים.

  • החזרה של מספר הרשומות n בלבד
    אם שירות הצד השלישי שממנו מאחזרים נתונים תומך במגבלות שורות בעת בקשת נתונים, יש להחזיר קבוצת משנה קטנה של שורות ל-Looker Studio במקום קבוצת הנתונים המלאה. כך תוגבל כמות הנתונים שצריך להעביר ל-Looker Studio עבור כל בקשה לזיהוי סמנטי.

  • בקשת כל העמודות ושומרת את התגובה במטמון
    אם אפשר לבקש את כל העמודות של שירות הצד השלישי שממנו מאחזרים נתונים, אז בבקשת הזיהוי הסמנטית הראשונה שהתקבלה מ-Looker Studio, יאוחזרו כל העמודות וישמרו את התוצאות במטמון. בבקשות הבאות לזיהוי סמנטי, המאחזרים את ערכי העמודות מהמטמון, במקום לשלוח בקשות HTTP נוספות לשירות של הצד השלישי.

  • לא לעשות שום דבר אחר
    ניתן לבחור שלא ליישם התאמות ספציפיות בבקשות שבהן sampleExtraction מוגדר לערך true. זה יגרום לתהליך הזיהוי הסמנטי להיות איטי יותר, כי מערכת Looker Studio תצטרך לאחזר את כל הנתונים מתהליך הזיהוי הסמנטי. נוסף לכך, השינוי ישפיע על קצב הבקשות למקור הנתונים החיצוני, כי בקשות רבות לזיהוי סמנטי יבוצעו במקביל.

פורמטים מזוהים לזיהוי אוטומטי של סוג סמנטי

תאריך ושעה
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • זמן: פרק זמן של זמן שני, מיקרו, מיליליטר וננו.
גיאוגרפי