כשיוצרים מחבר לקהילה, צריך להגדיר סוג נתונים לכל שדה בסכימה. סוג הנתונים מגדיר את הסוג הפרימיטיבי של השדה, כמו BOOLEAN
, STRING
, NUMBER
וכו'.
בנוסף לסוגי נתונים, Looker Studio משתמש גם בסוגים סמנטיים.
סוגים סמנטיים עוזרים לתאר את סוג המידע שהנתונים מייצגים. לדוגמה, שדה עם סוג הנתונים NUMBER
יכול לייצג סכום כספי או אחוז, ושדה עם סוג הנתונים STRING
יכול לייצג עיר. כדי לראות אילו סוגים סמנטיים זמינים, אפשר לעיין בתיעוד הסוגים הסמנטיים.
סכימה של פלאגין חיבור למקור נתונים ושדות ב-Looker Studio
כשמגדירים את הסכימה של מחבר לקהילה, יש מאפיינים שונים לכל שדה שיקבעו איך השדה יוצג וישמש ב-Looker Studio. לדוגמה:
- המאפיין conceptType מוגדר בסכימת המחבר באמצעות המאפיין
conceptType
. המאפיין הזה קובע אם השדה מטופל כמאפיין או כמדד. הסבר על ההבדל בין מדדים למאפיינים זמין במאמר מאפיינים ומדדים. - אפשר להגדיר את הסוג הסמנטי בסכימת המחבר, או שמערכת Looker Studio יכולה לזהות אותו באופן אוטומטי על סמך מאפיין סוג הנתונים שמוגדר במחבר וערכי הנתונים שמוחזרים על ידי המחבר. פרטים נוספים על האופן שבו התכונה הזו פועלת זמינים במאמר בנושא זיהוי אוטומטי של סוגים סמנטיים.
- סוג הצבירה קובע אם אפשר לצבור מחדש את ערכי המדדים (המערכת מתעלמת מהמאפיינים). אם מגדירים את המאפיין
semantics.isReaggregatable
לערךtrue
, ברירת המחדל היא צבירה שלSUM
. אחרת, המאפיין מוגדר לערךAuto
. אפשר גם להגדיר ידנית את סוג הצבירה שמוגדר כברירת מחדל לשדות שאפשר לחשב מצטבר באמצעות המאפייןdefaultAggregationType
.
כשמגדירים ומתחברים באמצעות מחבר ב-Looker Studio, בעורך השדות מוצגת הסכימה המלאה של המחבר על סמך ההגדרות של המאפיינים שצוינו למעלה. אם כללתם את הסוגים הסמנטיים, הם יוצגו כמו שהגדרתם אותם. אם אתם משתמשים בזיהוי אוטומטי של סוג סמנטי, השדות יופיעו כמו שהם זוהו.
הגדרת מידע סמנטי
יש שתי דרכים להגדיר מידע סמנטי. אתם יכולים להגדיר את הסמנטיקה של השדות באופן ידני או להסתמך על Looker Studio שיזהה אותה באופן אוטומטי.
לדוגמה, אם יש לכם מספר שמייצג סמנטית דולר אמריקאי, Looker Studio לא יוכל לזהות אוטומטית את הסוג הסמנטי הזה. בנוסף, כדי שהמערכת תוכל לזהות באופן אוטומטי את הסמנטיקה, Looker Studio צריך לבצע קריאות לאחזור נתונים לכל שדה בסכימה. אם מציינים את הסכימה באופן ידני, לא יתבצעו קריאות לשליפת נתונים. אם אתם יודעים מהו הסוג הסמנטי של הנתונים (למשל: מטבע, אחוז, תאריך וכו'), מומלץ להגדיר אותו באופן מפורש בסכימה כדי להבטיח דיוק וביצועים טובים.
הגדרה ידנית של סוגים סמנטיים (מומלץ)
אם אתם יודעים מהם הסוגים הסמנטיים, אתם יכולים להגדיר באופן ידני את semantics
לכל שדה סכימה. פרטים מלאים על המאפיינים שזמינים לכם מופיעים בדף העזר בנושא שדות. אם בוחרים להגדיר סוגים סמנטיים ידניים, מומלץ להגדיר את semanticType
ואת semanticGroup
לכל שדה. אם תספקו את המאפיינים האלה באופן ידני, תהליך הזיהוי האוטומטי של סוגים סמנטיים לא יפעל. אם מגדירים חלק מהשדות באופן ידני, אבל לא את כולם, ברירת המחדל של השדות שלא צוינו היא Text
, Number
או Boolean
, בהתאם לdataType
שצוין בשדה.
הדוגמה הבאה היא של סכימה פשוטה שבה סוגים סמנטיים מוגדרים באופן ידני. Income
מוגדר כמטבע ו-Filing Year
מוגדר כתאריך.
פתרון בעיות שקשורות לסוגים סמנטיים ידניים
אם תגדירו את הסוגים הסמנטיים בצורה שגויה עבור הנתונים הבסיסיים, הם לא יפעלו בצורה תקינה. יכול להיות שיהיה קשה לבדוק את זה, אבל יש כמה דברים שאפשר לעשות כדי לנסות לזהות בעיות.
- אפשר להחזיר 2 או 3 שורות מהנתונים במקום את כל הנתונים, ואז לבדוק אותם באופן ידני.
- יוצרים ב-Looker Studio טבלה שמשתמשת רק בשדה שרוצים לבדוק.
- חשוב לשים לב לשדות
Geo
ו-Date
כי הפורמט שלהם הכי מחמיר.
זיהוי אוטומטי של סוגים סמנטיים
אם לא הגדרתם סוגים סמנטיים בסכימה, מערכת Looker Studio תנסה לזהות אותם באופן אוטומטי על סמך מאפיין סוג הנתונים והפורמט של ערכי הנתונים שמוחזרים על ידי המחבר.
אלה השלבים בתהליך הזיהוי האוטומטי:
- כדי לבקש את הסכימה, מריצים את הפונקציה
getSchema
של מחבר הקהילה. - מבצעים איטרציה על קבוצות של שדות שמוגדרים בסכימת המחבר ושולחים בקשות
getData
לשדות. הבקשותgetData
מבוצעות עם הפרמטרsampleExtraction
שמוגדר לערךtrue
כדי לציין שהבקשות לנתונים מיועדות למטרות של זיהוי סמנטי. - מזהים את הסוג הסמנטי של השדה על סמך סוג הנתונים של השדה והפורמט של הערך שמוחזר מהבקשה
getData
.
אפשרויות לטיפול בזיהוי אוטומטי של סוגים סמנטיים
כש-Looker Studio מפעיל את הפונקציה getData
של מחבר קהילתי לצורך זיהוי סמנטי, הבקשה הנכנסת תכיל את המאפיין sampleExtraction
שיוגדר לערך true
. הנתונים שמוחזרים על ידי המחבר משמשים את Looker Studio רק כדי לזהות את הסוג הסמנטי של השדה. מכיוון שהערך לא ישמש לשום מטרה אחרת, לא נדרשים נתונים בפועל מהמקור החיצוני.
יש כמה דרכים לשפר את הזיהוי של סוגים סמנטיים בקוד:
מומלץ: העברת ערכים מוגדרים מראש
החזרת ערך מוגדר מראש לכל שדה שמייצג בצורה הטובה ביותר את הסוג הסמנטי של השדה, ושמזוהה בצורה נכונה על ידי Looker Studio. לדוגמה, אם הסוג הסמנטי של שדה הוא Country, הפונקציה תחזיר ערך כמוIT
עבור איטליה. יתרון נוסף של הגישה הזו הוא שהיא מהירה הרבה יותר, כי לא צריך לשלוח בקשות HTTP לשירות של צד שלישי כדי לקבל נתונים.Return only n number of records
אם שירות הצד השלישי שממנו מאחזרים נתונים תומך בהגבלת מספר השורות כשמבקשים נתונים, מחזירים קבוצת משנה קטנה של שורות ל-Looker Studio במקום מערך הנתונים המלא. כך תצטרכו להעביר ל-Looker Studio פחות נתונים לכל בקשה לזיהוי סמנטי.בקשה של כל העמודות ושמירת התגובה במטמון
אם אפשר לבקש את כל העמודות בשירות הצד השלישי שממנו מאחזרים נתונים, אז בבקשת הזיהוי הסמנטי הראשונה שמתקבלת מ-Looker Studio, מאחזרים את כל העמודות ושומרים את התוצאות במטמון. בבקשות הבאות לזיהוי סמנטי, המערכת מאחזרת את ערכי העמודות מהמטמון במקום לשלוח בקשות HTTP נוספות לשירות של הצד השלישי.לא לבצע שינוי
אפשר לבחור שלא להטמיע התאמות ספציפיות לבקשות שבהן הערך שלsampleExtraction
הואtrue
. הפעולה הזו תגרום לתהליך של זיהוי סמנטי להיות איטי יותר, כי Looker Studio יצטרך לאחזר את כל הנתונים בשביל התהליך הזה. בנוסף, זה ישפיע על קצב הבקשות למקור הנתונים החיצוני, כי הרבה בקשות לזיהוי סמנטי יבוצעו במקביל.
פורמטים מוכרים לזיהוי אוטומטי של סוגים סמנטיים
תאריך ושעה
YYYY/MM/DD-HH:MM:SS
YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
YYYYMMDD [HH:MM:SS[.uuuuuu]]
Sat, 24 May 2008 20:09:47 GMT
2008-05-24T20:09:47Z
- הזמן: תקופת זמן המערכת בשניות, במיקרו-שניות, באלפיות השנייה ובננו-שניות.
Geo
- שם או קוד היבשת
- שם או קוד של תת-יבשת
- שם או קוד האזור
- שם המדינה או הקוד שלה. אפשר גם לעיין בISO_3166-1.
- שם העיר
- ערך של קו רוחב וקו אורך מופרדים בפסיקים
- שם וקוד של אזור שוק ייעודי (DMA)