נתוני הכבישים המצטברים מסופקים כנתונים של פעולות על ציר הזמן, שכוללים:
- משך הנסיעה
- מרווחי זמן לקריאה מהירה (SRI)
- גיאומטריית המסלול
הגדרת BigQuery
כדי לגשת לנתוני הכבישים ב-BigQuery, צריך להגדיר את פרויקט Google Cloud ולהירשם ל-Data Exchange.
דרישות מוקדמות
מוודאים שהפרויקט והחשבון ב-Google Cloud מוגדרים באופן הבא:
- מפעילים את BigQuery API. הוראות מפורטות זמינות במאמר בנושא הפעלת שאילתה במערך נתונים ציבורי באמצעות מסוף Google Cloud.
- מפעילים את Analytics Hub API. מידע נוסף על Analytics Hub API
- הקצאת תפקידי IAM נדרשים. כדי לבצע משימות שקשורות למנויים וליצור מערכי נתונים, צריך לוודא שיש לחשבון את התפקידים הבאים:
- מנוי ב-Analytics Hub
(
roles/analyticshub.subscriber)- משתמש BigQuery
(
roles/bigquery.user)
- משתמש BigQuery
(
הרשמה לאוסף הנתונים לשיתוף
הנתונים על הכבישים משותפים איתכם באמצעות חילופי נתונים פרטיים ב-BigQuery (מרכז Analytics). כדי לגשת לנתונים שלכם, תקבלו קישור ספציפי להרשמה משותף של Google. מערך הנתונים הזה עומד במוסכמת השמות הבאה:
historical_roads_data_PROJECT_NUMBER.
כדי להירשם לנתונים שלכם:
- לוחצים על קישור ההרשמה שסופק על ידי שותף Google. הקישור הזה יעביר אתכם ישירות לאוסף נתונים לשיתוף במסוף Google Cloud.
- במסוף Google Cloud, בודקים את פרטי חילופי הנתונים.
- לוחצים על הלחצן הרשמה בתיבת הדו-שיח.
- כשהמינוי מסתיים, מערך הנתונים המקושר מופיע בחלונית Explorer של BigQuery במסוף Google Cloud. מעכשיו אפשר להשתמש בשמות הטבלאות שמוצגים בחלונית 'סייר' כדי לגשת לנתונים בשאילתות SQL.
טבלאות ב-BigQuery
נתוני הכבישים המצטברים של המסלולים שבחרתם מאוחסנים במערך נתונים מבודד ב-BigQuery של פרויקט בענן שנמצא בבעלות Google. הוא משותף איתכם באמצעות מרכז נתונים פרטי שנוצר במיוחד בשבילכם בשיתוף BigQuery (מרכז Analytics). כדי לגשת לנתונים, צריך להירשם ל-Data Exchange וליצור מערך נתונים מקושר בפרויקט Google Cloud.
מערך הנתונים המשותף ב-BigQuery כולל כמה טבלאות BigQuery שמוגדרות ונוצרות על ידי Google. בהמשך מפורטים הנתונים של כל טבלה.
טבלה של historical_travel_time
זו הסכימה של טבלת BigQuery historical_travel_time:
| שם | מצב | סוג | תיאור |
|---|---|---|---|
| selected_route_id | יכול להיות ריק | מחרוזת | selected_route_id של המסלול |
| השם_המוצג | יכול להיות ריק | מחרוזת | השם המוצג של המסלול |
| record_time | יכול להיות ריק | חותמת זמן | חותמת הזמן שבה מחושבים נתוני המסלול |
| duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול עם התחשבות בעומסי התנועה |
| static_duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול בלי להתחשב בעומס התנועה |
| route_geometry | יכול להיות ריק | GEOGRAPHY | הגיאומטריה של הקו הפוליגוני של המסלול, שמתחשבת בתנועה |
התנהגויות ועובדות שקשורות לטבלאות
- הטבלה מחולקת למחיצות לפי יום, וכל מחיצה מוגדרת עם תאריך תפוגה של 10 שנים.
- הטבלה מתעדכנת מדי שעה עם נתוני התנועה האחרונים שנכתבים בחבילות.
- אחרי שיוצרים נתיב חדש ב-Roads Selection API, צריך להמתין עד שעה אחת עד שהנתונים יהיו זמינים בטבלה הזו.
- אחרי שמסלול נמחק מ-Roads Selection API, לא נכתבים נתונים חדשים בטבלה הזו לגבי המסלול. עם זאת, הנתונים ההיסטוריים נשארים עד לתפוגה.
טבלה של recent_roads_data
הערה: הטבלה הזו זמינה רק אם החוזה שלכם כולל נתוני כבישים בזמן אמת.
בניגוד לטבלה historical_travel_time, הטבלה הזו מכילה גם נתונים של SpeedReadingInterval. זו הסכימה ב-BigQuery:
| שם | מצב | סוג | תיאור |
|---|---|---|---|
| selected_route_id | יכול להיות ריק | מחרוזת | selected_route_id של המסלול |
| השם_המוצג | יכול להיות ריק | מחרוזת | השם המוצג של המסלול |
| record_time | יכול להיות ריק | חותמת זמן | חותמת הזמן שבה מחושבים נתוני המסלול |
| duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול עם התחשבות בעומסי התנועה |
| static_duration_in_seconds | יכול להיות ריק | מספר ממשי (float) | משך המסלול בלי להתחשב בעומס התנועה |
| route_geometry | יכול להיות ריק | GEOGRAPHY | הגיאומטריה של הקו הפוליגוני של המסלול, שמתחשבת בתנועה |
| speed_reading_intervals | מרובה ערכים | רשומה | מרווחי זמן שמייצגים את צפיפות התנועה לאורך המסלול. אפשר לעיין בהגדרה המקורית של Routes API |
| speed_reading_intervals.interval_coordinates | מרובה ערכים | GEOGRAPHY | הגיאומטריה של המרווח הזה |
| speed_reading_intervals.speed | יכול להיות ריק | מחרוזת | הסיווג של המהירות במרווח הזה. ערכים אפשריים: NORMAL, SLOW, TRAFFIC_JAM |
התנהגויות ועובדות שקשורות לטבלאות
- הטבלה מחולקת למחיצות לפי יום, וכל מחיצה מוגדרת עם תאריך תפוגה של 60 יום.
- הטבלה מתעדכנת מדי שעה עם נתוני התנועה האחרונים שנכתבים בחבילות.
- אחרי שיוצרים נתיב חדש ב-Roads Selection API, צריך להמתין עד שעה אחת עד שהנתונים יהיו זמינים בטבלה הזו.
- אחרי שמסלול נמחק מ-Roads Selection API, לא ייכתבו יותר נתונים חדשים בטבלה הזו לגבי המסלול. עם זאת, הנתונים ההיסטוריים נשארים עד לתפוגה.
טבלה של routes_status
בטבלה מופיעים המטא-נתונים של המסלולים שנבחרו ופרטי הסטטוס שלהם. המטרה היא לספק דרך קלה יותר לצפייה בכל המסלולים והסטטוסים. אפשר לצרף אותה לשתי הטבלאות האחרות כדי לסנן את הנתונים. זו הסכימה ב-BigQuery:
| שם | מצב | סוג | תיאור |
|---|---|---|---|
| selected_route_id | יכול להיות ריק | מחרוזת | selected_route_id של המסלול |
| השם_המוצג | יכול להיות ריק | מחרוזת | השם המוצג של המסלול |
| סטטוס* | יכול להיות ריק | מחרוזת | סטטוס המסלול |
| validation_error | יכול להיות ריק | מחרוזת | שגיאת אימות של המסלול |
| low_road_usage_start_time | יכול להיות ריק | חותמת זמן | השעה שבה נצפה לראשונה שימוש נמוך בכביש במהלך אימות מחדש. היא משויכת ל-VALIDATION_ERROR_LOW_ROAD_USAGE. |
| route_attributes | יכול להיות ריק | מחרוזת | מאפיינים מותאמים אישית של המסלול שנבחר |
*סטטוס המסלול בטבלה הזו מתחיל ב-STATUS_ במקום ב-STATE_. אחרת, הוא עקבי עם Roads Selection API.
התנהגויות ועובדות שקשורות לטבלאות
- רק מסלולים בסטטוס STATUS_RUNNING או STATUS_INVALID נכללים בטבלה הזו.
- המטא-נתונים והסטטוס של המסלולים מתעדכנים כל שעה, ללא הפסקה.
- אחרי שיוצרים נתיב חדש ב-Roads Selection API, צריך לחכות עד שעה עד שהנתיב יופיע בטבלה הזו.
- אחרי שמסלול נמחק מ-Roads Selection API, צריך להמתין עד שעה אחת עד שהמסלול שנבחר יוסר מהטבלה הזו.