יצירה וניהול של מערך נתונים

מערכי נתונים מאפשרים לכם להעלות נתונים גיאו-מרחביים מקובץ מקומי או מ-Google Cloud Storage לפלטפורמה של מפות Google. לאחר מכן תוכלו לשייך מערך נתונים לסגנון מפה אחד או יותר במסוף Cloud. לאחר שיוך מערך הנתונים לסגנון של מפות, תוכלו להשתמש ב-API של סגנון מבוסס-נתונים כדי לעצב את אפליקציית המפות באופן דינמי.

אפשר גם להשתמש ב-API ל-REST כדי להעלות למערך נתונים נתונים גיאו-מרחביים. למידע נוסף, ראו API של מערכי הנתונים של מפות Google

הגדרת התפקידים

כדי ליצור ולנהל מערכי נתונים בפרויקט ב-Google Cloud, צריך להיות לכם תפקיד IAM של בעלים או תפקיד עריכה בפרויקט.

לחלופין, תוכלו להקצות את תפקידי ה-IAM הבאים לחשבון משתמש או לחשבון שירות שבהם אתם משתמשים כדי לנהל מערכי נתונים:

  • התפקיד Maps Platform Datasets Admin מעניק למשתמש או לחשבון השירותים גישת קריאה/כתיבה למערכי הנתונים בפרויקט. התפקיד הזה מאפשר למשתמש לבצע את כל הפעולות במערך נתונים.
  • התפקיד Maps Platform Datasets Viewer מעניק הרשאת קריאה בלבד למערכי נתונים בפרויקט. התפקיד הזה מאפשר לבצע פעולות ברשימה, לקבל או להוריד נתונים מתוך מערך נתונים.

תוכלו לקרוא מידע נוסף במאמר איך נותנים תפקיד IAM באמצעות מסוף Google Cloud.

מקור נתונים של מערך נתונים

אחרי שיוצרים מערך נתונים, צריך להעלות את הנתונים למערך הנתונים מ-Google Cloud Storage או מקובץ מקומי.
  • כשמעלים נתונים מ-Cloud Storage, צריך לציין את הנתיב של הקובץ למשאב שמכיל את הנתונים ב-Cloud Storage. הנתיב הזה הוא בפורמט gs://GCS_BUCKET/FILE.

    למשתמש שמבצע את הבקשה נדרש התפקיד Storage Object Viewer, או כל תפקיד אחר שכולל את ההרשאה storage.objects.get. למידע נוסף על ניהול הגישה ל-Cloud Storage, קראו את הסקירה הכללית על בקרת הגישה.

  • כשמעלים נתונים מקובץ מקומי, צריך לציין את הנתיב לקובץ GeoJSON, KML או CSV שמכיל את הנתונים להעלאה.

דרישות מוקדמות

כשיוצרים מערך נתונים:

  • השמות המוצגים צריכים להיות ייחודיים בפרויקט ב-Google Cloud.
  • שמות תצוגה חייבים להיות קטנים מ-64 בייטים (מכיוון שהתווים האלה מיוצגים ב-UTF-8, בשפות מסוימות כל תו יכול להיות מיוצג על ידי מספר בייטים).
  • התיאורים חייבים להיות בגודל של פחות מ-1,000 בייטים.

כשמעלים נתונים:

  • סוגי הקבצים הנתמכים הם CSV , GeoJSON ו-KML.
  • גודל הקובץ המקסימלי הנתמך הוא 350MB.
  • שמות עמודות של מאפיינים לא יכולים להתחיל במחרוזת "?_".
  • אין תמיכה בגאומטריה תלת-ממדית. זה כולל את הסיומת "Z" בפורמט WKT, ואת קואורדינטת הגובה בפורמט GeoJSON.

דרישות לשימוש ב-GeoJSON

ה-API של JavaScript במפות Google תומך במפרט הנוכחי של GeoJSON. Maps JavaScript API תומך גם בקובצי GeoJSON שמכילים כל אחד מסוגי האובייקטים הבאים:

  • אובייקטים גיאומטריים. אובייקט גיאומטרי הוא צורה מרחבית, המתוארת כאיחוד של נקודות, קווים ומצולעים עם חורים אופציונליים.
  • אובייקטי Feature. אובייקט תכונה מכיל גיאומטריה ועוד צמדים של שם/ערך, שהמשמעות שלהם ספציפית לאפליקציה.
  • אוספים של תכונות אוסף תכונות הוא קבוצה של אובייקטים של תכונות.

Maps JavaScript API לא תומך בקובצי GeoJSON שיש בהם נתונים במערכת הפניה לקואורדינטות (CRS) מלבד WGS84.

למידע נוסף על GeoJSON, אפשר לעיין במאמר תאימות לתקן RFC 7946.

דרישות לקובצי KML

על Maps JavaScript API לעמוד בדרישות הבאות:

  • כל כתובות ה-URL חייבות להיות מקומיות (או יחסיות) לקובץ עצמו.
  • תמיכה בגאומטריה של נקודה, קווים ופוליגונים.
  • כל מאפייני הנתונים נחשבים למחרוזות.
תכונות KML הבאות לא נתמכות:
  • סמלים או <styleUrl> שמוגדרים מחוץ לקובץ.
  • קישורי רשת, כמו <NetworkLink>
  • שכבות-על של פני השטח, כמו <GroundOverlay>
  • צורות גיאומטריות תלת-ממדיות או תגים אחרים שקשורים לגובה, כמו <altitudeMode>
  • מפרטי מצלמה כמו <LookAt>
  • סגנונות שמוגדרים בקובץ ה-KML.

דרישות לקובץ CSV

בקובצי CSV, שמות העמודות הנתמכות מפורטים למטה לפי סדר עדיפות:

  • latitude, longitude
  • lat, long
  • x, y
  • wkt (טקסט ידוע)
  • address, city, state, zip
  • address
  • עמודה אחת שמכילה את כל פרטי הכתובת, למשל 1600 Amphitheatre Parkway Mountain View, CA 94043

לדוגמה, הקובץ מכיל עמודות בשם x, y ו-wkt. הערכים x ו-y מקבלים עדיפות גבוהה יותר, כך שנקבע לפי הסדר של שמות העמודות הנתמכים ברשימה שלמעלה, המערכת תתעלם מהערכים בעמודות x ו-y ותתעלם מהעמודה wkt.

כמו כן:

  • כל שם עמודה חייב להשתייך לעמודה אחת. כלומר, לא יכולה להיות עמודה בשם xy שמכילה נתוני קואורדינטות x וגם y. הקואורדינטות של ה-x וה-y חייבות להיות בעמודות נפרדות.
  • שמות העמודות הם לא תלויי-רישיות.
  • אין חשיבות לסדר של שמות העמודות. לדוגמה, אם קובץ ה-CSV מכיל עמודות lat ו-long, הן יכולות להופיע בכל סדר שהוא.

טיפול בשגיאות בהעלאת נתונים

כשמעלים נתונים למערך נתונים, יכול להיות שתיתקלו באחת מהשגיאות הנפוצות שמתוארות בקטע הזה.

שגיאות GeoJSON

שגיאות GeoJSON נפוצות כוללות:

  • השדה type חסר, או ש-type אינו מחרוזת. קובץ הנתונים שהעלית מסוג GeoJSON צריך להכיל שדה מחרוזת בשם type כחלק מכל הגדרה של אובייקט Feature ושל אובייקט גיאומטריה.

שגיאות KML

שגיאות KML נפוצות כוללות:

  • קובץ הנתונים לא יכול להכיל את תכונות ה-KML שאינן נתמכות, המפורטות למעלה. אחרת, ייבוא הנתונים עלול להיכשל.

שגיאות בקובץ CSV

שגיאות CSV נפוצות:

  • בחלק מהשורות חסרים ערכים בעמודה גיאומטרית. כל השורות בקובץ CSV צריכות להכיל ערכים שאינם ריקים לעמודות הגאומטריה. עמודות הגאומטריה כוללות:
    • latitude, longitude
    • lat, long
    • x, y
    • wkt
    • address, city, state, zip
    • address
    • עמודה אחת שמכילה את כל פרטי הכתובת, למשל 1600 Amphitheatre Parkway Mountain View, CA 94043
  • אם x ו-y הן העמודות בגאומטריה, צריך לוודא שהיחידות הן קווי אורך ורוחב. בחלק ממערכי הנתונים הציבוריים נעשה שימוש במערכות קואורדינטות שונות בכותרות x ו-y. אם ייעשה שימוש ביחידות שגויות, ייתכן שהייבוא של מערך הנתונים יושלם בהצלחה, אבל הנתונים לאחר העיבוד עשויים להציג את הנקודות של מערכי הנתונים במיקומים לא צפויים.

יצירת מערך נתונים

כך יוצרים מערך נתונים:

  1. במסוף Google Cloud, נכנסים לדף Dataset.
  2. לוחצים על יצירת מערך נתונים.
  3. מזינים את השם של מערך הנתונים. השם חייב להיות ייחודי בכל מערכי הנתונים.
  4. אפשר גם להזין תיאור של מערך נתונים.
  5. לוחצים על המשך. מופיע הדף ייבוא נתונים.
  6. בוחרים את מקור ההעלאה של הנתונים שמשמשים לאכלוס מערך הנתונים בתור מחשב. כלומר, קובץ מקומי במערכת שלכם, או קטגוריה של Google Cloud Storage.
    • ב-Desktop לוחצים על Browse ובוחרים את הקובץ מבורר הקבצים.
    • בקטגוריה של Google Cloud Storage, לוחצים על Browse ובוחרים את הקטגוריה והקובץ שמכילים את הנתונים.
  7. בוחרים את פורמט הקובץ.
  8. לוחצים על המשך כדי לבדוק את ההגדרות.
  9. לוחצים על יצירה. יופיע הדף Datasets (מערכי נתונים) שבו מוצגים מערך הנתונים החדש. הסטטוס אמור להיות נמצא בעיבוד.
  10. ממתינים עד שהסטטוס של מערך הנתונים יהיה הושלם.

הצגה או שינוי של מערך נתונים

אחרי שמערך הנתונים נוצר בהצלחה, הסטטוס שלו מופיע בתור הושלם. לאחר מכן אפשר לבחון את הפרטים של מערך הנתונים.

כדי להציג את מערך הנתונים:

  1. במסוף Google Cloud, נכנסים לדף Dataset.
  2. לוחצים על השם של מערך הנתונים. יופיע הדף פרטי מערך הנתונים.
    1. לוחצים על הכרטיסייה Details כדי להציג מידע על מערך הנתונים. בכרטיסייה הזו אפשר גם לערוך את השם והתיאור של מערך הנתונים.
    2. לוחצים על הכרטיסייה Preview (תצוגה מקדימה) כדי להציג את מערך הנתונים על המפה.
    3. לוחצים על הכרטיסייה Table Data כדי להציג קבוצת משנה של הנתונים שמשויכים למערך הנתונים.
    4. לוחצים על הלחצן הורדה כדי להוריד את הנתונים לקובץ מקומי.
    5. לוחצים על הלחצן מחיקה כדי למחוק את מערך הנתונים.