आरंभ करने से पहले

इस दस्तावेज़ में, डेटासेट के साथ काम करने के लिए ज़रूरी शर्तें, सबसे सही तरीके, और आम तौर पर होने वाली गड़बड़ियों के बारे में बताया गया है.

ज़रूरी शर्तें

डेटासेट बनाते समय:

  • आपके Google Cloud प्रोजेक्ट में, डिसप्ले नेम यूनीक होने चाहिए.
  • डिसप्ले नेम 64 बाइट से कम होने चाहिए. ऐसा इसलिए, क्योंकि इन वर्णों को यूटीएफ़-8 में दिखाया जाता है, कुछ भाषाओं में, हर वर्ण को दिखाने के लिए एक से ज़्यादा बाइट इस्तेमाल की जा सकती हैं.
  • ब्यौरे 1,000 बाइट से कम होने चाहिए.

डेटा अपलोड करते समय:

  • CSV, GeoJSON, और KML फ़ाइलें इस्तेमाल की जा सकती हैं.
  • ज़्यादा से ज़्यादा 500 एमबी की फ़ाइल अपलोड की जा सकती है.
  • एट्रिब्यूट कॉलम के नाम, "?_" स्ट्रिंग से शुरू नहीं हो सकते.
  • थ्री-डाइमेंशनल ज्यामिति का इस्तेमाल नहीं किया जा सकता. इसमें WKT फ़ॉर्मैट में "Z" सफ़िक्स, और GeoJSON फ़ॉर्मैट में ऊंचाई का कोऑर्डिनेट शामिल है.

डेटा तैयार करने के सबसे सही तरीके

अगर आपका सोर्स डेटा जटिल या बड़ा है, जैसे कि घने पॉइंट, लंबी लाइनस्ट्रिंग या पॉलीगॉन (अक्सर 50 एमबी से ज़्यादा साइज़ वाली सोर्स फ़ाइलें इस कैटगरी में आती हैं), तो विज़ुअल मैप में बेहतर परफ़ॉर्मेंस पाने के लिए, अपलोड करने से पहले अपने डेटा को आसान बनाएं.

अपना डेटा तैयार करने के कुछ सबसे सही तरीके यहां दिए गए हैं:

  1. सुविधा की प्रॉपर्टी कम से कम रखें. अपने मैप को स्टाइल करने के लिए, सिर्फ़ उन प्रॉपर्टी को रखें जिनकी ज़रूरत है. उदाहरण के लिए, "id" और "category". क्लाइंट ऐप्लिकेशन में, यूनीक आइडेंटिफ़ायर की की मदद से, डेटा-ड्रिवन स्टाइल का इस्तेमाल करके, किसी सुविधा में अतिरिक्त प्रॉपर्टी जोड़ी जा सकती हैं. उदाहरण के लिए, डेटा-ड्रिवन स्टाइलिंग की मदद से, रीयल टाइम में अपना डेटा देखना लेख पढ़ें.
  2. प्रॉपर्टी ऑब्जेक्ट के लिए, जहां तक हो सके डेटा के आसान टाइप इस्तेमाल करें. जैसे, इंटिजर. इससे टाइल का साइज़ कम होता है और मैप की परफ़ॉर्मेंस बेहतर होती है.
  3. फ़ाइल अपलोड करने से पहले, जटिल ज्यामिति को आसान बनाएं. इसके लिए, अपनी पसंद का कोई भी जियोस्पेशल टूल इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स Mapshaper.org यूटिलिटी. इसके अलावा, जटिल पॉलीगॉन ज्यामिति पर ST_Simplify का इस्तेमाल करके, BigQuery में भी ऐसा किया जा सकता है.
  4. फ़ाइल अपलोड करने से पहले, बहुत घने पॉइंट को क्लस्टर करें. इसके लिए, अपनी पसंद का कोई भी जियोस्पेशल टूल इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स turf.js क्लस्टर फ़ंक्शन. इसके अलावा, घने पॉइंट ज्यामिति पर ST_CLUSTERDBSCAN का इस्तेमाल करके, BigQuery में भी ऐसा किया जा सकता है.

डेटासेट के सबसे सही तरीकों के बारे में ज़्यादा जानकारी के लिए, डेटासेट और BigQuery की मदद से अपना डेटा विज़ुअलाइज़ करना लेख पढ़ें.

GeoJSON के लिए ज़रूरी शर्तें

Maps Datasets API, GeoJSON के मौजूदा स्पेसिफ़िकेशन के साथ काम करता है . Maps Datasets API, GeoJSON फ़ाइलों के साथ भी काम करता है. इनमें ये ऑब्जेक्ट टाइप शामिल हो सकते हैं:

  • ज्यामिति ऑब्जेक्ट. ज्यामिति ऑब्जेक्ट, जगह के हिसाब से आकार होता है. इसे पॉइंट, लाइन, और पॉलीगॉन के यूनियन के तौर पर दिखाया जाता है. इसमें वैकल्पिक तौर पर छेद भी हो सकते हैं.
  • सुविधा ऑब्जेक्ट. सुविधा ऑब्जेक्ट में, ज्यामिति के साथ-साथ अतिरिक्त नाम/वैल्यू के जोड़े भी शामिल होते हैं. इनका मतलब, ऐप्लिकेशन के हिसाब से अलग-अलग हो सकता है.
  • सुविधा कलेक्शन. सुविधा कलेक्शन, सुविधा ऑब्जेक्ट का सेट होता है.

Maps Datasets API, WGS84 के अलावा किसी अन्य कोऑर्डिनेट रेफ़रंस सिस्टम (सीआरएस) में डेटा वाली GeoJSON फ़ाइलों के साथ काम नहीं करता है.

GeoJSON के बारे में ज़्यादा जानकारी के लिए, आरएफ़सी 7946 के मुताबिक काम करने की ज़रूरी शर्तें देखें.

KML के लिए ज़रूरी शर्तें

Maps Datasets API के लिए ये ज़रूरी शर्तें हैं:

  • सभी यूआरएल, फ़ाइल के लोकल (या रिलेटिव) होने चाहिए.
  • पॉइंट, लाइन, और पॉलीगॉन ज्यामिति का इस्तेमाल किया जा सकता है.
  • सभी डेटा एट्रिब्यूट को स्ट्रिंग माना जाता है.
KML की इन सुविधाओं का इस्तेमाल नहीं किया जा सकता:
  • फ़ाइल के बाहर तय किए गए आइकॉन या <styleUrl>.
  • नेटवर्क लिंक, जैसे कि <NetworkLink>
  • ग्राउंड ओवरले, जैसे कि <GroundOverlay>
  • 3D ज्यामिति या ऊंचाई से जुड़े कोई भी टैग, जैसे कि <altitudeMode>
  • कैमरा स्पेसिफ़िकेशन, जैसे कि <LookAt>
  • KML फ़ाइल में तय की गई स्टाइल.

CSV के लिए ज़रूरी शर्तें

CSV फ़ाइलों के लिए, प्राथमिकता के क्रम में कॉलम के ये नाम इस्तेमाल किए जा सकते हैं:

  • latitude, longitude
  • lat, long
  • x, y
  • wkt (वेल-नोन टेक्स्ट)
  • address, city, state, zip
  • address
  • एक कॉलम जिसमें पते की पूरी जानकारी हो. जैसे, 1600 Amphitheatre Parkway Mountain View, CA 94043

उदाहरण के लिए, आपकी फ़ाइल में x, y, और wkt नाम के कॉलम हैं. x और y की प्राथमिकता ज़्यादा है. इसकी जानकारी, ऊपर दी गई सूची में कॉलम के नामों के क्रम से मिलती है. इसलिए, x और y कॉलम में मौजूद वैल्यू का इस्तेमाल किया जाता है और wkt कॉलम को अनदेखा कर दिया जाता है.

इसके अलावा:

  • हर कॉलम का नाम, सिर्फ़ एक कॉलम से जुड़ा होना चाहिए. इसका मतलब है कि आपके पास xy नाम का कोई कॉलम नहीं हो सकता, जिसमें x और y, दोनों के कोऑर्डिनेट का डेटा हो. x और y कोऑर्डिनेट, अलग-अलग कॉलम में होने चाहिए.
  • कॉलम के नाम केस-इनसेंसिटिव होते हैं.
  • कॉलम के नामों के क्रम से कोई फ़र्क़ नहीं पड़ता. उदाहरण के लिए, अगर आपकी CSV फ़ाइल में lat और long कॉलम हैं, तो वे किसी भी क्रम में हो सकते हैं.

डेटा अपलोड करने में होने वाली गड़बड़ियों को ठीक करना

किसी डेटासेट में डेटा अपलोड करते समय, आपको इस सेक्शन में बताई गई सामान्य गड़बड़ियों में से कोई एक गड़बड़ी हो सकती है.

GeoJSON से जुड़ी गड़बड़ियां

GeoJSON से जुड़ी सामान्य गड़बड़ियां:

  • type फ़ील्ड मौजूद नहीं है या type स्ट्रिंग नहीं है. अपलोड की गई GeoJSON डेटा फ़ाइल में, type नाम का एक स्ट्रिंग फ़ील्ड होना चाहिए. यह फ़ील्ड, हर सुविधा ऑब्जेक्ट और ज्यामिति ऑब्जेक्ट की परिभाषा का हिस्सा होना चाहिए.

KML से जुड़ी गड़बड़ियां

KML से जुड़ी सामान्य गड़बड़ियां:

  • डेटा फ़ाइल में, ऊपर बताई गई KML की ऐसी कोई सुविधा नहीं होनी चाहिए जिसका इस्तेमाल नहीं किया जा सकता. ऐसा न होने पर, डेटा इंपोर्ट नहीं हो पाएगा.

CSV से जुड़ी गड़बड़ियां

CSV से जुड़ी सामान्य गड़बड़ियां:

  • कुछ लाइनों में, ज्यामिति कॉलम की वैल्यू मौजूद नहीं हैं. CSV फ़ाइल की सभी लाइनों में, ज्यामिति कॉलम के लिए कोई न कोई वैल्यू होनी चाहिए. ज्यामिति कॉलम में ये शामिल हैं:
    • latitude, longitude
    • lat, long
    • x, y
    • wkt
    • address, city, state, zip
    • address
    • एक कॉलम जिसमें पते की पूरी जानकारी हो. जैसे, 1600 Amphitheatre Parkway Mountain View, CA 94043
  • अगर x और y आपके ज्यामिति कॉलम हैं, तो पक्का करें कि यूनिट, देशांतर और अक्षांश हों. कुछ सार्वजनिक डेटासेट, x और y हेडर के तहत अलग-अलग कोऑर्डिनेट सिस्टम का इस्तेमाल करते हैं. अगर गलत यूनिट का इस्तेमाल किया जाता है, तो डेटासेट शायद इंपोर्ट हो जाए. हालांकि, रेंडर किए गए डेटा में, डेटासेट के पॉइंट, गलत जगहों पर दिख सकते हैं.