इस दस्तावेज़ में, डेटासेट के साथ काम करने से जुड़ी ज़रूरी शर्तों, सबसे सही तरीकों, और आम तौर पर होने वाली गड़बड़ियों के बारे में बताया गया है.
ज़रूरी शर्तें
डेटासेट बनाते समय:
- आपके Google Cloud प्रोजेक्ट में, डिसप्ले नेम यूनीक होने चाहिए.
- डिसप्ले नेम 64 बाइट से कम होने चाहिए. ऐसा इसलिए है, क्योंकि इन वर्णों को UTF-8 में दिखाया जाता है. कुछ भाषाओं में, हर वर्ण को कई बाइट में दिखाया जा सकता है.
- ब्यौरे 1,000 बाइट से कम होने चाहिए.
डेटा अपलोड करते समय:
- CSV, GeoJSON, और KML फ़ाइल फ़ॉर्मैट का इस्तेमाल किया जा सकता है.
- ज़्यादा से ज़्यादा 500 एमबी की फ़ाइल ही अपलोड की जा सकती है.
- एट्रिब्यूट कॉलम के नाम, "?_" स्ट्रिंग से शुरू नहीं हो सकते.
- तीन डाइमेंशन वाली ज्यामिति का इस्तेमाल नहीं किया जा सकता. इसमें WKT फ़ॉर्मैट में "Z" सफ़िक्स और GeoJSON फ़ॉर्मैट में ऊंचाई का कोऑर्डिनेट शामिल होता है.
डेटा तैयार करने के सबसे सही तरीके
अगर आपका सोर्स डेटा जटिल या बड़ा है, जैसे कि घने पॉइंट, लंबी लाइनस्ट्रिंग या पॉलीगॉन (आम तौर पर, 50 एमबी से बड़ी सोर्स फ़ाइलें इस कैटगरी में आती हैं), तो विज़ुअल मैप में सबसे अच्छी परफ़ॉर्मेंस पाने के लिए, अपलोड करने से पहले अपने डेटा को आसान बनाएं.
डेटा तैयार करने के कुछ सबसे सही तरीके यहां दिए गए हैं:
- सुविधा की प्रॉपर्टी कम करें. अपने मैप को स्टाइल देने के लिए, सिर्फ़ ज़रूरी फ़ीचर प्रॉपर्टी रखें. उदाहरण के लिए, "आईडी" और "कैटगरी". यूनीक आइडेंटिफ़ायर कुंजी पर डेटा-ड्रिवन स्टाइल का इस्तेमाल करके, क्लाइंट ऐप्लिकेशन में किसी सुविधा में अन्य प्रॉपर्टी जोड़ी जा सकती हैं. उदाहरण के लिए, देखें कि डेटा-ड्रिवन स्टाइलिंग की मदद से, रीयल टाइम में अपना डेटा कैसे देखा जा सकता है.
- टाइल के साइज़ को कम करने और मैप की परफ़ॉर्मेंस को बेहतर बनाने के लिए, जहां भी हो सके वहां प्रॉपर्टी ऑब्जेक्ट के लिए साधारण डेटा टाइप का इस्तेमाल करें. जैसे, पूर्णांक.
- फ़ाइल अपलोड करने से पहले, जटिल ज्यामिति को आसान बनाएं. ऐसा करने के लिए, अपनी पसंद के किसी भी भू-स्थानिक टूल का इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स Mapshaper.org की सुविधा या BigQuery में, जटिल पॉलीगॉन ज्यामिति पर ST_Simplify का इस्तेमाल करना.
- फ़ाइल अपलोड करने से पहले, बहुत ज़्यादा पॉइंट को क्लस्टर करें. ऐसा करने के लिए, अपनी पसंद के किसी भी भू-स्थानिक टूल का इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स turf.js क्लस्टर फ़ंक्शन या BigQuery में, घने पॉइंट ज्यामिति पर ST_CLUSTERDBSCAN का इस्तेमाल करना.
डेटासेट और BigQuery की मदद से अपना डेटा विज़ुअलाइज़ करना लेख में, डेटासेट के सबसे सही तरीकों के बारे में ज़्यादा जानकारी देखें.
GeoJSON की ज़रूरी शर्तें
Maps डेटासेट एपीआई, मौजूदा GeoJSON स्पेसिफ़िकेशन के साथ काम करता है. Maps डेटासेट एपीआई, GeoJSON फ़ाइलों के साथ भी काम करता है. इन फ़ाइलों में, इनमें से कोई भी ऑब्जेक्ट टाइप शामिल हो सकता है:
- ज्यामिति ऑब्जेक्ट. ज्यामिति ऑब्जेक्ट, जगह की जानकारी देने वाला आकार होता है. इसे पॉइंट, लाइनों, और पॉलीगॉन के यूनियन के तौर पर दिखाया जाता है. इसमें होल भी हो सकते हैं.
- सुविधा ऑब्जेक्ट. किसी फ़ीचर ऑब्जेक्ट में ज्यामिति के साथ-साथ, नाम/वैल्यू के अतिरिक्त जोड़े भी होते हैं. इनका मतलब, ऐप्लिकेशन के हिसाब से अलग-अलग होता है.
- सुविधा वाले कलेक्शन. फ़ीचर कलेक्शन, फ़ीचर ऑब्जेक्ट का एक सेट होता है.
Maps डेटासेट API, ऐसी GeoJSON फ़ाइलों के साथ काम नहीं करता जिनमें WGS84 के अलावा किसी दूसरे कोऑर्डिनेट रेफ़रंस सिस्टम (सीआरएस) में डेटा हो.
GeoJSON के बारे में ज़्यादा जानकारी के लिए, आरएफ़सी 7946 के मुताबिक देखें.
KML की ज़रूरी शर्तें
Maps Datasets API के लिए ये ज़रूरी शर्तें हैं:
- सभी यूआरएल, फ़ाइल के लिए लोकल (या रिलेटिव) होने चाहिए.
- पॉइंट, लाइन, और पॉलीगॉन ज्यामिति काम करती है.
- सभी डेटा एट्रिब्यूट को स्ट्रिंग माना जाता है.
- फ़ाइल के बाहर तय किए गए आइकॉन या
<styleUrl>. - नेटवर्क लिंक, जैसे कि
<NetworkLink> - ग्राउंड ओवरले, जैसे कि
<GroundOverlay> - 3D ज्यामिति या ऊंचाई से जुड़े टैग, जैसे कि
<altitudeMode> - कैमरे की जानकारी, जैसे कि
<LookAt> - KML फ़ाइल में तय की गई स्टाइल.
CSV फ़ाइल से जुड़ी ज़रूरी शर्तें
CSV फ़ाइलों के लिए, काम करने वाले कॉलम के नाम प्राथमिकता के क्रम में यहां दिए गए हैं:
latitude,longitudelat,longx,ywkt(Well-Known Text)address,city,state,zipaddress- एक कॉलम में पते की पूरी जानकारी, जैसे कि
1600 Amphitheatre Parkway Mountain View, CA 94043
उदाहरण के लिए, आपकी फ़ाइल में x, y, और wkt नाम के कॉलम हैं.
ऊपर दी गई सूची में, इस्तेमाल किए जा सकने वाले कॉलम के नामों के क्रम से यह तय किया जाता है कि x और y की प्राथमिकता ज़्यादा है. इसलिए, x और y कॉलम की वैल्यू का इस्तेमाल किया जाता है और wkt कॉलम को अनदेखा कर दिया जाता है.
इसके अलावा:
- हर कॉलम का नाम, किसी एक कॉलम से जुड़ा होना चाहिए. इसका मतलब है कि आपके पास
xyनाम का ऐसा कॉलम नहीं हो सकता जिसमें x और y, दोनों निर्देशांक का डेटा हो. x और y कोऑर्डिनेट, अलग-अलग कॉलम में होने चाहिए. - कॉलम के नाम केस-इनसेंसिटिव होते हैं.
- कॉलम के नामों के क्रम से कोई फ़र्क़ नहीं पड़ता. उदाहरण के लिए, अगर आपकी CSV फ़ाइल में
latऔरlongकॉलम हैं, तो वे किसी भी क्रम में हो सकते हैं.
डेटा अपलोड करने से जुड़ी गड़बड़ियां ठीक करना
किसी डेटासेट में डेटा अपलोड करते समय, आपको इस सेक्शन में बताई गई सामान्य गड़बड़ियों में से कोई एक गड़बड़ी दिख सकती है.
GeoJSON से जुड़ी गड़बड़ियां
GeoJSON में होने वाली आम गड़बड़ियां:
typeफ़ील्ड मौजूद नहीं है याtypeकोई स्ट्रिंग नहीं है. अपलोड की गई GeoJSON डेटा फ़ाइल में, हर फ़ीचर ऑब्जेक्ट और ज्यामिति ऑब्जेक्ट की परिभाषा के हिस्से के तौर पर,typeनाम का एक स्ट्रिंग फ़ील्ड होना चाहिए.
KML से जुड़ी गड़बड़ियां
KML फ़ाइल में होने वाली आम गड़बड़ियां:
- डेटा फ़ाइल में, ऊपर दी गई उन KML सुविधाओं में से कोई भी सुविधा नहीं होनी चाहिए जो काम नहीं करती हैं. ऐसा होने पर, डेटा इंपोर्ट नहीं हो पाएगा.
CSV फ़ाइल में गड़बड़ियां
CSV फ़ाइल में होने वाली आम गड़बड़ियां:
- कुछ पंक्तियों में ज्यामिति कॉलम की वैल्यू मौजूद नहीं हैं. CSV फ़ाइल की सभी लाइनों में, ज्यामिति कॉलम के लिए ऐसी वैल्यू होनी चाहिए जो खाली न हों. ज्यामिति कॉलम में ये शामिल हैं:
latitude,longitudelat,longx,ywktaddress,city,state,zipaddress- एक कॉलम में पते की पूरी जानकारी, जैसे कि
1600 Amphitheatre Parkway Mountain View, CA 94043
- अगर
xऔरyआपके ज्यामिति कॉलम हैं, तो पक्का करें कि इकाइयां, देशांतर और अक्षांश हों. कुछ सार्वजनिक डेटासेट, हेडरxऔरyके तहत अलग-अलग निर्देशांक सिस्टम का इस्तेमाल करते हैं. गलत यूनिट का इस्तेमाल करने पर, डेटासेट को इंपोर्ट किया जा सकता है. हालांकि, रेंडर किए गए डेटा में डेटासेट पॉइंट, अनचाही जगहों पर दिख सकते हैं.