- डेटासेट की उपलब्धता
- 2017-01-01T00:00:00Z–2025-01-01T00:00:00Z
- डेटासेट प्रोड्यूसर
- Google Earth Engine Google DeepMind Google Earth Engine
- टैग
ब्यौरा
Google Satellite Embedding डेटासेट, दुनिया भर के जियोस्पेशल एम्बेडिंग का एक ऐसा कलेक्शन है जिसका इस्तेमाल विश्लेषण के लिए किया जा सकता है. इस डेटासेट में मौजूद हर 10 मीटर पिक्सल, 64 डाइमेंशन वाला एक ऐसा डेटा है जिसे "एम्बेडिंग वेक्टर" कहा जाता है. यह डेटा, एक कैलेंडर साल के दौरान पृथ्वी की निगरानी करने वाले अलग-अलग उपकरणों और डेटासेट से मिले डेटा के आधार पर, उस पिक्सल और उसके आस-पास की सतह की स्थितियों के बारे में बताता है. पारंपरिक स्पेक्ट्रल इनपुट और इंडेक्स में, बैंड फ़िज़िकल मेज़रमेंट से जुड़े होते हैं. वहीं, एम्बेडिंग ऐसे फ़ीचर वेक्टर होते हैं जो अलग-अलग सोर्स और अलग-अलग मोड से मिले डेटा के बीच के संबंध को कम शब्दों में बताते हैं. इन्हें सीधे तौर पर समझना मुश्किल होता है, लेकिन ये ज़्यादा असरदार होते हैं. इस्तेमाल के उदाहरण और ज़्यादा जानकारी देखें.
इस डेटासेट में, ज़मीन की सतहों और कम गहरे पानी को शामिल किया गया है. इसमें इंटरटाइडल और रीफ़ ज़ोन, नदियों, और तटीय जलमार्गों को भी शामिल किया गया है. सैटलाइट की कक्षाओं और इंस्ट्रुमेंट कवरेज की वजह से, ध्रुवों पर कवरेज सीमित है.
इस कलेक्शन में ऐसी इमेज शामिल हैं जो करीब 163,840 मीटर x 163,840 मीटर के इलाके को कवर करती हैं. हर इमेज में 64 बैंड {A00, A01, …, A63} होते हैं. इनमें से हर बैंड, 64D एंबेडिंग स्पेस के हर ऐक्सिस के लिए होता है. सभी बैंड का इस्तेमाल, डाउनस्ट्रीम विश्लेषण के लिए किया जाना चाहिए. ऐसा इसलिए, क्योंकि ये सभी मिलकर एम्बेडिंग स्पेस में 64D कोऑर्डिनेट को दिखाते हैं. साथ ही, इन्हें अलग-अलग तरीके से नहीं समझा जा सकता.
सभी इमेज, उनके लोकल यूनिवर्सल ट्रांसवर्स मरकेटर प्रोजेक्शन में जनरेट की जाती हैं. जैसा कि UTM_ZONE प्रॉपर्टी से पता चलता है. साथ ही, इनमें system:time_start और system:time_end प्रॉपर्टी होती हैं, जो एम्बेडिंग से मिले कैलेंडर साल को दिखाती हैं. उदाहरण के लिए, साल 2021 के लिए एम्बेड की गई इमेज में, system:start_time की वैल्यू ee.Date('2021-01-01 00:00:00') के बराबर होगी और system:end_time की वैल्यू ee.Date('2022-01-01 00:00:00') के बराबर होगी.
ये एम्बेडिंग यूनिट-लेंथ की होती हैं. इसका मतलब है कि इनकी मेग्नीट्यूड वैल्यू 1 होती है. साथ ही, इन्हें सामान्य बनाने के लिए किसी अन्य प्रोसेस की ज़रूरत नहीं होती. इन्हें यूनिट स्फ़ियर में डिस्ट्रिब्यूट किया जाता है. इसलिए, ये क्लस्टरिंग एल्गोरिदम और ट्री-आधारित क्लासिफ़ायर के साथ इस्तेमाल करने के लिए सबसे सही होती हैं. एंबेडिंग स्पेस भी सालों तक एक जैसा रहता है. साथ ही, अलग-अलग सालों की एंबेडिंग का इस्तेमाल, स्थिति में हुए बदलाव का पता लगाने के लिए किया जा सकता है. इसके लिए, दो एंबेडिंग वेक्टर के बीच डॉट प्रॉडक्ट या ऐंगल को ध्यान में रखा जाता है. इसके अलावा, एम्बेडिंग को इस तरह से डिज़ाइन किया गया है कि उन्हें एक साथ जोड़ा जा सके. इसका मतलब है कि उन्हें एग्रीगेट करके, कम रिज़ॉल्यूशन वाली एम्बेडिंग बनाई जा सकती हैं. साथ ही, उन्हें वेक्टर अंकगणित के साथ बदला जा सकता है. इसके बावजूद, वे अपने सिमैंटिक मतलब और दूरी के संबंध को बनाए रखती हैं.
सैटलाइट एम्बेडिंग डेटासेट को AlphaEarth Foundations ने बनाया है. यह एक जियोस्पेशल एम्बेडिंग मॉडल है. यह ऑप्टिकल, रडार, LiDAR, और अन्य सोर्स (ब्राउन, काज़मिएर्स्की, पास्क्वेरेला वगैरह, 2025; प्रीप्रिंट यहां उपलब्ध है).
कई सेंसर और इमेज से मिले डेटा के आधार पर, इमेज के अलग-अलग हिस्सों की पहचान की जाती है. इसलिए, इमेज के अलग-अलग हिस्सों की पहचान करने से जुड़ी सामान्य समस्याएं हल हो जाती हैं. जैसे, बादलों की वजह से इमेज का धुंधला दिखना, स्कैन लाइनें, सेंसर से जुड़ी गड़बड़ियां या डेटा का मौजूद न होना. इससे, विश्लेषण के लिए तैयार की गई ऐसी सुविधाएं मिलती हैं जिनका इस्तेमाल आसानी से किया जा सकता है. इन्हें क्लासिफ़िकेशन, रिग्रेशन, और बदलाव का पता लगाने से जुड़े विश्लेषणों में, पृथ्वी की निगरानी करने वाले अन्य इमेज सोर्स की जगह सीधे तौर पर इस्तेमाल किया जा सकता है.
इस इमेज कलेक्शन में मौजूद एम्बेडिंग, AlphaEarth Foundations मॉडल के v2.1 वर्शन का इस्तेमाल करके जनरेट की गई थीं. इस वर्शन में, AlphaEarth Foundations पेपर में आकलन किए गए v2.0 मॉडल की तुलना में कई सुधार किए गए हैं. जैसे, ट्रेनिंग डेटासेट को फिर से जनरेट किया गया, ताकि अंटार्कटिका के ज़्यादा से ज़्यादा सैंपल शामिल किए जा सकें. पहले, सेंसर कवरेज सीमित होने की वजह से इन सैंपल को हटा दिया गया था. इससे ट्रेनिंग वीडियो सीक्वेंस की संख्या 84 लाख से बढ़कर 1 करोड़ 10 लाख से ज़्यादा हो गई. साथ ही, ट्रेनिंग के दौरान USDA NASS Cropland Data Layer को एक अतिरिक्त टारगेट के तौर पर शामिल किया गया. NLCD और CDL के लिए लॉस वेट को 0.50 से घटाकर 0.25 कर दिया गया. इसके अलावा, इनपुट सेंसर स्वैथ, टाइलिंग, और मल्टी-रिज़ॉल्यूशन पिक्सल टारगेट से जुड़े विज़ुअल आर्टफ़ैक्ट को बेहतर तरीके से कम करने के लिए, कई अन्य छोटे-मोटे बदलाव किए गए. इन बदलावों से, मॉडल की परफ़ॉर्मेंस पर कोई खास असर नहीं पड़ा. हालांकि, इससे एम्बेडिंग की क्वालिटी में सुधार हुआ.
हालांकि, बड़े पैमाने पर डेटा की उपलब्धता और डेटा के कुछ आर्टफ़ैक्ट अब भी मौजूद हैं. ये आम तौर पर, छोटे वेक्टर ऑफ़सेट को दिखाते हैं. साथ ही, आम तौर पर डाउनस्ट्रीम प्रोसेसिंग या नतीजों पर इनका कोई खास असर नहीं पड़ता.
यह डेटासेट, Google Cloud Storage (GCS) पर भी उपलब्ध है. इसके लिए, gs://alphaearth_foundations बकेट में जाएं. Google Cloud Console की मदद से, बकेट का कॉन्टेंट ब्राउज़ किया जा सकता है.
कृपया ध्यान दें कि इस बकेट को "अनुरोध करने वाला व्यक्ति पेमेंट करेगा" के तौर पर कॉन्फ़िगर किया गया है. इसका मतलब है कि आपको डेटा वापस पाने और डेटा ट्रांसफ़र करने के शुल्क को कवर करने के लिए, अपने एपीआई अनुरोधों के साथ बिलिंग प्रोजेक्ट शामिल करना होगा. डेटा स्ट्रक्चर के बारे में पूरी जानकारी के लिए, GCS के अनुरोधकर्ता से शुल्क लिया जाता है और बकेट के README दस्तावेज़ देखें.
अपडेट:
- 17-11-2025 से, एम्बेड की गई लेयर में DATASET_VERSION 1.1 है. इसमें 2017 की फिर से जनरेट की गई लेयर शामिल है. इसमें Sentinel-1 से मिली अतिरिक्त जानकारी शामिल है.
- 29-01-2026 से, 2025 के एम्बेड किए गए डेटा को यूटीएम ज़ोन के हिसाब से, कलेक्शन में लगातार जोड़ा जा रहा है. कृपया मौजूदा कवरेज के लिए, कलेक्शन देखें.
Google, हर साल सैटेलाइट एम्बेडिंग लेयर तैयार करता रहेगा. साथ ही, डिलीवरी में होने वाले किसी भी संभावित बदलाव के बारे में, कम से कम एक साल पहले सूचना देगा. हालांकि, यह इस बात पर निर्भर करेगा कि USGS और ESA से इनपुट डेटा स्ट्रीम उपलब्ध हैं या नहीं. डेटासेट तैयार करने के लिए, इन स्ट्रीम का इस्तेमाल किया जाता है.
बैंड
पिक्सल का साइज़
10 मीटर
बैंड
| नाम | इकाइयां | कम से कम | ज़्यादा से ज़्यादा | पिक्सल का साइज़ | ब्यौरा |
|---|---|---|---|---|---|
A00 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 0वां ऐक्सिस है. |
A01 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का पहला ऐक्सिस है. |
A02 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का दूसरा ऐक्सिस है. |
A03 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का तीसरा ऐक्सिस है. |
A04 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का चौथा ऐक्सिस है. |
A05 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का पांचवां ऐक्सिस है. |
A06 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का छठा ऐक्सिस है. |
A07 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का सातवाँ ऐक्सिस है. |
A08 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेडिंग वेक्टर का आठवां ऐक्सिस है. |
A09 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का नौवां ऐक्सिस. |
A10 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 10वां ऐक्सिस है. |
A11 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एंबेड किए जा रहे वेक्टर का 11वां ऐक्सिस. |
A12 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 12वां ऐक्सिस है. |
A13 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 13वां ऐक्सिस है. |
A14 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 14वां ऐक्सिस है. |
A15 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 15वां ऐक्सिस है. |
A16 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 16वां ऐक्सिस है. |
A17 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 17वां ऐक्सिस है. |
A18 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 18वां ऐक्सिस है. |
A19 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एंबेड किए जा रहे वेक्टर का 19वां ऐक्सिस. |
A20 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 20वां ऐक्सिस. |
A21 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 21वां ऐक्सिस. |
A22 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 22वां ऐक्सिस है. |
A23 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 23वां ऐक्सिस है. |
A24 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 24वां ऐक्सिस है. |
A25 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 25वां ऐक्सिस है. |
A26 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 26वां ऐक्सिस है. |
A27 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेडिंग वेक्टर का 27वां ऐक्सिस है. |
A28 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 28वां ऐक्सिस है. |
A29 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 29वां ऐक्सिस है. |
A30 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 30वां ऐक्सिस है. |
A31 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 31वां ऐक्सिस है. |
A32 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 32वां ऐक्सिस है. |
A33 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 33वां ऐक्सिस है. |
A34 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 34वां ऐक्सिस है. |
A35 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 35वां ऐक्सिस है. |
A36 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 36वां ऐक्सिस है. |
A37 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 37वां ऐक्सिस है. |
A38 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 38वां ऐक्सिस है. |
A39 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 39वां ऐक्सिस है. |
A40 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 40वां ऐक्सिस है. |
A41 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेडिंग वेक्टर का 41वां ऐक्सिस है. |
A42 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेडिंग वेक्टर का 42वां ऐक्सिस है. |
A43 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 43वां ऐक्सिस है. |
A44 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 44वां ऐक्सिस है. |
A45 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 45वां ऐक्सिस है. |
A46 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर की 46वीं ऐक्सिस है. |
A47 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 47वां ऐक्सिस है. |
A48 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 48वां ऐक्सिस है. |
A49 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 49वां ऐक्सिस है. |
A50 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 50वां ऐक्सिस. |
A51 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 51वां ऐक्सिस है. |
A52 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 52वां ऐक्सिस है. |
A53 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 53वां ऐक्सिस है. |
A54 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 54वां ऐक्सिस है. |
A55 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 55वां ऐक्सिस है. |
A56 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 56वां ऐक्सिस है. |
A57 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 57वां ऐक्सिस है. |
A58 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर की 58वीं ऐक्सिस है. |
A59 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 59वां ऐक्सिस है. |
A60 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 60वां ऐक्सिस है. |
A61 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 61वां ऐक्सिस है. |
A62 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 62वां ऐक्सिस है. |
A63 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 63वां ऐक्सिस. |
इमेज प्रॉपर्टी
सैटलाइट इमेज के डेटासेट की विशेषताएं
| नाम | टाइप | ब्यौरा |
|---|---|---|
| MODEL_VERSION | स्ट्रिंग | वर्शन स्ट्रिंग, इमेज बनाने के लिए इस्तेमाल किए गए मॉडल वर्शन की खास तौर पर पहचान करती है. |
| PROCESSING_SOFTWARE_VERSION | स्ट्रिंग | वर्शन स्ट्रिंग, मॉडल के डेटा को प्रोसेस करने वाले सॉफ़्टवेयर की खास तौर पर पहचान करती है. इस सॉफ़्टवेयर का इस्तेमाल इमेज बनाने के लिए किया जाता है. |
| UTM_ZONE | स्ट्रिंग | इमेज बनाने के लिए इस्तेमाल किए गए कोऑर्डिनेट रेफ़रंस सिस्टम का यूटीएम ज़ोन. |
| DATASET_VERSION | स्ट्रिंग | डेटासेट का वर्शन. |
इस्तेमाल की शर्तें
इस्तेमाल की शर्तें
इस डेटासेट को CC-BY 4.0 के तहत लाइसेंस मिला है. इसके लिए, एट्रिब्यूशन के तौर पर यह टेक्स्ट देना ज़रूरी है: "AlphaEarth Foundations Satellite Embedding dataset को Google और Google DeepMind ने बनाया है."
उद्धरण
ब्राउन, सी॰ F., काज़मिएर्स्की, एम. R., पास्क्वेरेला, वी जे., रक्लिज, डब्ल्यू. J., सैमसिकोवा, एम., चांग झांग, शेल्हमर, ई., लाहेरा, ई., विल्स, ओ., इल्यूशेंको, एस., गोरेलिक, एन., Zhang, L. L., अलज, एस॰, शेक्टर, ई., एस॰ अस्कय, ओवेन गिनन, मूर, आर., बूकूवालास, ए., & कोहली, पी॰(2025). AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data. arXiv preprint arXiv.2507.22291. doi:10.48550/arXiv.2507.22291
Earth Engine की मदद से एक्सप्लोर करें
कोड एडिटर (JavaScript)
// Load collection. var dataset = ee.ImageCollection('GOOGLE/SATELLITE_EMBEDDING/V1/ANNUAL'); // Point of interest. var point = ee.Geometry.Point(-121.8036, 39.0372); // Get embedding images for two years. var image1 = dataset .filterDate('2023-01-01', '2024-01-01') .filterBounds(point) .first(); var image2 = dataset .filterDate('2024-01-01', '2025-01-01') .filterBounds(point) .first(); // Visualize three axes of the embedding space as an RGB. var visParams = {min: -0.3, max: 0.3, bands: ['A01', 'A16', 'A09']}; Map.addLayer(image1, visParams, '2023 embeddings'); Map.addLayer(image2, visParams, '2024 embeddings'); // Calculate dot product as a measure of similarity between embedding vectors. // Note for vectors with a magnitude of 1, this simplifies to the cosine of the // angle between embedding vectors. var dotProd = image1 .multiply(image2) .reduce(ee.Reducer.sum()); // Add dot product to the map. Map.addLayer( dotProd, {min: 0, max: 1, palette: ['white', 'black']}, 'Similarity between years (brighter = less similar)' ); Map.centerObject(point, 12); Map.setOptions('SATELLITE');