- डेटासेट की उपलब्धता
- 2017-01-01T00:00:00Z–2025-01-01T00:00:00Z
- डेटासेट प्रोड्यूसर
- Google Earth Engine Google DeepMind
- टैग
ब्यौरा
Google Satellite Embedding डेटासेट, दुनिया भर के जियोस्पेशल एम्बेडिंग का एक ऐसा कलेक्शन है जिसका इस्तेमाल विश्लेषण के लिए किया जा सकता है. इस डेटासेट में मौजूद हर 10 मीटर पिक्सल, 64 डाइमेंशन वाला एक ऐसा प्रज़ेंटेशन है या "एम्बेडिंग वेक्टर" है जो एक कैलेंडर वर्ष में, पृथ्वी की निगरानी करने वाले अलग-अलग इंस्ट्रूमेंट और डेटासेट से मेज़र की गई, उस पिक्सल और उसके आस-पास की सतह की स्थितियों की टाइमलाइन को एन्कोड करता है. पारंपरिक स्पेक्ट्रल इनपुट और इंडेक्स में, बैंड फ़िज़िकल मेज़रमेंट से जुड़े होते हैं. वहीं, एम्बेडिंग ऐसे फ़ीचर वेक्टर होते हैं जो अलग-अलग सोर्स और अलग-अलग मोड से मिले डेटा के बीच के संबंध को कम शब्दों में बताते हैं. इन्हें सीधे तौर पर समझना मुश्किल होता है, लेकिन ये ज़्यादा असरदार होते हैं. इस्तेमाल के उदाहरण और ज़्यादा जानकारी देखें.
इस डेटासेट में, ज़मीन की सतह और कम गहरे पानी वाले इलाके शामिल हैं. जैसे, इंटरटाइडल और रीफ़ ज़ोन, नदियां, और तटीय जलमार्ग. सैटलाइट के ऑर्बिट और इंस्ट्रुमेंट कवरेज की वजह से, ध्रुवों पर कवरेज सीमित है.
इस कलेक्शन में ऐसी इमेज शामिल हैं जो करीब 1,63,840 मीटर x 1,63,840 मीटर के इलाके को कवर करती हैं. हर इमेज में 64 बैंड {A00, A01, …, A63} होते हैं. इनमें से हर बैंड, 64 डाइमेंशन वाले एंबेडिंग स्पेस के हर ऐक्सिस के लिए होता है. सभी बैंड का इस्तेमाल डाउनस्ट्रीम विश्लेषण के लिए किया जाना चाहिए, क्योंकि ये सभी मिलकर एम्बेडिंग स्पेस में 64D कोऑर्डिनेट को दिखाते हैं. साथ ही, इनका अलग-अलग विश्लेषण नहीं किया जा सकता.
सभी इमेज, उनके लोकल यूनिवर्सल ट्रांसवर्स मरकेटर प्रोजेक्शन में जनरेट की जाती हैं. यह जानकारी, UTM_ZONE प्रॉपर्टी से मिलती है. साथ ही, इनमें system:time_start और system:time_end प्रॉपर्टी होती हैं, जो एम्बेडिंग से मिले कैलेंडर साल की जानकारी दिखाती हैं. उदाहरण के लिए, साल 2021 के लिए एम्बेड की गई इमेज में, system:start_time की वैल्यू ee.Date('2021-01-01 00:00:00') और system:end_time की वैल्यू ee.Date('2022-01-01 00:00:00') होगी.
ये एम्बेडिंग यूनिट-लेंथ की होती हैं. इसका मतलब है कि इनका मैग्नीट्यूड 1 होता है और इन्हें किसी अन्य सामान्यीकरण की ज़रूरत नहीं होती. साथ ही, इन्हें यूनिट स्फ़ियर में डिस्ट्रिब्यूट किया जाता है. इससे ये क्लस्टरिंग एल्गोरिदम और ट्री-आधारित क्लासिफ़ायर के साथ इस्तेमाल करने के लिए बेहतर हो जाती हैं. एंबेडिंग स्पेस भी सालों तक एक जैसा रहता है. साथ ही, अलग-अलग सालों की एंबेडिंग का इस्तेमाल, स्थिति में हुए बदलाव का पता लगाने के लिए किया जा सकता है. इसके लिए, दो एंबेडिंग वेक्टर के बीच डॉट प्रॉडक्ट या ऐंगल को ध्यान में रखा जाता है. इसके अलावा, एम्बेडिंग को इस तरह से डिज़ाइन किया गया है कि उन्हें एक साथ जोड़ा जा सके. इसका मतलब है कि उन्हें एग्रीगेट करके, कम रिज़ॉल्यूशन वाली एम्बेडिंग बनाई जा सकती हैं. इसके अलावा, उन्हें वेक्टर अंकगणित के साथ बदला जा सकता है. इसके बावजूद, वे अपने सिमैंटिक मतलब और दूरी के संबंध को बनाए रखती हैं.
सैटलाइट एम्बेडिंग डेटासेट को AlphaEarth Foundations ने बनाया है. यह एक जियोस्पेशल एम्बेडिंग मॉडल है, जो ऑप्टिकल, रडार, LiDAR, और अन्य सोर्स (ब्राउन, काज़मिएर्स्की, पास्क्वेरेला वगैरह, 2025; प्रीप्रिंट यहां उपलब्ध है).
कई सेंसर और इमेज से मिले डेटा के आधार पर, इमेज के अलग-अलग हिस्सों की पहचान की जाती है. इसलिए, इमेज के अलग-अलग हिस्सों की पहचान करने से जुड़ी सामान्य समस्याएं हल हो जाती हैं. जैसे, बादलों की वजह से इमेज का धुंधला दिखना, स्कैन लाइन, सेंसर से जुड़ी गड़बड़ियां या डेटा का मौजूद न होना. इससे विश्लेषण के लिए तैयार की गई ऐसी सुविधाएं मिलती हैं जिनका इस्तेमाल आसानी से किया जा सकता है. इन्हें क्लासिफ़िकेशन, रिग्रेशन, और बदलाव का पता लगाने से जुड़े विश्लेषणों में, पृथ्वी की निगरानी करने वाले अन्य इमेज सोर्स की जगह सीधे तौर पर इस्तेमाल किया जा सकता है.
इस इमेज कलेक्शन में मौजूद एम्बेडिंग, AlphaEarth Foundations मॉडल के v2.1 वर्शन का इस्तेमाल करके जनरेट की गई थीं. इसमें AlphaEarth Foundations पेपर में आकलन किए गए v2.0 मॉडल की तुलना में कई सुधार किए गए हैं. जैसे, ट्रेनिंग डेटासेट को फिर से जनरेट किया गया, ताकि अंटार्कटिका के ज़्यादा से ज़्यादा सैंपल शामिल किए जा सकें. पहले, सेंसर कवरेज सीमित होने की वजह से इन सैंपल को हटा दिया गया था. इससे ट्रेनिंग के लिए वीडियो सीक्वेंस की संख्या 84 लाख से बढ़कर 1 करोड़ 10 लाख से ज़्यादा हो गई. साथ ही, ट्रेनिंग के दौरान यूएसडीए एनएएसएस क्रॉपलैंड डेटा लेयर को एक अतिरिक्त टारगेट के तौर पर शामिल किया गया. NLCD और CDL के लिए लॉस वेट को 0.50 से घटाकर 0.25 कर दिया गया. इसके अलावा, इनपुट सेंसर स्वैथ, टाइलिंग, और मल्टी-रिज़ॉल्यूशन पिक्सल टारगेट से जुड़े विज़ुअल आर्टफ़ैक्ट को बेहतर तरीके से कम करने के लिए, कई अन्य छोटे-मोटे बदलाव किए गए. इन बदलावों से, मॉडल की परफ़ॉर्मेंस पर कोई खास असर नहीं पड़ा. हालांकि, इससे एम्बेडिंग की क्वालिटी में सुधार हुआ.
हालांकि, बड़े पैमाने पर डेटा उपलब्ध होने से जुड़ी कुछ समस्याएं अब भी बनी हुई हैं. हालांकि, आम तौर पर ये समस्याएं वेक्टर ऑफ़सेट से जुड़ी होती हैं. साथ ही, इनसे आम तौर पर डाउनस्ट्रीम प्रोसेसिंग या नतीजों पर कोई खास असर नहीं पड़ता.
यह डेटासेट, Google Cloud Storage (GCS) पर भी उपलब्ध है. इसके लिए, gs://alphaearth_foundations बकेट में जाएं. Google Cloud Console की मदद से, बकेट का कॉन्टेंट ब्राउज़ किया जा सकता है.
कृपया ध्यान दें कि इस बकेट को "अनुरोध करने वाला व्यक्ति पेमेंट करेगा" के तौर पर कॉन्फ़िगर किया गया है. इसका मतलब है कि आपको डेटा वापस पाने और डेटा ट्रांसफ़र करने के शुल्क को कवर करने के लिए, अपने एपीआई अनुरोधों के साथ बिलिंग प्रोजेक्ट शामिल करना होगा. डेटा स्ट्रक्चर के बारे में पूरी जानकारी के लिए, GCS के अनुरोधकर्ता से शुल्क लिया जाता है और बकेट के README दस्तावेज़ देखें.
अपडेट:
- 17-11-2025 से, एम्बेड की गई लेयर में DATASET_VERSION 1.1 है. इसमें 2017 की फिर से जनरेट की गई लेयर शामिल है. इसमें Sentinel-1 से हासिल की गई अतिरिक्त जानकारी शामिल है.
- 29-01-2026 से, 2025 के एम्बेड किए गए डेटा को यूटीएम ज़ोन के हिसाब से, कलेक्शन में लगातार जोड़ा जा रहा है. कृपया मौजूदा कवरेज के लिए, कलेक्शन देखें.
Google, हर साल सैटेलाइट एम्बेडिंग लेयर का प्रोडक्शन जारी रखने के लिए प्रतिबद्ध है. साथ ही, वह डिलीवरी में होने वाले किसी भी संभावित बदलाव के बारे में कम से कम एक साल पहले सूचना देगा. हालांकि, यह USGS और ESA से इनपुट डेटा स्ट्रीम की उपलब्धता पर निर्भर करेगा, जिस पर डेटासेट का प्रोडक्शन निर्भर करता है.
बैंड
पिक्सल का साइज़
10 मीटर
बैंड
| नाम | इकाई | कम से कम | ज़्यादा से ज़्यादा | पिक्सल का साइज़ | ब्यौरा |
|---|---|---|---|---|---|
A00 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 0वां ऐक्सिस है. |
A01 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का पहला ऐक्सिस है. |
A02 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का दूसरा ऐक्सिस है. |
A03 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का तीसरा ऐक्सिस है. |
A04 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का चौथा ऐक्सिस. |
A05 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का पांचवां ऐक्सिस. |
A06 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का छठा ऐक्सिस है. |
A07 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का सातवाँ ऐक्सिस. |
A08 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का आठवाँ ऐक्सिस है. |
A09 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का नौवां ऐक्सिस. |
A10 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का 10वां ऐक्सिस है. |
A11 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेडिंग वेक्टर का 11वां ऐक्सिस है. |
A12 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का 12वां ऐक्सिस है. |
A13 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 13वां ऐक्सिस है. |
A14 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 14वां ऐक्सिस है. |
A15 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 15वां ऐक्सिस है. |
A16 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेडिंग वेक्टर का 16वां ऐक्सिस है. |
A17 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 17वां ऐक्सिस है. |
A18 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 18वां ऐक्सिस है. |
A19 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का 19वां ऐक्सिस है. |
A20 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 20वां ऐक्सिस. |
A21 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेडिंग वेक्टर का 21वां ऐक्सिस है. |
A22 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का 22वां ऐक्सिस है. |
A23 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 23वां ऐक्सिस. |
A24 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 24वां ऐक्सिस. |
A25 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एंबेड किए जा रहे वेक्टर का 25वां ऐक्सिस. |
A26 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 26वां ऐक्सिस है. |
A27 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेडिंग वेक्टर का 27वां ऐक्सिस है. |
A28 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 28वां ऐक्सिस है. |
A29 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 29वां ऐक्सिस है. |
A30 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 30वां ऐक्सिस है. |
A31 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 31वां ऐक्सिस है. |
A32 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 32वां ऐक्सिस है. |
A33 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 33वां ऐक्सिस है. |
A34 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 34वां ऐक्सिस है. |
A35 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 35वां ऐक्सिस. |
A36 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 36वां ऐक्सिस. |
A37 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 37वां ऐक्सिस. |
A38 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 38वां ऐक्सिस. |
A39 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 39वां ऐक्सिस. |
A40 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 40वां ऐक्सिस. |
A41 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 41वां ऐक्सिस. |
A42 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 42वां ऐक्सिस. |
A43 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 43वां ऐक्सिस. |
A44 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 44वां ऐक्सिस है. |
A45 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 45वां ऐक्सिस. |
A46 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर की 46वीं ऐक्सिस है. |
A47 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 47वां ऐक्सिस है. |
A48 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 48वां ऐक्सिस है. |
A49 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 49वां ऐक्सिस है. |
A50 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 50वां ऐक्सिस. |
A51 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 51वां ऐक्सिस. |
A52 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेडिंग वेक्टर का 52वां ऐक्सिस है. |
A53 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर की 53वीं ऐक्सिस है. |
A54 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 54वां ऐक्सिस है. |
A55 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 55वां ऐक्सिस. |
A56 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | एम्बेडिंग वेक्टर का 56वां ऐक्सिस. |
A57 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 57वां ऐक्सिस है. |
A58 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर की 58वीं ऐक्सिस है. |
A59 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर की 59वीं ऐक्सिस है. |
A60 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 60वां ऐक्सिस है. |
A61 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 61वां ऐक्सिस है. |
A62 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एम्बेड किए जा रहे वेक्टर का 62वां ऐक्सिस है. |
A63 |
कोई डाइमेंशन नहीं | -1 | 1 | मीटर | यह एंबेड किए जा रहे वेक्टर का 63वां ऐक्सिस है. |
इमेज प्रॉपर्टी
इमेज प्रॉपर्टी
| नाम | टाइप | ब्यौरा |
|---|---|---|
| MODEL_VERSION | स्ट्रिंग | वर्शन स्ट्रिंग, इमेज जनरेट करने के लिए इस्तेमाल किए गए मॉडल वर्शन की खास तौर पर पहचान करती है. |
| PROCESSING_SOFTWARE_VERSION | स्ट्रिंग | वर्शन स्ट्रिंग, मॉडल के डेटा को प्रोसेस करने वाले सॉफ़्टवेयर की खास तौर पर पहचान करती है. इस सॉफ़्टवेयर का इस्तेमाल, इमेज बनाने के लिए किया जाता है. |
| UTM_ZONE | स्ट्रिंग | इमेज बनाने के लिए इस्तेमाल किए गए कोऑर्डिनेट रेफ़रंस सिस्टम का यूटीएम ज़ोन. |
| DATASET_VERSION | स्ट्रिंग | डेटासेट का वर्शन. |
इस्तेमाल की शर्तें
इस्तेमाल की शर्तें
इस डेटासेट को CC-BY 4.0 के तहत लाइसेंस मिला है. इसके लिए, एट्रिब्यूशन के तौर पर यह टेक्स्ट देना ज़रूरी है: "AlphaEarth Foundations Satellite Embedding dataset को Google और Google DeepMind ने बनाया है."
उद्धरण
ब्राउन, सी. F., काज़मिएर्स्की, एम. R., पास्क्वेरेला, वी जे., रक्लिज, डब्ल्यू. J., सैमसिकोवा, एम., Zhang, C., शेल्हमर, ई., लाहेरा, ई., विल्स, ओ., इल्यूशेंको, एस., गोरेलिक, एन., Zhang, L. L., एस॰ अलज, शेक्टर, ई॰, एस॰ अस्कॉय, ओवेन गिनन, मूर, आर., बूकूवालास, ए., & कोहली, पी॰(2025). AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data. arXiv preprint arXiv.2507.22291. doi:10.48550/arXiv.2507.22291
Earth Engine की मदद से एक्सप्लोर करें
कोड एडिटर (JavaScript)
// Load collection. var dataset = ee.ImageCollection('GOOGLE/SATELLITE_EMBEDDING/V1/ANNUAL'); // Point of interest. var point = ee.Geometry.Point(-121.8036, 39.0372); // Get embedding images for two years. var image1 = dataset .filterDate('2023-01-01', '2024-01-01') .filterBounds(point) .first(); var image2 = dataset .filterDate('2024-01-01', '2025-01-01') .filterBounds(point) .first(); // Visualize three axes of the embedding space as an RGB. var visParams = {min: -0.3, max: 0.3, bands: ['A01', 'A16', 'A09']}; Map.addLayer(image1, visParams, '2023 embeddings'); Map.addLayer(image2, visParams, '2024 embeddings'); // Calculate dot product as a measure of similarity between embedding vectors. // Note for vectors with a magnitude of 1, this simplifies to the cosine of the // angle between embedding vectors. var dotProd = image1 .multiply(image2) .reduce(ee.Reducer.sum()); // Add dot product to the map. Map.addLayer( dotProd, {min: 0, max: 1, palette: ['white', 'black']}, 'Similarity between years (brighter = less similar)' ); Map.centerObject(point, 12); Map.setOptions('SATELLITE');