एम्बेडिंग: लो-डाइमेंशनल स्पेस में अनुवाद करना

आप अपने ज़्यादा डाइमेंशन वाले डेटा को लो-डाइमेंशन वाली जगह से मैप करके, स्पार्स इनपुट डेटा की मुख्य समस्याओं को हल कर सकते हैं.

जैसा कि आपने फ़िल्मी गतिविधियों में पहले देखा था, एक से ज़्यादा डाइमेंशन वाले छोटे-छोटे स्पेस भी, मतलब के हिसाब से मिलते-जुलते आइटम को एक साथ ग्रुप करने की आज़ादी देते हैं और एक जैसे आइटम को दूर रखते हैं. वेक्टर स्पेस में मौजूद पोज़िशन (दूरी और दिशा), अच्छे से एम्बेड करने के लिए सिमेंटिक को कोड में बदल सकता है. उदाहरण के लिए, असल एम्बेडिंग के ये विज़ुअलाइज़ेशन, ज्यामितीय संबंधों को दिखाते हैं. जैसे, किसी देश और उसकी राजधानी के बीच का संबंध समझना:

भौगोलिक रूप से शब्द के संबंधों को दिखाने वाले वर्ड एम्बेडिंग के तीन उदाहरण: लिंग (पुरुष/महिला और राजा/क्वीन), कार्रवाई का काल (वॉकिंग/वॉकिंग और स्विमिंग/स्वैम), और कैपिटल शहर (तुर्किये/अंकारा और वियतनाम/हानोई)

चौथा डायग्राम. एम्बेड करने पर काफ़ी मिलती-जुलती चेतावनियां मिल सकती हैं.

इस तरह की मिलती-जुलती जगह से, आपकी मशीन लर्निंग सिस्टम को उन पैटर्न का पता लगाने में मदद मिलती है जो लर्निंग टास्क में मदद कर सकते हैं.

नेटवर्क को छोटा करना

हालांकि, हम रिच सिमैंटिक संबंधों को कोड में बदलने के लिए ज़रूरी डाइमेंशन चाहते हैं, फिर भी हम एक ऐसा एम्बेडिंग स्पेस भी चाहते हैं जो हमारे सिस्टम को ज़्यादा तेज़ी से ट्रेनिंग दे सके. फ़ायदेमंद डाइमेंशन, सैकड़ों डाइमेंशन के क्रम में हो सकते हैं. यह आम तौर पर सामान्य भाषा के टास्क के लिए, आपकी शब्दावली के साइज़ से कम कई क्रम में हो सकता है.