एम्बेडिंग

एम्बेड करने की सुविधा, तुलना के लिहाज़ से कम डाइमेंशन वाली जगह होती है. यहां आप ज़्यादा डाइमेंशन वाले वेक्टर का अनुवाद कर सकते हैं. एम्बेड करने से, मशीन पर बड़े अक्षरों में लिखे शब्दों को समझने में आसानी होती है. जैसे, पार्स करने वाले वेक्टर का इस्तेमाल करना. आम तौर पर, एम्बेड किया गया कॉन्टेंट, एम्बेड किए गए स्पेस में सिमेंटिक तौर पर मिलते-जुलते इनपुट को एक साथ रखकर, इनपुट के कुछ सिमेंटिक को कैप्चर करता है. एम्बेडिंग को सीखा जा सकता है और उसे सभी मॉडल में फिर से इस्तेमाल किया जा सकता है.

एम्बेडिंग

  • इनपुट: 10,00,000 ऐसी फ़िल्में जिन्हें 5,00,000 उपयोगकर्ताओं ने देखना चुना
  • टास्क: उपयोगकर्ताओं को फ़िल्मों का सुझाव दें

इस समस्या को हल करने के लिए कुछ तरीकों की ज़रूरत पड़ती है. इनसे पता चलता है कि कौनसी फ़िल्में एक-दूसरे से मिलती-जुलती हैं.

बाईं से दाईं ओर एक ही पंक्ति में ऑर्डर की गई फ़िल्मों की सूची. बाईं ओर से 'शेक और'द इंक्रेडिज़' और 'द स्टैंप ऑफ़ बेलबेल' और हैरी पॉटर के '' & & &390&1300 के &कलह

पिछली स्लाइड में फ़िल्मों की एक ही सूची, लेकिन दो डाइमेंशन में व्यवस्थित किया गया है. उदाहरण के लिए, &शेक' 'The Inreds पर

पिछले डायग्राम की तरह ही, हर क्वाड्रेंट के लिए ऐक्सिस और लेबल इस्तेमाल करने चाहिए. फ़िल्मों के क्रम के बारे में नीचे बताया गया है: पहले-दाएं हिस्से वाले क्वाड्रेंट में, वयस्क ब्लॉकबस्टर फ़िल्में शामिल हैं, जिनमें #39;Star Wars' और ' Dark Dark Knight ' और #39;Kero ' और ' नीचे की ओर दाएं हिस्से में क्वाड्रेंट है, जिसमें वयस्कों के लिए आर्टहाउस है. इस फ़िल्म में #39;ब्लू ऐंड #39; और #39;मेमेंटो' वॉकिंग लाइफ़' को वयस्कों के लिए आर्टहाउस क्वाड्रेंट के तौर पर जोड़ा गया है. तीसरे और निचले बाएं क्वाड्रेंट के तौर पर चिल्ड्रेन आर्टहाउस है और इसमें फ़िल्म #39;द ट्रिपल ऑफ़ बेलविल' और #39;वैलेस और ग्रॉमिट' को चिल्ड्रेन आर्टहाउस क्वाड्रेंट के तौर पर जोड़ा गया है. ऊपर बाईं ओर चौथे और फ़ाइनल क्वाड्रेंट में, बच्चों की ब्लॉकबस्टर फ़िल्में हैं, जिनमें 'श्रेक' और #39;हैरी पॉटर' और फ़िल्म "#39;स्कूल ऑफ़ रॉक' शामिल हैं. यह चाइल्ड ब्लॉकबस्टर फ़िल्में और टीवी शो है.

पिछली स्लाइड की तरह ही व्यवस्था. 'Shrek' 'Bleu' को 2d एम्बेडिंग विमान में उनके निर्देशांकों के उदाहरणों के रूप में हाइलाइट किया गया है.

  • यह मानते हुए कि मूवी में उपयोगकर्ता की रुचि d पहलुओं से समझ में आ सकती है
  • हर फ़िल्म एक d-डाइमेंशन पॉइंट बन जाती है, जहां डाइमेंशन d में वैल्यू से पता चलता है कि मूवी उस पहलू के लिए कितनी फ़िट हो सकती है
  • डेटा से एम्बेड करना सीखा जा सकता है
  • ट्रेनिंग के लिए किसी अलग प्रोसेस की ज़रूरत नहीं है -- एम्बेड करने की लेयर, सिर्फ़ एक छिपी हुई लेयर के साथ होती है, जिसमें हर डाइमेंशन के लिए एक यूनिट होती है
  • निगरानी में रखी गई जानकारी (उदाहरण के लिए, उपयोगकर्ताओं ने वही दो फ़िल्में देखी) अपनी पसंद के टास्क के लिए, एम्बेड किए गए एम्बेडिंग को तैयार करती हैं
  • आसानी से छिपी हुई यूनिट से यह पता चलता है कि आइटम को डी-डाइमेंशन वाले स्पेस में किस तरह व्यवस्थित किया जाए, ताकि वे असली मकसद को ऑप्टिमाइज़ कर सकें
  • हर उदाहरण (इस मैट्रिक्स में एक पंक्ति) उन सुविधाओं (फ़िल्मों) का कम हिस्सा है जिन्हें उपयोगकर्ता ने देखा है
  • इस उदाहरण का घना उदाहरण: (0, 1, 0, 1, 0, 0, 0, 1)

जगह और समय के हिसाब से कम असरदार है.

टेबल, जहां हर कॉलम का हेडर एक फ़िल्म होती है. हर पंक्ति में उपयोगकर्ता और देखी गई फ़िल्मों की जानकारी होती है.
  • हर सुविधा के लिए 0, ..., # मूवी - 1 से कोई पूर्णांक बनाने के लिए शब्दकोश बनाएं
  • सिर्फ़ उन फ़िल्मों की तरह, कम इस्तेमाल होने वाले वेक्टर को बेहतर तरीके से दिखाया जाता है जिन्हें उपयोगकर्ता ने देखा है. इसे इस तरह दिखाया जा सकता है: दाईं ओर दिखाए गए स्पार्स वेक्टर में फ़िल्मों के कॉलम की स्थिति के आधार पर, फ़िल्म और #39;बेलेस के ट्रिपल' और #39;मील एंड ग्रॉस और #39; मेमेंटो' को अच्छी तरह से दिखाया जा सकता है (0,1, 999999)
कम जानकारी वाला वेक्टर, जिसकी टेबल में हर फ़िल्म को दिखाया गया है. हर लाइन उपयोगकर्ता को दिखा रही है. टेबल में पिछले डायग्राम में शामिल फ़िल्में हैं. इन्हें 1 से 999999 के बीच में नंबर दिया गया है. अगर उपयोगकर्ता ने कोई फ़िल्म देखी है, तो टेबल के हर सेल की जांच की जाती है.

घर बिक्री की कीमतों का अनुमान लगाने के लिए रिग्रेशन से जुड़ी समस्या:

डीप न्यूरल नेटवर्क का डायग्राम, जिसका इस्तेमाल करके, बिक्री के लिए प्रॉडक्ट की कीमतों का अनुमान लगाया जाता है

घर बिक्री की कीमतों का अनुमान लगाने के लिए रिग्रेशन से जुड़ी समस्या:

डीप न्यूरल नेटवर्क का डायग्राम, जिसका इस्तेमाल करके होम बिक्री की कीमतों का अनुमान लगाया जाता है
  (एक्सपार्स वेक्टर एन्कोडिंग को हाइलाइट किया गया)

घर बिक्री की कीमतों का अनुमान लगाने के लिए रिग्रेशन से जुड़ी समस्या:

डीप न्यूरल नेटवर्क का डायग्राम, जिसका इस्तेमाल करके होम बिक्री की कीमतों का अनुमान लगाया गया
  (छिपी हुई तीन-डाइमेंशन वाली एम्बेड करने की लेयर को हाइलाइट किया गया)

घर बिक्री की कीमतों का अनुमान लगाने के लिए रिग्रेशन से जुड़ी समस्या:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे घर की बिक्री की कीमतों का अनुमान लगाया जाता है. साथ ही, हाइलाइट किए गए अतिरिक्त अक्षांश और देशांतर की इनपुट सुविधाएं भी हाइलाइट की जाती हैं

घर बिक्री की कीमतों का अनुमान लगाने के लिए रिग्रेशन से जुड़ी समस्या:

डीप न्यूरल नेटवर्क का डायग्राम, जिसका इस्तेमाल करके होम बिक्री की कीमतों का अनुमान लगाया जा रहा है
  (इनपुट की सुविधा में, छिपे हुए कई लेयर में फ़ीडिंग का इस्तेमाल किया गया है)

घर बिक्री की कीमतों का अनुमान लगाने के लिए रिग्रेशन से जुड़ी समस्या:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे घर में बिक्री की कीमतों का अनुमान लगाया जा रहा है
  (डीप न्यूरल नेटवर्क का आउटपुट हाइलाइट किया गया)

हाथ से लिखे गए अंक का अनुमान लगाने के लिए मल्टीक्लास क्लासिफ़िकेशन:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे हाथ से लिखे गए अंकों का अनुमान लगाया जाता है

हाथ से लिखे गए अंक का अनुमान लगाने के लिए मल्टीक्लास क्लासिफ़िकेशन:

डीप न्यूरल नेटवर्क का डायग्राम, जिसका इस्तेमाल हाथ से लिखे गए अंकों का अनुमान लगाने के लिए किया जाता है
  (इनपुट स्पार वेक्टर एन्कोडिंग को हाइलाइट किया गया)

हाथ से लिखे गए अंक का अनुमान लगाने के लिए मल्टीक्लास क्लासिफ़िकेशन:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे हाथ से लिखे गए अंकों का अनुमान लगाया जाता है
  (अन्य सुविधाएं हाइलाइट की गई हैं)

हाथ से लिखे गए अंक का अनुमान लगाने के लिए मल्टीक्लास क्लासिफ़िकेशन:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे हाथ से लिखे गए अंकों का अनुमान लगाया जाता है
  (तीन डाइमेंशन वाले एम्बेडिंग हाइलाइट)

हाथ से लिखे गए अंक का अनुमान लगाने के लिए मल्टीक्लास क्लासिफ़िकेशन:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे हाथ से लिखे गए अंकों का अनुमान लगाया जाता है (छिपाई गई लेयर को हाइलाइट किया गया)

हाथ से लिखे गए अंक का अनुमान लगाने के लिए मल्टीक्लास क्लासिफ़िकेशन:

डीप न्यूरल नेटवर्क का डायग्राम, जिसका इस्तेमाल हाथ से लिखे गए अंकों का अनुमान लगाने के लिए किया जाता है
  (लॉगिट लेयर को हाइलाइट किया गया)

हाथ से लिखे गए अंक का अनुमान लगाने के लिए मल्टीक्लास क्लासिफ़िकेशन:

डीप न्यूरल नेटवर्क का डायग्राम, जिसका इस्तेमाल हाथ से लिखे गए अंकों का अनुमान लगाने के लिए किया जाता है
  (टारगेट क्लास लेयर हाइलाइट किया गया)

फ़िल्मों का सुझाव देने के लिए, सहयोगी फ़िल्टर करना:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे इस बात का अनुमान लगाया जाता है कि कौनसी फ़िल्में सुझाई जाएंगी

फ़िल्मों का सुझाव देने के लिए, सहयोगी फ़िल्टर करना:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे इस बात का अंदाज़ा लगाया जा सकता है कि कौनसी फ़िल्में सुझाई जानी चाहिए
  (टारगेट क्लास लेयर को हाइलाइट किया गया)

फ़िल्मों का सुझाव देने के लिए, सहयोगी फ़िल्टर करना:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे इस बात का अनुमान लगाया जा सकता है कि किन फ़िल्मों का सुझाव दिया जाएगा
  (पार्स वेक्टर एन्कोडिंग को हाइलाइट किया गया)

फ़िल्मों का सुझाव देने के लिए, सहयोगी फ़िल्टर करना:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे इस बात का अनुमान लगाया जाता है कि कौनसी फ़िल्में सुझाई जाएंगी (तीन डाइमेंशन वाली एम्बेडिंग हाइलाइट की गई)

फ़िल्मों का सुझाव देने के लिए, सहयोगी फ़िल्टर करना:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे इस बात का अंदाज़ा लगाया जा सकता है कि किन फ़िल्मों का सुझाव दिया जाए
  (अन्य सुविधाएं हाइलाइट की गई हैं)

फ़िल्मों का सुझाव देने के लिए, सहयोगी फ़िल्टर करना:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे इस बात का अनुमान लगाया जाता है कि कौनसी फ़िल्में सुझाई जाएंगी (छिपाई गई लेयर हाइलाइट की गई)

फ़िल्मों का सुझाव देने के लिए, सहयोगी फ़िल्टर करना:

डीप न्यूरल नेटवर्क का डायग्राम, जिससे इस बात का अंदाज़ा लगाया जा सकता है कि किन फ़िल्मों का सुझाव दिया जाए
  (लॉगिट लेयर को हाइलाइट किया गया)

डीप नेटवर्क

  • हर छिपी हुई इकाई एक आयाम (बाद में सुविधा) से संबंधित होती है
  • किसी मूवी और छिपाई गई लेयर के बीच किनारे का वज़न, निर्देशांक के मान होते हैं
  • सबसे नीचे वाली लेयर में मौजूद नोड के साथ डीप न्यूरल नेटवर्क का ट्री डायग्राम

एक फ़िल्म के एम्बेड किए गए ज्यामितीय व्यू

डीप न्यूरल नेटवर्क के नष्ट होने के निचले स्तर के नोड से जुड़े तीन डाइमेंशन वाले स्पेस में एक पॉइंट.
  • ज़्यादा डाइमेंशन वाले एम्बेडिंग से इनपुट वैल्यू के बीच के संबंधों को ज़्यादा सटीक तरीके से दिखाया जा सकता है
  • हालांकि, ज़्यादा डाइमेंशन होने पर, ज़्यादा फ़िट होने की संभावना बढ़ जाती है और ट्रेनिंग धीमी हो जाती है
  • पहले से लागू नियम का पालन करें (शुरुआत करने के लिए यह सही है, लेकिन पुष्टि करने वाले डेटा का इस्तेमाल करके इसे ट्यून करना होगा):
  • $$ dimensions \approx \sqrt[4]{possible\;values} $$
  • मैप आइटम (उदाहरण के लिए, फ़िल्में, टेक्स्ट......) को कम डाइमेंशन वाले रीयल वेक्टर में एम्बेड करना, जैसे कि एक-दूसरे से मिलते-जुलते आइटम
  • एम्बेड किए गए एम्बेड डेटा को भी घनी डेटा (उदाहरण के लिए, ऑडियो) के लिए लागू किया जा सकता है, ताकि एक जैसी समानता वाली मेट्रिक बनाई जा सके
  • अलग-अलग तरह के डेटा (जैसे कि टेक्स्ट, इमेज, ऑडियो, ...) को एक साथ जोड़ना, इनके बीच समानता को तय करता है