सहयोगी फ़िल्टर करना

कॉन्टेंट के हिसाब से फ़िल्टर करने की कुछ सीमाओं को पूरा करने के लिए, दूसरे क्रिएटर्स के साथ मिलकर काम करने की सुविधा मिलती है. इससे सुझाव देने के लिए, उपयोगकर्ताओं और आइटम में एक जैसी विशेषताओं का इस्तेमाल किया जाता है. इससे अचानक होने वाले सुझावों की अनुमति मिल जाती है. इसका मतलब है कि साथ मिलकर काम करने वाले फ़िल्टर की मदद से, उपयोगकर्ता A के हिसाब से एक आइटम के सुझाव इसके अलावा, एम्बेड करने की सुविधाओं को मैन्युअल तौर पर इस्तेमाल किए बिना, अपने-आप यह सीखा जा सकता है.

फ़िल्म के सुझाव का उदाहरण

किसी फ़िल्म के सुझाव वाले सिस्टम के बारे में सोचें, जिसमें ट्रेनिंग के डेटा में एक फ़ीडबैक मैट्रिक्स शामिल है, जिसमें:

  • हर लाइन किसी उपयोगकर्ता के बारे में बताती है.
  • हर कॉलम, आइटम को दिखाता है (फ़िल्म).

फ़िल्मों के बारे में दिए गए सुझाव, इनमें से किसी एक कैटगरी में आते हैं:

  • साफ़—उपयोगकर्ता संख्या के तौर पर रेटिंग देकर यह बताते हैं कि उन्हें किसी फ़िल्म में कितनी पसंद आई.
  • अहम जानकारी— अगर कोई उपयोगकर्ता फ़िल्म देखता है, तो सिस्टम को पता चलता है कि उसे किस तरह के वीडियो पसंद हैं.

आसान बनाने के लिए, हम यह मानेंगे कि फ़ीडबैक मैट्रिक्स बाइनरी है. इसका मतलब है कि 1 वैल्यू यह बताती है कि फ़िल्म में लोगों की दिलचस्पी है.

जब कोई उपयोगकर्ता होम पेज पर जाता है, तो सिस्टम को इन दोनों के आधार पर फ़िल्मों का सुझाव देना चाहिए:

  • उन फ़िल्मों से मिलती-जुलती है जिन्हें उपयोगकर्ता ने पहले पसंद किया था
  • ऐसी फ़िल्में जो मिलते-जुलते उपयोगकर्ताओं ने पसंद की हैं

सिर्फ़ उदाहरण के तौर पर, नीचे दी गई टेबल में फ़िल्मों के लिए कुछ सुविधाएं तैयार करें:

फ़िल्म रेटिंग जानकारी
डार्क नाइट राइज़ PG-13 डीसी कॉमिक्स की दुनिया में सेट किए गए, द डार्क नाइट के सिक्वेंस से, गॉथम को बचाने के लिए बैटमैन शहर प्रयास करता है.
हैरी पॉटर और पारस पत्थर (&s) PG एक अनाथ लड़के को पता चलता है कि वह एक जादूगर है और उसने हॉगवर्ट्स स्कूल ऑफ़ विंचक्राफ़्ट और विज़र्डी में नाम दर्ज किया. यहां वह दुश्मन लॉर्ड वोलमार्ट से अपनी पहली लड़ाई लड़ता है.
श्रेक PG एक सुंदर सागौन और उसके गधे की तरफ़ से, वह राजकुमारी फ़ियोना को बचाने के मिशन पर निकलीं. ड्रैगन को उनके महल में कैद कर लिया गया था.
ट्रिपल ऑफ़ बेलविल PG-13 जब टूर डी फ़्रांस में पेशेवर साइकल चैंपियन का अपहरण हो जाता है, तो उसकी दादी और वजन उठाने वाले कुत्ते ने उसे बचाने के लिए विदेशों में यात्रा की. इसमें, बुजुर्गों के तीन गायकों की मदद की गई.
मेमेंटो R एक भूलभुलैया अपनी पत्नी की मौत के लिए, अपने शरीर पर निशाना लगाता है.

1D एम्बेडिंग

मान लें कि हम हर फ़िल्म को \([-1, 1]\) एक स्केलर असाइन करते हैं, जो बताता है कि फ़िल्म बच्चों के लिए है (नेगेटिव वैल्यू) या वयस्कों के लिए (पॉज़िटिव वैल्यू). मान लें कि हम हर उपयोगकर्ता को एक स्केलर भी असाइन करते हैं, जो \([-1, 1]\) उपयोगकर्ताओं की दिलचस्पी को दिखाता है. साथ ही, यह भी बताता है कि उपयोगकर्ता, बच्चों की फ़िल्मों (-1 के करीब) या वयस्कों की फ़िल्मों (1 से ज़्यादा पास) में दिलचस्पी रखते हैं. ऐसी फ़िल्में जिन्हें उपयोगकर्ता पसंद करना चाहते हैं, उनके लिए फ़िल्म एम्बेड करने और उपयोगकर्ता को जोड़ने का प्रॉडक्ट (1 से ज़्यादा) का होना चाहिए.

इमेज में, उपयोगकर्ताओं को एक ही जगह पर एम्बेड करने की जगह के साथ-साथ कई फ़िल्में और उपयोगकर्ता दिखाए गए हैं. इस ऐक्सिस के साथ हर फ़िल्म की जगह बताती है कि यह बच्चों की फ़िल्म है (बाएं) या वयस्क फ़िल्म है (दाईं ओर). उपयोगकर्ता की स्थिति से बच्चों या वयस्क फ़िल्मों में रुचि का पता चलता है.

नीचे दिए गए डायग्राम में, हर चेकमार्क उस फ़िल्म की पहचान करता है जिसे किसी खास उपयोगकर्ता ने देखा है. तीसरे और चौथे उपयोगकर्ता की ऐसी प्राथमिकताएं हैं जिनके बारे में इस सुविधा में अच्छी तरह बताया गया है—तीसरा उपयोगकर्ता बच्चों के लिए फ़िल्में पसंद करता है और चौथा उपयोगकर्ता वयस्कों के लिए फ़िल्में पसंद करता है. हालांकि, पहले और दूसरे उपयोगकर्ता &39; की प्राथमिकताओं को इस एक सुविधा से अच्छी तरह नहीं समझा जा सकता.

फ़ीडबैक मैट्रिक्स की इमेज, जहां एक लाइन किसी उपयोगकर्ता से मेल खाती है और एक कॉलम किसी फ़िल्म से जुड़ा है. हर उपयोगकर्ता और हर फ़िल्म को एक डाइमेंशन वाले एम्बेड किए गए मैप किया जाता है (जैसा कि पिछले डायग्राम में बताया गया है), जैसे कि दो एम्बेड किए गए प्रॉडक्ट का प्रॉडक्ट, फ़ीडबैक मैट्रिक्स में ग्राउंड ट्रूथ वैल्यू का अनुमान लगाता है.

2D एम्बेडिंग

एक सुविधा सभी उपयोगकर्ताओं की पसंद को समझाने के लिए काफ़ी नहीं थी. इस समस्या को दूर करने के लिए, हम एक और फ़ीचर जोड़ रहे हैं: हर फ़िल्म के लिए ब्लॉकबस्टर फ़िल्म या आर्टहाउस फ़िल्म का लेवल. एक दूसरी सुविधा के साथ, अब हम हर फ़िल्म को नीचे दिए गए दो आयामों वाले एम्बेडिंग के साथ दिखा सकते हैं:

कई डाइमेंशन वाली एम्बेड करने की जगह पर दिखाई गई कई फ़िल्मों और उपयोगकर्ताओं को दिखाती इमेज. हॉरिज़ॉन्टल ऐक्सिस के साथ हर फ़िल्म की जगह बताती है कि यह बच्चों की फ़िल्म है (बाएं) या वयस्क फ़िल्म (दाईं ओर); वर्टिकल ऐक्सिस में इसकी जगह बताती है कि यह ब्लॉकबस्टर फ़िल्म है (टॉप) या आर्टहाउस मूवी (सबसे नीचे). उपयोगकर्ताओं की स्थिति हर श्रेणी में उनकी रुचियों को दिखाती है.

हम फिर से अपने उपयोगकर्ताओं को एक ही एम्बेड करने की जगह पर रखते हैं, ताकि वे सुझाव के तौर पर दिए जाने वाले मैट्रिक्स को बेहतर तरीके से समझा सकें: हम हर उपयोगकर्ता (आइटम, आइटम) की जोड़ी के लिए, उपयोगकर्ता के एम्बेड किए गए बिंदु वाले प्रॉडक्ट का आइटम और आइटम एम्बेड करने वाले आइटम को 1 के करीब रखना चाहते हैं.

एक ही फ़ीडबैक मैट्रिक्स की इमेज. इस बार, हर फ़िल्म और हर उपयोगकर्ता को दो आयामों वाले एम्बेड करने के तरीके से मैप किया जाता है (जैसा कि पिछले आंकड़े में बताया गया है), जैसे कि दो एम्बेडिंग का डॉट प्रॉडक्ट, फ़ीडबैक मैट्रिक्स में ग्राउंड ट्रूथ वैल्यू का अनुमान लगाता है.

इस उदाहरण में, हमने एम्बेड की गई इंजीनियरिंग को हाथ से बनाया है. व्यावहारिक तौर पर, एम्बेड करना अपने-आप सीखा जा सकता है. यह सहयोगी फ़िल्टर के मॉडल की शक्ति है. अगले दो सेक्शन में, हम इन एम्बेडिंग के बारे में बताने के लिए अलग-अलग मॉडल पर चर्चा करेंगे. साथ ही, इन्हें ट्रेनिंग देने का तरीका भी जानेंगे.

जब मॉडल एम्बेड करने की जानकारी हासिल करता है, तो इस तरीके से एक साथ मिलकर काम करना आसान होता है. मान लें कि फ़िल्मों के एम्बेड करने के वेक्टर को ठीक किया गया है. इसके बाद, यह मॉडल अपनी ज़रूरत के बारे में बताने के लिए, एम्बेड करने वाले वेक्टर को सीख सकता है. नतीजतन, एक जैसी प्राथमिकताओं वाले उपयोगकर्ताओं के एम्बेड करना एक-दूसरे के करीब हो जाएगा. इसी तरह, अगर उपयोगकर्ताओं के लिए एम्बेड करने की सुविधा को ठीक किया गया है, तो हम फ़ीडबैक मैट्रिक्स को सबसे अच्छी तरह समझाने के लिए फ़िल्म एम्बेड करना सीख सकते हैं. इसलिए, मिलते-जुलते उपयोगकर्ताओं की पसंद की फ़िल्मों को एम्बेड करने पर, एम्बेड करने की जगह में वह जगह बंद हो जाएगी.

अपनी समझ को समझना

मॉडल, उपयोगकर्ता को शॉपिंग ऐप्लिकेशन का सुझाव देता है, क्योंकि उसने हाल ही में मिलता-जुलता ऐप्लिकेशन इंस्टॉल किया है. यह किस तरह का फ़िल्टर है?
कॉन्टेंट के हिसाब से फ़िल्टर करना
बहुत बढ़िया! कॉन्टेंट के हिसाब से फ़िल्टर करने की सुविधा, दूसरे उपयोगकर्ताओं पर नज़र नहीं रखती.
साथ मिलकर काम करने की सुविधा
साथ मिलकर काम करने की सुविधा से, दूसरे उपयोगकर्ताओं को भी ध्यान में रखा जाता है. इस मामले में, हम सिर्फ़ एक उपयोगकर्ता की परवाह करते हैं.