मशीन लर्निंग ग्लॉसरी: सुझाव सिस्टम

इस पेज पर सुझाव सिस्टम के लिए शब्दावली से जुड़े शब्द मौजूद हैं. शब्दावली के सभी शब्दों के लिए, यहां क्लिक करें.

C

कैंडिडेट जनरेशन

#recsystems

सुझावों का शुरुआती सेट, जिसे सुझाव देने वाले सिस्टम ने चुना है. उदाहरण के लिए, किसी ऐसे किताब की दुकान के बारे में सोचें जिसमें 1,00,000 किताबें उपलब्ध हैं. जैसे कि उम्मीदवार तैयार करने के चरण में, किसी खास उपयोगकर्ता के लिए सही किताबों की एक छोटी सूची बनाई जाती है. जैसे, 500. हालांकि, उपयोगकर्ता को इसका सुझाव देने के लिए भी 500 किताबें उपलब्ध हैं. सुझाव देने वाले सिस्टम के बाद के समय में, ज़्यादा महंगे और ज़्यादा महंगे चरण (जैसे कि स्कोर और रैंकिंग) कम हो जाते हैं. इनके चलते, सुझावों के 500 से बहुत छोटे और ज़्यादा काम के सुझाव मिल जाते हैं.

फ़िल्टर करके मिलकर काम करने की सुविधा

#recsystems

कई दूसरे उपयोगकर्ताओं की दिलचस्पी के आधार पर, एक उपयोगकर्ता की दिलचस्पी के बारे में अनुमान लगाना. साथ मिलकर काम करने के हिसाब से फ़िल्टर करने की सुविधा का इस्तेमाल, अक्सर सुझाव देने वाले सिस्टम में किया जाता है.

I

आइटम का मैट्रिक्स

#recsystems

सुझाव देने वाले सिस्टम में, मैट्रिक्स फ़ैक्टराइज़ेशन से जनरेट होने वाले एम्बेडिंग वेक्टर का एक मैट्रिक्स होता है. इसमें, हर सामान के बारे में खास सिग्नल होते हैं. आइटम मैट्रिक्स की हर पंक्ति में, सभी आइटम के लिए एक दी गई सुविधा है. उदाहरण के लिए, फ़िल्मों के सुझाव देने वाला सिस्टम देखें. आइटम मैट्रिक्स में हर कॉलम एक फ़िल्म को दिखाता है. देरी से दिखने वाले सिग्नल, शैलियों का प्रतिनिधित्व कर सकते हैं या हो सकता है कि शैली, स्टार, फ़िल्म की उम्र या दूसरी वजहों से मुश्किल इंटरैक्शन वाले सिग्नल को समझा न जा सके.

आइटम मैट्रिक्स में उतने ही कॉलम हैं जितने कि टारगेट किए गए मैट्रिक्स में हैं. उदाहरण के लिए, किसी फ़िल्म का सुझाव देने वाला सिस्टम, जिसमें 10,000 मूवी शीर्षकों का मूल्यांकन किया जाता है, आइटम मैट्रिक्स में 10,000 कॉलम होंगे.

items

#recsystems

सुझाव देने वाले सिस्टम में, सिस्टम की सुझाई गई इकाइयां शामिल होती हैं. उदाहरण के लिए, वीडियो में उन आइटम को शामिल किया जाता है जिनका सुझाव वीडियो स्टोर ने दिया है, जबकि किताबों के आधार पर किताबों का स्टोर उपलब्ध कराता है.

सोम

मैट्रिक्स फ़ैक्टराइज़ेशन

#recsystems

गणित में मैट्रिक्स का पता लगाने का एक तरीका है, जिसमें डॉट प्रॉडक्ट किसी टारगेट मैट्रिक्स का अनुमानित मान लेता है.

सुझाव सिस्टम में, टारगेट मैट्रिक्स अक्सर उपयोगकर्ताओं की रेटिंग को आइटम पर रखता है. उदाहरण के लिए, किसी फ़िल्म के सुझाव वाले सिस्टम के लिए टारगेट मैट्रिक्स कुछ ऐसा दिख सकता है, जिसमें इस्तेमाल करने वालों की रेटिंग और उनके अच्छे पूर्णांक होने का मतलब है कि उपयोगकर्ता ने रेटिंग नहीं दी है.

  कैसाब्लांका फ़िलाडेल्फ़िया की कहानी Black Panther वंडर महिला काल्पनिक कहानियां
यूज़र 1 5.0 3.0 0.0 2.0 0.0
यूज़र 2 4.0 0.0 0.0 1.0 5.0
यूज़र 3 3.0 1.0 4.0 5.0 0.0

फ़िल्म का सुझाव देने वाले सिस्टम का मकसद, रेट नहीं की गई फ़िल्मों के लिए उपयोगकर्ता की रेटिंग का अनुमान लगाना होता है. उदाहरण के लिए, क्या उपयोगकर्ता 1 को Black Panther पसंद होगा?

इन दो मैट्रिक्स को जनरेट करने के लिए, मैट्रिक्स सिस्टम का इस्तेमाल करने के लिए, सुझाव देने वाले सिस्टम का एक तरीका है:

उदाहरण के लिए, हमारे तीन उपयोगकर्ताओं और पांच आइटम पर मैट्रिक्स फ़ैक्टराइज़ेशन का इस्तेमाल करने से ये उपयोगकर्ता मैट्रिक्स और आइटम मैट्रिक्स मिल सकते हैं:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

उपयोगकर्ता के मैट्रिक्स और आइटम के मैट्रिक्स का डॉट प्रॉडक्ट, सुझाव का ऐसा मैट्रिक्स जनरेट करता है जिसमें न सिर्फ़ ओरिजनल उपयोगकर्ता रेटिंग होती हैं, बल्कि उन फ़िल्मों के लिए भी अनुमान लगाए जाते हैं जिन्हें हर उपयोगकर्ता ने नहीं देखा है. उदाहरण के लिए, Casablanca की उपयोगकर्ता 1 की रेटिंग पर विचार करें, जो कि 5.0 थी. सुझाव में दिए गए मैट्रिक्स में, इस सेल से जुड़ा बिंदु प्रॉडक्ट 5.0 के आस-पास होना चाहिए और यह है:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

इससे भी अहम बात यह है कि क्या उपयोगकर्ता 1 को Black Panther पसंद है? पहली पंक्ति और तीसरे कॉलम से मेल खाने वाला डॉट प्रॉडक्ट लेने से 4.3 की अनुमानित रेटिंग मिलती है:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

आम तौर पर, मैट्रिक्स फ़ैक्टरिंग से उपयोगकर्ता का मैट्रिक्स और आइटम मैट्रिक्स बनता है. ये दोनों, एक साथ, टारगेट मैट्रिक्स से बहुत ज़्यादा संक्षिप्त होते हैं.

आर

सुझाव देने वाला सिस्टम

#recsystems

एक ऐसा सिस्टम जो हर उपयोगकर्ता के लिए एक बड़े ग्रुप से कुछ हद तक मनमुताबिक आइटम चुनता है. उदाहरण के लिए, वीडियो के सुझाव देने वाला कोई सिस्टम, दो वीडियो दिखाता है. इनमें 1,00,000 वीडियो शामिल होते हैं. साथ ही, Casablanca और Fild Women और Wonder Women और Black Panther के लिए अलग-अलग वीडियो चुने जा सकते हैं. वीडियो का सुझाव देने वाला सिस्टम, वीडियो के सुझावों को कुछ बातों के आधार पर तय कर सकता है. जैसे:

  • ऐसी फ़िल्में जिन्हें मिलते-जुलते उपयोगकर्ताओं ने रेट किया है या देखा है.
  • शैली, निर्देशक, कलाकार, टारगेट की गई डेमोग्राफ़िक...

फिर से रैंकिंग

#recsystems

सुझाव देने वाले सिस्टम, का आखिरी चरण. इस दौरान, स्कोर किए गए किन आइटम को अन्य (आम तौर पर, नॉन-एमएल) एल्गोरिदम के हिसाब से फिर से ग्रेड दिया जा सकता है. फिर से रैंकिंग, स्कोर फ़ेज़ के ज़रिए जनरेट किए गए आइटम की सूची का आकलन करती है. इसके लिए, ये कार्रवाइयां की जाती हैं:

  • वे आइटम मिटाना जो उपयोगकर्ता ने पहले ही खरीद लिए हैं.
  • नए आइटम के स्कोर को बेहतर कर रहे हैं.

रवि

स्कोरिंग

#recsystems

यह सुझाव देने वाले सिस्टम का हिस्सा है. इस सिस्टम से, उम्मीदवार की जनरेशन फ़ेज़ के बनाए गए हर आइटम की वैल्यू या रैंकिंग तय होती है.

U

उपयोगकर्ता का मैट्रिक्स

#recsystems

सुझाव देने वाले सिस्टम में, मैट्रिक्स फ़ैक्टराइज़ेशन से जनरेट होने वाला एम्बेडिंग वेक्टर होता है. इसमें उपयोगकर्ता की पसंद के बारे में जानकारी देने वाले सिग्नल होते हैं. उपयोगकर्ता मैट्रिक्स की हर पंक्ति में, एक ही उपयोगकर्ता के लिए अलग-अलग लेटेंशन सिग्नल की खूबियों की जानकारी होती है. उदाहरण के लिए, फ़िल्मों के सुझाव देने वाला सिस्टम देखें. इस सिस्टम में, उपयोगकर्ता मैट्रिक्स में देरी के सिग्नल, खास शैलियों में हर उपयोगकर्ता की दिलचस्पी दिखा सकते हैं.

उपयोगकर्ता मेट्रिक में, हर 'लेट' सुविधा के लिए एक कॉलम और हर उपयोगकर्ता के लिए एक लाइन होती है. इसका मतलब यह है कि उपयोगकर्ता के मैट्रिक्स में पंक्तियों की वही संख्या है जो फैक्टर किए जा रहे टारगेट मैट्रिक्स में है. उदाहरण के लिए, 10,00,000 उपयोगकर्ताओं के लिए मूवी का सुझाव देने वाला सिस्टम और उपयोगकर्ता मेट्रिक में 10,00,000 पंक्तियां होंगी.

W

वेल्डिंग ऑल्टरनेटिंग लीस्ट स्क्वेयर्स (डब्ल्यूएएलएस)

#recsystems

सुझाव देने वाले सिस्टम में मैट्रिक्स फ़ैक्टराइज़ेशन के दौरान मकसद के फ़ंक्शन को कम करने के लिए एक एल्गोरिदम, जो मौजूद नहीं हैं. WALS, मूल मैट्रिक्स और कॉलम फिर से बनाने की प्रक्रिया को ठीक करके, मूल मैट्रिक्स और फिर से बनाए जाने के बीच वेटेड वर्ग वाली गड़बड़ी को कम करता है. इनमें से हर ऑप्टिमाइज़ेशन को कम से कम स्क्वेयर कन्वर्ज़न ऑप्टिमाइज़ेशन की मदद से हल किया जा सकता है. ज़्यादा जानकारी के लिए, सुझावों के सिस्टम का कोर्स देखें.