फिर से रैंकिंग

सुझाव देने वाले सिस्टम के आखिरी चरण में, सिस्टम कुछ और ज़रूरी शर्तों या पाबंदियों पर विचार करने के लिए, उन शर्तों को फिर से रैंक कर सकता है. दोबारा रैंकिंग करने का तरीका ऐसे फ़िल्टर का इस्तेमाल करना है जो कुछ उम्मीदवार हटा देते हैं.

दोबारा रैंकिंग करने का एक और तरीका है, रैंकर से मिले स्कोर को मैन्युअल रूप से बदलना.

इस सेक्शन में नई जानकारी, विविधता, और निष्पक्षता के बारे में संक्षेप में बताया गया है. इन वजहों में से कई चीज़ें, सुझाव के सिस्टम को बेहतर बनाने में मदद करती हैं. इनमें से कुछ वजहों के लिए, आम तौर पर प्रोसेस के अलग-अलग स्टेज में बदलाव करना पड़ता है. हर सेक्शन ऐसे समाधान देता है जिन्हें आप व्यक्तिगत या सामूहिक रूप से लागू कर सकते हैं.

अप-टू-डेट

ज़्यादातर सुझाव सिस्टम का मकसद इस्तेमाल की नई जानकारी शामिल करना होता है, जैसे कि मौजूदा उपयोगकर्ता इतिहास और सबसे नए आइटम. मॉडल को नया बनाए रखने से मॉडल को अच्छे सुझाव देने में सहायता मिलती है.

समाधान

  • ट्रेनिंग के नए डेटा के बारे में जानने के लिए, जितनी बार हो सके उतनी बार ट्रेनिंग फिर से चलाएं. हम ट्रेनिंग शुरू करने की सलाह देते हैं, ताकि मॉडल को फिर से सीखने की ज़रूरत न पड़े. वॉर्म-स्टार्ट करने से ट्रेनिंग का समय काफ़ी कम हो सकता है. उदाहरण के लिए, मैट्रिक्स फ़ैक्टर के ज़रिए, मॉडल के पिछले इंस्टेंस में मौजूद आइटम के लिए एम्बेडिंग शुरू करें.
  • मैट्रिक्स फ़ैक्टर मॉडल में नए उपयोगकर्ताओं को दिखाने के लिए एक "औसत"उपयोगकर्ता बनाएं. आपको हर उपयोगकर्ता के लिए एक जैसे एम्बेडिंग की ज़रूरत नहीं है—आप उपयोगकर्ता सुविधाओं के आधार पर उपयोगकर्ताओं के क्लस्टर बना सकते हैं.
  • सॉफ़्टमैक्स मॉडल या दो टावर टावर जैसे डीएनएन का इस्तेमाल करें. मॉडल में, इनपुट के तौर पर वेक्टर का इस्तेमाल किया जाता है. इसलिए, इसे किसी ऐसी क्वेरी या आइटम पर चलाया जा सकता है जिसे ट्रेनिंग के दौरान नहीं देखा जा सका.
  • सुविधा के तौर पर दस्तावेज़ की उम्र जोड़ें. उदाहरण के लिए, YouTube वीडियो के तौर पर किसी वीडियो की उम्र या उसे आखिरी बार देखे जाने का समय जोड़ सकता है.

उल्लू के बारे में चार सुझाए गए वीडियो की इमेज.

विविधता

अगर सिस्टम हमेशा ऐसे आइटम का सुझाव देता है जो क्वेरी एम्बेड करने की वजह से कोटेशन और सबसे नज़दीकी कोट होते हैं, तो उम्मीदवार एक-दूसरे से काफ़ी मिलते-जुलते हो सकते हैं. विविधता का यह कमी उपयोगकर्ता को खराब या उबाऊ बना सकती है. उदाहरण के लिए, अगर YouTube सिर्फ़ उस वीडियो से मिलते-जुलते वीडियो का सुझाव देता है जिसे उपयोगकर्ता देख रहा है, जैसे कि उल्लू वीडियो (जैसा कि उदाहरण में दिखाया गया है), तो उपयोगकर्ता की दिलचस्पी तेज़ी से खत्म हो सकती है.

समाधान

  • अलग-अलग स्रोतों का इस्तेमाल करके, कई उम्मीदवारों को जनरेट करें.
  • अलग-अलग मकसद फ़ंक्शन का इस्तेमाल करके, कई रैंकिंग देने वालों को ट्रेनिंग दें.
  • विविधता को पक्का करने के लिए, शैली या अन्य मेटाडेटा के आधार पर आइटम को फिर से रैंक करें.

निष्पक्षता

आपके मॉडल को सभी उपयोगकर्ताओं के साथ निष्पक्ष व्यवहार करना चाहिए. इसलिए, पक्का करें कि आपका मॉडल, ट्रेनिंग डेटा से अनजाने में किए जाने वाले पक्षपात न सीख रहा हो.

समाधान

  • डिज़ाइन और डेवलपमेंट में अलग-अलग नज़रियों को शामिल करें.
  • व्यापक डेटा सेट पर ML मॉडल ट्रेनिंग दें. सहायक डेटा तब जोड़ें, जब आपका डेटा बहुत कम हो (उदाहरण के लिए, जब कुछ कैटगरी को कम दिखाया गया हो).
  • हर एक डेमोग्राफ़िक पर, मेट्रिक (उदाहरण के लिए, सटीक और पूरी तरह से गड़बड़ी) को ट्रैक करना, ताकि मापदंड से बाहर की चीज़ों का पता लगाया जा सके.
  • कम दिलचस्पी वाले ग्रुप के लिए अलग-अलग मॉडल बनाएं.