फ़्रेमिंग: अपनी समझ की जांच करना

सुपरवाइज़्ड लर्निंग

नीचे दिए गए विकल्प देखें.

मान लें कि आपको निगरानी में रखा गया मशीन लर्निंग मॉडल बनाना है, ताकि यह अनुमान लगाया जा सके कि दिया गया ईमेल "स्पैम" या "न कि स्पैम." इनमें से कौनसी बातें सही हैं?
जिन ईमेल पर 'कोटेशन', 'स्पैम', और 'कोटेशन' के तौर पर मार्क नहीं किया गया होता है उन पर बिना लेबल वाले उदाहरण लगाए जाते हैं.
हमारे लेबल में वैल्यू "स्पैम"और "न कि स्पैम" होते हैं. ऐसे सभी ईमेल जिन्हें लेबल किया गया है वे अब तक स्पैम के तौर पर मार्क नहीं किए गए हैं या बिना लेबल वाले ईमेल के उदाहरण हैं.
विषय के हेडर में दिए गए शब्द, अच्छे लेबल बनाएंगे.
विषय के हेडर में दिए गए शब्द, बेहतर सुविधाएं दे सकते हैं, लेकिन वे अच्छा लेबल नहीं बना पाते.
हम Google को बिना लेबल वाले उदाहरणों की मदद से ट्रेनिंग देंगे.
मॉडल को ट्रेनिंग देने के लिए, हम लेबल किए गए उदाहरणों का इस्तेमाल करेंगे. इसके बाद, हम बिना किसी लेबल वाले उदाहरणों के ज़रिए, प्रशिक्षित मॉडल की मदद से यह अनुमान लगा सकते हैं कि बिना लेबल वाले ईमेल मैसेज स्पैम हैं या नहीं.
हो सकता है कि कुछ उदाहरणों पर लागू किए गए लेबल भरोसेमंद न हों.
बिल्कुल. यह जांचना ज़रूरी है कि आपका डेटा कितना भरोसेमंद है. इस डेटासेट के लिए लेबल, ऐसे ईमेल उपयोगकर्ताओं के हो सकते हैं जो खास ईमेल मैसेज को स्पैम के तौर पर मार्क करते हों. ज़्यादातर उपयोगकर्ता, हर संदिग्ध ईमेल मैसेज को स्पैम के तौर पर मार्क नहीं करते. इसलिए, हमें यह जानने में परेशानी हो सकती है कि कोई ईमेल, स्पैम है या नहीं. इसके अलावा, स्पैम करने वाले लोग खराब मॉडल का इस्तेमाल करके, जान-बूझकर हमारे मॉडल को ज़हर दे सकते हैं.

सुविधाएं और लेबल

नीचे दिए गए विकल्प देखें.

मान लें कि एक ऑनलाइन जूतों का स्टोर, निगरानी में रखा गया एमएल मॉडल बनाना चाहता है, ताकि उपयोगकर्ताओं को उनकी पसंद के हिसाब से जूतों के सुझाव दिए जा सकें. इसका मतलब है कि मॉडल, मार्टी में जूतों के कुछ जोड़े और जैनेट के लिए अलग-अलग तरह के जूतों का सुझाव देगा. सिस्टम, ट्रेनिंग डेटा जनरेट करने के लिए, उपयोगकर्ता के पिछले व्यवहार से जुड़े डेटा का इस्तेमाल करेगा. इनमें से कौनसी बातें सही हैं?
"Shoe size" एक उपयोगी सुविधा है.
"Shoe size" एक ऐसा सिग्नल है जिसे मापा जा सकता है. इससे, इस बात पर काफ़ी असर पड़ सकता है कि उपयोगकर्ता सुझाए गए जूते पसंद करेगा या नहीं. उदाहरण के लिए, अगर मार्टी साइज़ 9 पहने हैं, तो मॉडल को साइज़ 7 वाले जूते का सुझाव नहीं देना चाहिए.
"Shoe सौंदर्य" एक उपयोगी सुविधा है.
अच्छी सुविधाएं सटीक होती हैं और इन्हें आसानी से समझा जा सकता है. ब्यूटी एक ऐसी कॉन्सेप्ट है जो बहुत काम की नहीं है. खूबसूरती, कंक्रीट की कुछ खास सुविधाओं का मिला-जुला रूप होती है. जैसे, स्टाइल और रंग. रंग और शैली में हर सुविधा, सुंदरता से बेहतर है.
"जूते पर जूता 'ब्यौरे पर क्लिक किया गया उपयोगकर्ता एक उपयोगी लेबल है.
हो सकता है कि उपयोगकर्ता उन जूतों के बारे में ही ज़्यादा जानना चाहें. इसलिए, उपयोगकर्ताओं के क्लिक, निगरानी में रखे जा सकने वाले और मेज़रमेंट करने लायक मेट्रिक होते हैं, जो एक अच्छे ट्रेनिंग लेबल के तौर पर काम कर सकते हैं. हमारा ट्रेनिंग डेटा, उपयोगकर्ता के पिछले व्यवहार से लिया गया है. इसलिए, हमारे लेबल उपयोगकर्ता की पसंद के हिसाब से तय किए गए क्लिक जैसे मकसद से जनरेट होने चाहिए.
"जूते जिन्हें उपयोगकर्ता पसंद करता है; एक उपयोगी लेबल है.
इन नीतियों के हिसाब से, स्कोर की निगरानी नहीं की जा सकती. साथ ही, इसे मेज़र भी नहीं किया जा सकता. हम सबसे अच्छा यह कर सकते हैं कि चीज़ों को पसंद के मुताबिक बनाने के लिए, प्रॉक्सी मेट्रिक को खोजा जाए.