एमएल समस्या हल करना

यह पुष्टि करने के बाद कि आपकी समस्या को अनुमानित एमएल या जनरेटिव एआई (AI) के ज़रिए ठीक किया गया है, अपनी समस्या को मशीन लर्निंग के हिसाब से बनाया जा सकता है. मशीन लर्निंग की शर्तों में समस्या को फ़्रेम करने के लिए, इन टास्क को पूरा करें:

  • आदर्श परिणाम और मॉडल का लक्ष्य निर्धारित करें.
  • मॉडल का आउटपुट पहचानें.
  • सक्सेस मेट्रिक तय करें.

सही नतीजा और मॉडल का लक्ष्य तय करना

अगर मशीन लर्निंग मॉडल अलग-अलग है, तो कैंपेन का नतीजा क्या होगा? दूसरे शब्दों में, अपने प्रॉडक्ट या सुविधा से वह कौनसा काम कराना है जो आपको करना है? यह वही स्टेटमेंट है जिसे आपने पहले लक्ष्य की जानकारी देना सेक्शन में बताया था.

साफ़ तौर पर यह तय करके कि आप मॉडल से क्या करना चाहते हैं, मॉडल के लक्ष्य को आदर्श नतीजे से कनेक्ट करें. नीचे दी गई टेबल में काल्पनिक ऐप्लिकेशन के लिए आदर्श नतीजे और मॉडल के लक्ष्य के बारे में बताया गया है:

ऐप्लिकेशन सबसे सही नतीजा मॉडल का लक्ष्य
मौसम की जानकारी देने वाला ऐप्लिकेशन किसी भौगोलिक क्षेत्र के लिए, छह घंटे की बढ़ोतरी में बारिश की गिनती करें. चुनिंदा भौगोलिक क्षेत्रों के लिए, छह घंटे तक बारिश की संभावना का अनुमान लगाएं.
फ़ैशन ऐप्लिकेशन शर्ट के अलग-अलग डिज़ाइन जनरेट करें. टेक्स्ट और एक इमेज की मदद से, शर्ट के तीन तरह के डिज़ाइन जनरेट करें. इनमें टेक्स्ट से स्टाइल और रंग के बारे में पता चलता है और इमेज, शर्ट की तरह (टी-शर्ट, बटन-अप, पोलो) है.
वीडियो ऐप्लिकेशन काम के वीडियो के सुझाव दें. यह अनुमान लगाएं कि कोई व्यक्ति वीडियो पर क्लिक करेगा या नहीं.
मेल ऐप्लिकेशन स्पैम का पता लगाएं. अनुमान लगाएं कि कोई ईमेल स्पैम है या नहीं.
वित्तीय ऐप्लिकेशन खबर के अलग-अलग स्रोतों से मिलने वाली वित्तीय जानकारी के बारे में बताएं. पिछले सात दिनों के, वित्तीय रुझानों के बारे में 50 शब्दों में खास जानकारी जनरेट करें.
मैप ऐप्लिकेशन यात्रा में लगने वाले समय का हिसाब लगाएं. अनुमान लगाएं कि दो बिंदुओं के बीच यात्रा करने में कितना समय लगेगा.
बैंकिंग से जुड़े ऐप्लिकेशन धोखाधड़ी वाले लेन-देन की पहचान करना. इस बात का अंदाज़ा लगाएं कि कार्ड मालिक ने लेन-देन किया है या नहीं.
डाइनिंग ऐप्लिकेशन रेस्टोरेंट के मेन्यू के हिसाब से पकवान की पहचान करें. अनुमान लगाएं कि रेस्टोरेंट किस तरह का है.
ई-कॉमर्स ऐप्लिकेशन कंपनी के प्रॉडक्ट के बारे में, ग्राहक सहायता टीम के लिए जवाब जनरेट करें. भावनाओं का विश्लेषण और संगठन के नॉलेज बेस का इस्तेमाल करके जवाब जनरेट करें.

अपनी ज़रूरत के मुताबिक आउटपुट की पहचान करें

मॉडल टाइप का आपका चुनाव, आपकी समस्या के खास संदर्भ और शर्तों पर निर्भर करता है. मॉडल से मिलने वाला आउटपुट, आदर्श नतीजे में तय किया गया काम पूरा होना चाहिए. इसलिए, सबसे पहले इसका जवाब दें कि "अपनी समस्या को हल करने के लिए मुझे किस तरह के आउटपुट की ज़रूरत होगी?"

अगर आपको किसी चीज़ को कैटगरी में बांटना है या संख्या का अनुमान लगाना है, तो शायद आपको अनुमानित एमएल इस्तेमाल करना पड़े. अगर आपको नया कॉन्टेंट जनरेट करना है या नैचुरल लैंग्वेज लर्निंग से जुड़ा कोई आउटपुट जनरेट करना है, तो जनरेटिव एआई का इस्तेमाल किया जा सकता है.

नीचे दी गई टेबल में, अनुमानित एमएल और जनरेटिव एआई आउटपुट की सूची दी गई है:

टेबल 1. अनुमानित ML
मशीन लर्निंग सिस्टम उदाहरण के तौर पर दिया गया आउटपुट
कैटगरी बाइनरी किसी ईमेल को स्पैम के तौर पर मार्क करना या उसे स्पैम के तौर पर मार्क करना.
मल्टी-क्लास सिंगल-लेबल इमेज में किसी जानवर की कैटगरी तय करना.
मल्टी-क्लास मल्टी-लेबल किसी इमेज में दिए गए सभी जानवरों की कैटगरी तय करें.
अंकों में यूनिडाइमेंशनल रिग्रेशन अनुमान लगाएं कि वीडियो को कितने व्यू मिलेंगे.
मल्टीडाइमेंशन रिग्रेशन किसी व्यक्ति के ब्लड प्रेशर, धड़कन की दर, और कोलेस्ट्रॉल के लेवल के बारे में अनुमान लगाएं.
टेबल 2. जनरेटिव एआई
मॉडल टाइप उदाहरण के तौर पर दिया गया आउटपुट
टेक्स्ट
लेख के बारे में ख़ास जानकारी दें.

ग्राहकों से मिलने वाली समीक्षाओं का जवाब देना.

दस्तावेज़ों का अंग्रेज़ी से मैंडरिन में अनुवाद करें.

प्रॉडक्ट के ब्यौरे लिखें.

कानूनी दस्तावेज़ों का विश्लेषण किया जा सकता है.
इमेज
मार्केटिंग इमेज बनाएं.

फ़ोटो में विज़ुअल इफ़ेक्ट इस्तेमाल करें.

प्रॉडक्ट डिज़ाइन वैरिएशन जनरेट करें.
ऑडियो
किसी खास लहजे में डायलॉग जनरेट करें.

जैज़ जैसी किसी खास शैली का शॉर्ट म्यूज़िक कंपोज़िशन जनरेट करें.
वीडियो
असली लगने वाले वीडियो बनाएं.

वीडियो फ़ुटेज का विश्लेषण करें और विज़ुअल इफ़ेक्ट इस्तेमाल करें.
मल्टीमोडल अलग-अलग तरह के वीडियो बनाएं. जैसे, टेक्स्ट कैप्शन वाला वीडियो.

कैटगरी

क्लासिफ़िकेशन मॉडल यह अनुमान लगाता है कि इनपुट डेटा किस कैटगरी का है. उदाहरण के लिए, किसी इनपुट को A, B या C की कैटगरी में रखा जाना चाहिए या नहीं.

क्लासिफ़िकेशन मॉडल, अनुमान लगा रहा है.

पहला डायग्राम. क्लासिफ़िकेशन मॉडल, जो अनुमान लगाता है.

मॉडल के अनुमान के आधार पर, आपका ऐप्लिकेशन फ़ैसला ले सकता है. उदाहरण के लिए, अगर अनुमान कैटगरी A है, तो X करें. अगर अनुमान कैटगरी B है, तो Y करें; अगर अनुमान कैटगरी C है, तो Z करें. कुछ मामलों में, अनुमान ऐप्लिकेशन का आउटपुट है.

प्रॉडक्ट कोड, मॉडल के आउटपुट का इस्तेमाल करके फ़ैसला लेता है.

दूसरा डायग्राम. डेटा की कैटगरी तय करने वाले मॉडल के आउटपुट का इस्तेमाल, प्रॉडक्ट कोड में फ़ैसला लेने के लिए किया जाता है.

रिग्रेशन

रिग्रेशन मॉडल, अंकों वाली वैल्यू का अनुमान लगाता है.

रिग्रेशन मॉडल से अनुमान लगाया जा रहा है.

तीसरा डायग्राम. अंकों से अनुमान लगाने वाला रिग्रेशन मॉडल.

मॉडल के अनुमान के आधार पर, आपका ऐप्लिकेशन फ़ैसला ले सकता है. उदाहरण के लिए, अगर अनुमान रेंज A में आता है, तो X करें; अगर अनुमान सीमा B में आता है, तो Y करें; अगर अनुमान सीमा C में आता है, तो Z करें. कुछ मामलों में, अनुमान ऐप्लिकेशन का आउटपुट होता है.

प्रॉडक्ट कोड, मॉडल के आउटपुट का इस्तेमाल करके फ़ैसला लेता है.

चौथा डायग्राम. फ़ैसला लेने के लिए, प्रॉडक्ट कोड में रिग्रेशन मॉडल के आउटपुट का इस्तेमाल किया जाता है.

नीचे दिए गए उदाहरण पर विचार करें:

आपको वीडियो को उनकी अनुमानित लोकप्रियता के हिसाब से कैश मेमोरी में सेव करना है. दूसरे शब्दों में, अगर आपका मॉडल यह अनुमान लगाता है कि कोई वीडियो लोकप्रिय होगा, तो उसे उपयोगकर्ताओं को तुरंत दिखाना है. इसके लिए, आपको ज़्यादा असरदार और महंगे कैश मेमोरी का इस्तेमाल करना होगा. दूसरे वीडियो के लिए, अलग-अलग कैश मेमोरी का इस्तेमाल करना होगा. कैश मेमोरी में सेव करने की शर्तें नीचे दी गई हैं:

  • अगर किसी वीडियो को 50 या उससे ज़्यादा व्यू मिलने का अनुमान है, तो महंगे कैश का इस्तेमाल करें.
  • अगर किसी वीडियो को 30 से 50 के बीच देखे जाने का अनुमान है, तो आप सस्ते कैश मेमोरी का इस्तेमाल करेंगे.
  • अगर वीडियो को 30 से कम व्यू मिलने का अनुमान है, तो वीडियो को कैश मेमोरी में सेव नहीं किया जाएगा.

आपको लगता है कि रिग्रेशन मॉडल सही तरीका है, क्योंकि आपके लिए न्यूमेरिक वैल्यू यानी व्यू की संख्या का अनुमान लगाया जाएगा. हालांकि, रिग्रेशन मॉडल की ट्रेनिंग लेते समय, आपको यह एहसास होता है कि इससे भी 30 व्यू वाले वीडियो के लिए, 28 और 32 का अनुमान लॉस मिल सकता है. दूसरे शब्दों में कहें, तो अगर अनुमान 28 बनाम 32 है, तो आपके ऐप्लिकेशन का व्यवहार बहुत अलग होगा. हालांकि, मॉडल दोनों अनुमानों को समान रूप से अच्छा मानता है.

एक मॉडल को ट्रेनिंग दी जा रही है और उसके नुकसान की जांच की जा रही है.

पांचवा डायग्राम. किसी रिग्रेशन मॉडल को ट्रेनिंग देना.

रिग्रेशन मॉडल को प्रॉडक्ट के तय थ्रेशोल्ड की जानकारी नहीं होती. इसलिए, अगर किसी रिग्रेशन मॉडल के अनुमानों में छोटे-छोटे अंतर की वजह से आपके ऐप्लिकेशन के काम करने के तरीके में काफ़ी बदलाव होता है, तो आपको इसके बजाय क्लासिफ़िकेशन मॉडल लागू करना चाहिए.

इस मामले में, क्लासिफ़िकेशन मॉडल सही व्यवहार करेगा, क्योंकि क्लासिफ़िकेशन मॉडल, 32 से 28 के अनुमान पर ज़्यादा नुकसान पहुंचा सकता है. दूसरे शब्दों में कहें, तो डेटा की कैटगरी तय करने वाले मॉडल डिफ़ॉल्ट रूप से थ्रेशोल्ड जनरेट करते हैं.

यह स्थिति दो ज़रूरी बातों को हाइलाइट करती है:

  • फ़ैसले का अनुमान लगाएं. जब मुमकिन हो, तब यह अनुमान लगाएं कि आपका ऐप्लिकेशन क्या फ़ैसला लेगा. वीडियो के उदाहरण में, क्लासिफ़िकेशन मॉडल इस फ़ैसले का अनुमान लगा सकता है. मॉडल से अपने ऐप्लिकेशन का व्यवहार छिपाने से आपका ऐप्लिकेशन गलत व्यवहार कर सकता है.

  • समस्या की सीमाओं को समझें. अगर आपका ऐप्लिकेशन अलग-अलग थ्रेशोल्ड के मुताबिक अलग-अलग कार्रवाइयां करता है, तो तय करें कि वे थ्रेशोल्ड तय हैं या डाइनैमिक हैं.

    • डाइनैमिक थ्रेशोल्ड: अगर थ्रेशोल्ड डाइनैमिक हैं, तो रिग्रेशन मॉडल का इस्तेमाल करें और अपने ऐप्लिकेशन के कोड में थ्रेशोल्ड की सीमाएं सेट करें. इससे, मॉडल सही अनुमान लगाकर, थ्रेशोल्ड को आसानी से अपडेट कर सकता है.
    • तय थ्रेशोल्ड: अगर थ्रेशोल्ड तय किए गए हैं, तो क्लासिफ़िकेशन मॉडल का इस्तेमाल करें. साथ ही, अपने डेटासेट को थ्रेशोल्ड की सीमाओं के आधार पर लेबल करें.

    आम तौर पर, कैश मेमोरी का प्रावधान डाइनैमिक होता है और थ्रेशोल्ड समय के साथ बदलते रहते हैं. इसलिए, खास तौर पर यह कैश मेमोरी में होने वाली एक समस्या है, इसलिए रिग्रेशन मॉडल सबसे अच्छा विकल्प है. हालांकि, कई समस्याओं के लिए, थ्रेशहोल्ड को ठीक कर दिया जाएगा, जिससे क्लासिफ़िकेशन मॉडल को सबसे अच्छा हल मिलता है.

आइए, एक अन्य उदाहरण देखें. अगर आपको ऐसा मौसम ऐप्लिकेशन बनाना है जिसका सबसे अच्छा नतीजा उपयोगकर्ताओं को यह बताना हो कि अगले छह घंटों में कितनी बारिश होगी, तो आपके पास precipitation_amount. लेबल का अनुमान लगाने वाले रिग्रेशन मॉडल का इस्तेमाल करने का विकल्प है

सबसे सही नतीजा सबसे सही लेबल
उपयोगकर्ताओं को बताएं कि अगले छह घंटों में उनके इलाके में कितनी बारिश होगी. precipitation_amount

मौसम की जानकारी देने वाले ऐप्लिकेशन के उदाहरण में, लेबल सीधे तौर पर सटीक नतीजे के बारे में बताता है. हालांकि, कुछ मामलों में, आदर्श नतीजे और लेबल के बीच वन-टू-वन का संबंध साफ़ तौर पर नहीं दिखता. जैसे, वीडियो ऐप्लिकेशन में काम के वीडियो के सुझाव देना सबसे सही होता है. हालांकि, useful_to_user. नाम के डेटासेट में कोई लेबल नहीं है

सबसे सही नतीजा सबसे सही लेबल
काम के वीडियो के सुझाव दें. ?

इसलिए, आपको प्रॉक्सी लेबल ढूंढना होगा.

प्रॉक्सी लेबल

प्रॉक्सी लेबल उन लेबल की जगह लेते हैं जो डेटासेट में नहीं हैं. प्रॉक्सी लेबल तब ज़रूरी होते हैं, जब आप सीधे तौर पर यह नहीं माप पाते कि आपको क्या अनुमान लगाना है. वीडियो ऐप्लिकेशन में, हम सीधे तौर पर यह आकलन नहीं कर सकते कि उपयोगकर्ता को कोई वीडियो काम का लगेगा या नहीं. यह बहुत बढ़िया होगा अगर डेटासेट में useful की सुविधा हो और उपयोगकर्ताओं ने उन सभी वीडियो को मार्क किया जो उन्हें काम के लगे. हालांकि, डेटासेट ऐसा नहीं है. इसलिए, हमें एक प्रॉक्सी लेबल की ज़रूरत होगी जो सुविधा के हिसाब से काम का हो.

उपयोगिता के लिए प्रॉक्सी लेबल यह हो सकता है कि उपयोगकर्ता वीडियो को शेयर करेगा या पसंद करेगा या नहीं.

सबसे सही नतीजा प्रॉक्सी लेबल
काम के वीडियो के सुझाव दें. shared OR liked

प्रॉक्सी लेबल को इस्तेमाल करते समय सावधानी बरतें, क्योंकि वे सीधे तौर पर आपका अनुमान नहीं मापते. उदाहरण के लिए, नीचे दी गई टेबल में काम के वीडियो के सुझाव देने के लिए, संभावित प्रॉक्सी लेबल से जुड़ी समस्याओं के बारे में बताया गया है:

प्रॉक्सी लेबल गड़बड़ी
अनुमान लगाएं कि उपयोगकर्ता "पसंद करें" बटन पर क्लिक करेगा या नहीं. ज़्यादातर उपयोगकर्ता, कभी भी "पसंद करें" पर क्लिक नहीं करते.
यह अनुमान लगाएं कि कोई वीडियो लोकप्रिय होगा या नहीं. आपके हिसाब से नहीं. ऐसा हो सकता है कि कुछ लोगों को लोकप्रिय वीडियो पसंद न आएं.
यह अनुमान लगाएं कि दर्शक वीडियो शेयर करेगा या नहीं. कुछ उपयोगकर्ता, वीडियो शेयर नहीं करते. कभी-कभी, लोग वीडियो इसलिए शेयर करते हैं, क्योंकि उन्हें वे पसंद नहीं होते.
यह अनुमान लगाएं कि उपयोगकर्ता 'चलाएं' पर क्लिक करेगा या नहीं. इससे क्लिकबेट बढ़ जाता है.
यह अनुमान लगाएं कि वे वीडियो को कितनी देर तक देखते हैं. शॉर्ट वीडियो के मुकाबले, लंबी अवधि के वीडियो अलग-अलग तरीके से पसंद किए जाते हैं.
यह अनुमान लगाएं कि व्यक्ति ने वीडियो को कितनी बार देखा है. ऐसी वीडियो शैलियों के बजाय "फिर से देखे जा सकने वाले" वीडियो को बढ़ावा दिया जाता है जिन्हें देखा नहीं जा सकता.

कोई भी प्रॉक्सी लेबल आपके आदर्श परिणाम का सटीक विकल्प नहीं हो सकता. सभी में संभावित समस्याएं हो सकती हैं. वह विकल्प चुनें जिसमें आपके इस्तेमाल के उदाहरण में सबसे कम समस्याएं हों.

अपनी समझ देखें

एक कंपनी, मशीन लर्निंग का इस्तेमाल अपनी सेहत और तंदुरुस्ती से जुड़े ऐप्लिकेशन में करना चाहती है, ताकि वह लोगों को बेहतर महसूस कराए. क्या आपको लगता है कि लक्ष्यों को पूरा करने के लिए उन्हें प्रॉक्सी लेबल का इस्तेमाल करना होगा?
हां, कंपनी को प्रॉक्सी लेबल ढूंढने होंगे. खुशी और सेहत जैसी कैटगरी को सीधे तौर पर नहीं मापा जा सकता. इसके बजाय, इन्हें कुछ दूसरी सुविधाओं के हिसाब से भी इस्तेमाल किया जाना चाहिए. जैसे, हर हफ़्ते कसरत करने में बिताए गए घंटे या शौक के लिए या दोस्तों के साथ बिताया गया समय.
नहीं, कंपनी को प्रॉक्सी लेबल का इस्तेमाल करने की ज़रूरत नहीं होगी. खुशी और सेहत का आकलन सीधे तौर पर किया जा सकता है.

जनरेशन

ज़्यादातर मामलों में, अपने जनरेटिव मॉडल को ट्रेनिंग नहीं दी जाती. ऐसा करने के लिए, बहुत ज़्यादा ट्रेनिंग डेटा और कंप्यूटेशनल संसाधनों की ज़रूरत होती है. इसके बजाय, आपको पहले से ट्रेनिंग दिए गए जनरेटिव मॉडल को पसंद के मुताबिक बनाना होगा. अपनी पसंद का आउटपुट पाने के लिए, जनरेटिव मॉडल पाने के लिए, आपको इनमें से एक या ज़्यादा तकनीकों का इस्तेमाल करना पड़ सकता है:

  • डिस्टिलेशन. किसी बड़े मॉडल का छोटा वर्शन बनाने के लिए, उस बड़े मॉडल से सिंथेटिक लेबल वाला डेटासेट जनरेट किया जाता है जिसका इस्तेमाल छोटे मॉडल को ट्रेनिंग देने के लिए किया जाता है. जनरेटिव मॉडल आम तौर पर कई बड़े होते हैं और इनमें ज़रूरी संसाधनों (जैसे कि मेमोरी और बिजली) की खपत होती है. डिस्टिलेशन की मदद से, छोटे और कम रिसॉर्स वाले मॉडल की मदद से बड़े मॉडल की परफ़ॉर्मेंस का अनुमान लगाया जा सकता है.

  • फ़ाइन ट्यूनिंग या पैरामीटर की बेहतर ट्यूनिंग. किसी खास टास्क पर मॉडल की परफ़ॉर्मेंस को बेहतर बनाने के लिए, आपको उस डेटासेट पर मॉडल को और बेहतर बनाना होगा जिसमें ऐसे आउटपुट के उदाहरण हों जो आपको जनरेट करने हैं.

  • प्रॉम्प्ट इंजीनियरिंग. मॉडल को कोई खास टास्क करने या किसी खास फ़ॉर्मैट में आउटपुट देने के लिए, मॉडल को वह काम बताएं जो आपको करना है. इसके अलावा, यह भी समझाया जाएगा कि आउटपुट को कैसे फ़ॉर्मैट किया जाए. दूसरे शब्दों में, प्रॉम्प्ट में बोलकर इस्तेमाल करने से जुड़े निर्देश शामिल हो सकते हैं.

    उदाहरण के लिए, अगर आपको लेखों के छोटे-छोटे जवाब चाहिए, तो ये इनपुट डालें:

    Produce 100-word summaries for each article.
    

    अगर आपको मॉडल से किसी खास रीडिंग लेवल के लिए टेक्स्ट जनरेट करना है, तो आपको यह इनपुट करना होगा:

    All the output should be at a reading level for a 12-year-old.
    

    अगर आपको मॉडल किसी खास फ़ॉर्मैट में आउटपुट देना है, तो यह बताया जा सकता है कि आउटपुट को कैसे फ़ॉर्मैट किया जाना चाहिए—उदाहरण के लिए, "नतीजों को टेबल में फ़ॉर्मैट करें"—या आप उदाहरण देकर टास्क दिखा सकते हैं. उदाहरण के लिए, यह इनपुट किया जा सकता है:

    Translate words from English to Spanish.
    
    English: Car
    Spanish: Auto
    
    English: Airplane
    Spanish: Avión
    
    English: Home
    Spanish:______
    

डिस्टिलेशन और फ़ाइन-ट्यूनिंग से, मॉडल के पैरामीटर अपडेट हो जाते हैं. प्रॉम्प्ट इंजीनियरिंग से मॉडल के पैरामीटर अपडेट नहीं होते. इसके बजाय, प्रॉम्प्ट इंजीनियरिंग से मॉडल को यह सीखने में मदद मिलती है कि प्रॉम्प्ट के कॉन्टेक्स्ट से मनचाहा आउटपुट कैसे तैयार किया जाए.

कुछ मामलों में, आपको टेस्ट डेटासेट की भी ज़रूरत होगी, ताकि जाना जा सकने वाली वैल्यू के आधार पर जनरेटिव मॉडल के आउटपुट की जांच की जा सके. जैसे, यह जांचना कि मॉडल के जवाब, इंसानों के जनरेट किए गए जवाब जैसे हैं या मॉडल के जवाब को कोई व्यक्ति अच्छा रेटिंग देता है.

जनरेटिव एआई का इस्तेमाल, अनुमानित एमएल सॉल्यूशन, जैसे कि क्लासिफ़िकेशन या रिग्रेशन को लागू करने के लिए भी किया जा सकता है. उदाहरण के लिए, प्राकृतिक भाषा के बारे में अच्छी जानकारी होने की वजह से, बड़े लैंग्वेज मॉडल (एलएलएम) किसी टास्क के लिए ट्रेन किए गए अनुमानित एमएल की तुलना में, टेक्स्ट की कैटगरी तय करने वाले टास्क ज़्यादा बेहतर तरीके से कर सकते हैं.

सक्सेस मेट्रिक तय करना

वे मेट्रिक तय करें जिनका इस्तेमाल करके आपको यह तय करना है कि एमएल को लागू करना सफल हुआ है या नहीं. सफलता के मेट्रिक से यह तय होता है कि आपको किस चीज़ की ज़रूरत है. जैसे, लोगों की दिलचस्पी या सही कार्रवाई करने में उपयोगकर्ताओं की मदद करना, जैसे कि ऐसे वीडियो देखना जो उनके लिए काम के हों. सफलता की मेट्रिक, मॉडल की इवैलुएशन मेट्रिक से अलग होती हैं. जैसे, सटीक होना, सटीक काम करना, रीकॉल या AUC.

उदाहरण के लिए, मौसम की जानकारी देने वाले ऐप्लिकेशन की सफलता और फ़ेलियर मेट्रिक को इस तरह परिभाषित किया जा सकता है:

हो गया "क्या बारिश होगी?" सुविधा को उपयोगकर्ता पहले की तुलना में 50 प्रतिशत ज़्यादा खोलते हैं.
असफल लोग "क्या बारिश होगी?" सुविधा पहले से ज़्यादा बार नहीं खोली जाएगी.

वीडियो ऐप्लिकेशन की मेट्रिक को इस तरह से परिभाषित किया जा सकता है:

हो गया उपयोगकर्ता साइट पर औसतन 20 प्रतिशत ज़्यादा समय बिताते हैं.
असफल उपयोगकर्ता पहले से औसतन साइट पर ज़्यादा समय नहीं बिताते हैं.

हमारा सुझाव है कि आप अपने लक्ष्यों को पूरा करने के लिए सही मेट्रिक तय करें. हालांकि, ऊंची महत्वाकांक्षाओं की वजह से, सफलता और असफलता के बीच में फ़र्क़ हो सकता है. उदाहरण के लिए, उपयोगकर्ता पहले के मुकाबले साइट पर औसतन 10 प्रतिशत ज़्यादा समय बिता रहे हैं, तो इसका मतलब यह नहीं है कि साइट पर पहले के मुकाबले 10 प्रतिशत ज़्यादा समय बीत चुका है. जितना ज़रूरी है, उतना अंतर तय नहीं है.

सबसे महत्वपूर्ण बात यह है कि आपके मॉडल की सफलता की परिभाषा के करीब या उससे आगे बढ़ने की क्षमता है. उदाहरण के लिए, मॉडल की परफ़ॉर्मेंस का विश्लेषण करते समय, यह सवाल सोचें: क्या मॉडल में सुधार करने से, आपको सफलता के लिए तय किए गए मानदंड के ज़्यादा करीब मिलेंगे? उदाहरण के लिए, किसी मॉडल में आकलन की बेहतरीन मेट्रिक हो सकती हैं, लेकिन यह आपको सफलता के मानदंड के करीब नहीं ले जाता है. इससे पता चलता है कि एक बेहतरीन मॉडल होने के बावजूद, आपके पास कामयाबी का वह पैमाना पूरा नहीं होगा जो आपने तय किया था. वहीं दूसरी ओर, किसी मॉडल की आकलन मेट्रिक खराब हो सकती है, लेकिन जब आपको सफलता की शर्तों के करीब ले जाया जाएगा, तो इससे पता चलेगा कि मॉडल में सुधार करने से आपको सफलता के और करीब मिलेंगे.

यह तय करते समय कि मॉडल काम का है या नहीं, इन डाइमेंशन पर विचार करें:

  • ज़्यादा अच्छा नहीं है, लेकिन जारी रखें. इस मॉडल का इस्तेमाल प्रोडक्शन एनवायरमेंट में नहीं किया जाना चाहिए. हालांकि, समय के साथ इसमें काफ़ी सुधार हो सकता है.

  • बहुत बढ़िया, और जारी रखें. इस मॉडल का इस्तेमाल प्रोडक्शन में किया जा सकता है और इसे और बेहतर बनाया जा सकता है.

  • बहुत अच्छा है, लेकिन इसे बेहतर नहीं बनाया जा सकता. यह मॉडल प्रोडक्शन के माहौल में है, लेकिन यह शायद उतना ही अच्छा है जितना हो सकता है.

  • बहुत अच्छा नहीं है, और कभी भी नहीं होगा. इस मॉडल का इस्तेमाल प्रोडक्शन के लिए नहीं किया जाना चाहिए और न ही ज़्यादा ट्रेनिंग दी जानी चाहिए.

मॉडल को बेहतर बनाने का फ़ैसला करते समय, फिर से आकलन करें कि क्या रिसॉर्स में बढ़ोतरी, जैसे कि इंजीनियरिंग समय और कंप्यूट कॉस्ट, मॉडल में होने वाले अनुमानित सुधार को सही ठहराना है.

सफलता और असफलता की मेट्रिक तय करने के बाद, आपको यह तय करना होगा कि उनका आकलन कितनी बार किया जाएगा. उदाहरण के लिए, सिस्टम लागू करने के छह दिन, छह हफ़्ते या छह महीने बाद सफलता मेट्रिक को मापा जा सकता है.

गड़बड़ी वाली मेट्रिक का विश्लेषण करते समय, देखें कि सिस्टम में गड़बड़ी क्यों हुई. उदाहरण के लिए, मॉडल यह अनुमान लगा सकता है कि लोग किन वीडियो पर क्लिक करेंगे, लेकिन मॉडल क्लिकबेट का सुझाव देना शुरू कर सकता है. इससे उपयोगकर्ता की दिलचस्पी की दिलचस्पी कम हो सकती है. मौसम ऐप्लिकेशन के उदाहरण में, यह अनुमान लगा सकता है कि बारिश कब होगी, लेकिन बहुत बड़े इलाके के लिए.

अपनी समझ देखें

एक फ़ैशन फ़र्म ज़्यादा कपड़े बेचना चाहती है. कोई व्यक्ति मशीन लर्निंग का इस्तेमाल करके यह पता लगाने का सुझाव देता है कि कंपनी को कौनसे कपड़े बनाने चाहिए. उन्हें लगता है कि वे किसी मॉडल को ट्रेनिंग देकर, यह तय कर सकते हैं कि किस तरह के कपड़े फ़ैशन का चलन में हैं. मॉडल को ट्रेनिंग देने के बाद, वे इसे अपने कैटलॉग में शामिल करना चाहते हैं, ताकि यह तय कर सकें कि कौनसे कपड़े बनाने हैं.

उन्हें मशीन लर्निंग के हिसाब से अपनी समस्या किस तरह हल करनी चाहिए?

सबसे सही नतीजा: तय करें कि कौनसे प्रॉडक्ट बनाने हैं.

मॉडल का मकसद: अंदाज़ा लगाएं कि कौनसे कपड़े फ़ैशन के हिसाब से हैं.

मॉडल आउटपुट: बाइनरी क्लासिफ़िकेशन, in_fashion, not_in_fashion

सफलता मेट्रिक: बनाए गए कपड़ों का 70 प्रतिशत या इससे ज़्यादा बेचें.

सबसे सही नतीजा: तय करें कि कितना कपड़ा और सप्लाई ऑर्डर करना है.

मॉडल का लक्ष्य: अनुमान लगाएं कि हर सामान को कितना बनाना है.

मॉडल आउटपुट: बाइनरी क्लासिफ़िकेशन, make, do_not_make

सफलता मेट्रिक: बनाए गए कपड़ों का 70 प्रतिशत या इससे ज़्यादा बेचें.

सबसे सही नतीजा यह तय करना नहीं है कि कितना कपड़े और सामान ऑर्डर करना चाहिए. इससे यह तय किया जाता है कि कोई सामान बनाया जाना चाहिए या नहीं. इसलिए, मॉडल का लक्ष्य गलत मकसद को पूरा करता है.