इस पेज का अनुवाद Cloud Translation API से किया गया है.

नुकसान की वजह को समझना

अगर हमने पहली बार अपने मॉडल को ट्रेनिंग दी है, तो मशीन लर्निंग हमारे लिए आसान हो सकती है:

मशीन लर्निंग मॉडल की ट्रेनिंग के दौरान, एक ऐसा प्लॉट दिखाना जिसमें चलने की सही रफ़्तार में कमी आती है.
लॉस कर्व, x-एक्सिस पर ट्रेनिंग के चरणों की संख्या के मुकाबले y-एक्सिस पर कमी दिखाता है. जैसे-जैसे ट्रेनिंग के चरण बढ़ते हैं, वैसे-वैसे नुकसान कम होने लगता है.
इसके बाद, यह तेज़ी से कम होता जाता है और
कम से कम नुकसान होने की संभावना तक पहुंच जाता है.

हालांकि, असल में नुकसान की संभावना को समझना काफ़ी मुश्किल हो सकता है. नीचे दिए गए सवालों के जवाब देने के लिए, लॉसिंग कर्व के बारे में अपनी समझ को समझें.

1. मेरा मॉडल प्रशिक्षित नहीं होगा!

आपके दोस्त मेल और आप यूनिकॉर्न के साथ दिखने वाले पूर्वानुमान पर काम करना जारी रखेंगे. यह रहा आपका पहला नुकसान.

पिछले प्लॉट के तौर पर, उन ही ऐक्सिस में एक लॉस कर्व प्लॉट है. इसमें नुकसान ज़्यादा नहीं होता, बल्कि बहुत ज़्यादा कमी और कमी आती है, जैसे कि प्लॉट घूमता है.

समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:

सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और जवाब देखें.

आपका मॉडल तैयार नहीं हो रहा है. डीबग करने के लिए यह तरीका आज़माएं:

मॉडल डीबग करना में दिए गए चरणों का पालन करके देखें कि आपकी सुविधाएं लेबल का अनुमान लगा सकती हैं या नहीं.
खराब उदाहरणों का पता लगाने के लिए, डेटा स्कीमा की मदद से अपने डेटा की जांच करें.
अगर इस प्लॉट के तौर पर, ट्रेनिंग में बदलाव नहीं होता है, तो अपनी लर्निंग रेट को कम करें. इससे, पैरामीटर के स्पेस में मॉडल को बाउंस होने से रोका जा सकता है.
अपने डेटासेट को ऐसे 10 उदाहरणों के तौर पर इस्तेमाल करें जिनके बारे में आपको पता है कि आपका मॉडल उनका अनुमान लगा सकता है. कम किए गए डेटासेट पर बहुत कम नुकसान पाएं. इसके बाद, पूरे डेटासेट पर अपने मॉडल को डीबग करना जारी रखें.
अपने मॉडल को आसान बनाएं और पक्का करें कि मॉडल, आपके बेसलाइन से बेहतर परफ़ॉर्म करे. इसके बाद, मॉडल को जटिल बनाएं.

2. विस्फोट हो गया!

मेल आपको एक और कर्व दिखाता है. यहां क्या गड़बड़ी हो रही है और उसे कैसे ठीक किया जा सकता है? अपना जवाब नीचे लिखें.

लॉस कर्व का ग्राफ़, जिससे पता चलता है कि ट्रेनिंग के कुछ चरणों में, 'खर्च' को कैसे कम किया जाता है. साथ ही, आगे की ट्रेनिंग के तरीकों में भी अचानक गिरावट आती है.

समस्या के बारे में बताएं और इसे ठीक करने का तरीका जानें:

सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और जवाब देखें.

इनपुट डेटा में अनियमित वैल्यू की वजह से आम तौर पर काफ़ी कमी आती है. ये वजहें हो सकती हैं:

इनपुट डेटा में NaN.
अनियमित डेटा की वजह से ग्रेडिएंट का विस्फोट हो रहा है.
डिवीज़न ज़ीरो.
शून्य या नेगेटिव संख्याओं का लॉगारिद्म.

विस्फोट से होने वाले नुकसान को ठीक करने के लिए, अपने बैच में, और अपने इंजीनियरिंग डेटा में अनियमित डेटा की जांच करें. अगर अनियमितता समस्या आती है, तो समस्या की जांच करें. ऐसा नहीं होने पर, अगर अनियमितता बाहरी डेटा की तरह दिखती है, तो पक्का करें कि आउटलायर, आपके डेटा को शफ़ल करके, बैच में बराबर बांटा गया है.

3. मेरी मेट्रिक गलत है!

मेल एक और कर्व चाहता है. क्या गड़बड़ी हो रही है और इसे किस तरह ठीक किया जा सकता है? अपना जवाब नीचे लिखें.

इमेज में दो प्लॉट दिख रहे हैं. बाईं ओर के प्लॉट में, नुकसान का सही कर्व दिखता है.
दाईं ओर के प्लॉट में, याद रखने की मेट्रिक 0 पर बनी रहती है, भले ही ट्रेनिंग के चरणों की संख्या बढ़ जाए.

समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:

सेक्शन को बड़ा करके जवाब देखने के लिए, प्लस आइकॉन पर क्लिक करें.

याद रखना 0 पर ही रुक जाता है, क्योंकि आपके उदाहरणों के वर्गीकरण की संभावना पॉज़िटिव श्रेणी के लिए सीमा से ज़्यादा नहीं होती है. यह समस्या अक्सर तब होती है, जब बहुत ज़्यादा क्लास असंतुलित होना होती है. याद रखें कि TF Kerberos से ML लाइब्रेरी, आम तौर पर 0.5 की डिफ़ॉल्ट सीमा का इस्तेमाल करती हैं, ताकि क्लासिफ़िकेशन मेट्रिक का हिसाब लगाया जा सके.

यह तरीका आज़माएं:

अपना क्लासिफ़िकेशन थ्रेशोल्ड कम करें.

थ्रेशोल्ड-इनफ़ॉर्मैट वाली मेट्रिक की जांच करना, जैसे कि AUC

4. हारने की संख्या बहुत ज़्यादा है!

मेल आपको, डेटासेट की ट्रेनिंग और टेस्टिंग के साथ हुए लॉस कर्व के आंकड़े दिखाता है और पूछता है "क्या कुछ गलत है?" नीचे अपना जवाब लिखें.

लॉस कर्व प्लॉट, जिसमें मॉडल के तौर पर ट्रेनिंग और टेस्ट लॉस के बीच का अंतर
दिखाया जाता है.

समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:

सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और जवाब देखें.

आपका मॉडल, ट्रेनिंग डेटा के लिए ज़रूरत से ज़्यादा तैयार है. ये चरण आज़माएं:

मॉडल की क्षमता कम करें.
रेगुलराइज़ेशन जोड़ें.
जांचें कि ट्रेनिंग और टेस्ट के बंटवारे, आंकड़ों के मुताबिक हैं.

5. मेरा मॉडल रुक गया है

आप थोड़ा इंतज़ार कर रहे हैं और मेल के कुछ दिनों बाद वापस आपको एक और कर्व मिला. यहां क्या समस्या है और मेल को कैसे ठीक किया जा सकता है?

लॉस कर्व का प्लॉट, जिसमें दिखाया गया है कि ट्रेनिंग के साथ हारने का शुरूआत हो रहा है, लेकिन उससे बार-बार पैटर्न दिख रहे हैं, जो आयताकार लहर जैसा दिखता है.

समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:

सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और जवाब देखें.

आपकी गतिविधि में बार-बार एक जैसा व्यवहार दिख रहा है. ऐसा हो सकता है कि आपके मॉडल में, इनपुट डेटा बार-बार दिखाया गया हो. पक्का करें कि शफ़ल, इनपुट डेटा से बार-बार होने वाले व्यवहार को हटा रहा हो.

यह काम कर रहा है!

"यह अब ठीक से काम कर रहा है!" मेल का विस्मयादिबोधक वह आराम से अपनी कुर्सी पर आराम से बैठ जाती हैं और बड़ी सांस लेती है. कर्व बहुत अच्छा लगता है और आप सफलता प्राप्त करते हैं. मेल और आप अपने मॉडल की पुष्टि के लिए नीचे दी गई अतिरिक्त जांचों पर चर्चा करते हैं.

असल दुनिया की मेट्रिक

बेसलाइन

रिग्रेशन से जुड़ी समस्याओं का कुल नुकसान

डेटा को अलग-अलग ग्रुप में बांटने से जुड़ी समस्याओं के लिए अन्य मेट्रिक

एक ऐसा प्लॉट, जिसमें नुकसान का कर्व दिखता है.