संग्रह की मदद से व्यवस्थित रहें
अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.
अगर हमने पहली बार अपने मॉडल को ट्रेनिंग दी है, तो मशीन लर्निंग हमारे लिए आसान हो सकती है:
हालांकि, असल में नुकसान की संभावना को समझना काफ़ी मुश्किल हो सकता है. नीचे दिए गए सवालों के जवाब देने के लिए,
लॉसिंग कर्व के बारे में अपनी समझ को समझें.
1. मेरा मॉडल प्रशिक्षित नहीं होगा!
आपके दोस्त मेल और आप यूनिकॉर्न के साथ दिखने वाले पूर्वानुमान पर काम करना जारी रखेंगे.
यह रहा आपका पहला नुकसान.
समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:
सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और जवाब देखें.
आपका मॉडल तैयार नहीं हो रहा है. डीबग करने के लिए यह तरीका आज़माएं:
मॉडल डीबग करना में दिए गए
चरणों का पालन करके देखें कि आपकी सुविधाएं लेबल का अनुमान लगा सकती हैं या नहीं.
खराब उदाहरणों का पता लगाने के लिए, डेटा स्कीमा की मदद से अपने डेटा की जांच करें.
अगर इस प्लॉट के तौर पर, ट्रेनिंग में बदलाव नहीं होता है, तो अपनी लर्निंग रेट को कम करें. इससे, पैरामीटर के स्पेस में मॉडल को बाउंस होने से रोका जा सकता है.
अपने डेटासेट को ऐसे 10 उदाहरणों के तौर पर इस्तेमाल करें जिनके बारे में आपको पता है कि आपका मॉडल उनका अनुमान लगा सकता है. कम किए गए डेटासेट पर बहुत कम
नुकसान पाएं. इसके बाद, पूरे डेटासेट पर
अपने मॉडल को डीबग करना जारी रखें.
अपने मॉडल को आसान बनाएं और पक्का करें कि मॉडल, आपके बेसलाइन से बेहतर परफ़ॉर्म करे. इसके बाद, मॉडल को जटिल बनाएं.
2. विस्फोट हो गया!
मेल आपको एक और कर्व दिखाता है. यहां क्या गड़बड़ी हो रही है और उसे कैसे ठीक किया जा सकता है?
अपना जवाब नीचे लिखें.
सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और
जवाब देखें.
इनपुट डेटा में अनियमित वैल्यू की वजह से आम तौर पर काफ़ी कमी आती है. ये वजहें हो सकती हैं:
इनपुट डेटा में NaN.
अनियमित डेटा की वजह से ग्रेडिएंट का विस्फोट हो रहा है.
डिवीज़न ज़ीरो.
शून्य या नेगेटिव संख्याओं का लॉगारिद्म.
विस्फोट से होने वाले नुकसान को ठीक करने के लिए, अपने बैच में, और अपने इंजीनियरिंग डेटा में अनियमित डेटा की जांच करें. अगर अनियमितता समस्या आती है, तो समस्या की जांच करें. ऐसा नहीं होने पर, अगर अनियमितता बाहरी डेटा की तरह दिखती है, तो पक्का करें कि आउटलायर, आपके डेटा को शफ़ल करके, बैच में बराबर बांटा गया है.
3. मेरी मेट्रिक गलत है!
मेल एक और कर्व चाहता है. क्या गड़बड़ी हो रही है और इसे किस तरह ठीक किया जा सकता है? अपना जवाब नीचे लिखें.
समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:
सेक्शन को बड़ा करके जवाब देखने के लिए, प्लस आइकॉन पर क्लिक करें.
याद रखना 0 पर ही रुक जाता है, क्योंकि आपके उदाहरणों के वर्गीकरण की संभावना
पॉज़िटिव श्रेणी के लिए सीमा से ज़्यादा नहीं होती है. यह समस्या अक्सर तब होती है, जब बहुत ज़्यादा
क्लास असंतुलित होना होती है. याद रखें कि
TF Kerberos से ML लाइब्रेरी, आम तौर पर 0.5 की डिफ़ॉल्ट सीमा का इस्तेमाल करती हैं, ताकि
क्लासिफ़िकेशन मेट्रिक का हिसाब लगाया जा सके.
यह तरीका आज़माएं:
अपना क्लासिफ़िकेशन थ्रेशोल्ड कम करें.
थ्रेशोल्ड-इनफ़ॉर्मैट वाली मेट्रिक की जांच करना, जैसे कि AUC
4. हारने की संख्या बहुत ज़्यादा है!
मेल आपको, डेटासेट की ट्रेनिंग और टेस्टिंग के साथ हुए लॉस कर्व के आंकड़े दिखाता है और पूछता है
"क्या कुछ गलत है?" नीचे अपना जवाब लिखें.
समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:
सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और
जवाब देखें.
आपका मॉडल, ट्रेनिंग डेटा के लिए ज़रूरत से ज़्यादा तैयार है. ये चरण आज़माएं:
मॉडल की क्षमता कम करें.
रेगुलराइज़ेशन जोड़ें.
जांचें कि ट्रेनिंग और टेस्ट के बंटवारे,
आंकड़ों के मुताबिक हैं.
5. मेरा मॉडल रुक गया है
आप थोड़ा इंतज़ार कर रहे हैं और मेल के कुछ दिनों बाद वापस आपको एक और कर्व मिला. यहां क्या समस्या है और मेल को कैसे ठीक किया जा सकता है?
समस्या के बारे में बताएं और मेल से जुड़ी समस्या को ठीक करने का तरीका जानें:
सेक्शन को बड़ा करने के लिए, प्लस आइकॉन पर क्लिक करें और जवाब देखें.
आपकी गतिविधि में बार-बार एक जैसा व्यवहार दिख रहा है. ऐसा हो सकता है कि आपके मॉडल में, इनपुट डेटा बार-बार
दिखाया गया हो. पक्का करें कि शफ़ल, इनपुट डेटा से बार-बार होने वाले व्यवहार को हटा रहा हो.
यह काम कर रहा है!
"यह अब ठीक से काम कर रहा है!" मेल का विस्मयादिबोधक वह आराम से अपनी कुर्सी पर आराम से बैठ जाती हैं और बड़ी सांस लेती है. कर्व बहुत अच्छा लगता है और
आप सफलता प्राप्त करते हैं. मेल और आप अपने मॉडल की पुष्टि के लिए नीचे दी गई
अतिरिक्त जांचों पर चर्चा करते हैं.
असल दुनिया की मेट्रिक
बेसलाइन
रिग्रेशन से जुड़ी समस्याओं का कुल नुकसान
डेटा को अलग-अलग ग्रुप में बांटने से जुड़ी समस्याओं के लिए अन्य मेट्रिक