अपनी समझ की जांच करें: मॉडल डीबग करना

नीचे दिए गए सवालों के लिए, अपने जवाब पर क्लिक करके उसे बड़ा करें.

मॉडलिंग अप्रोच

आपको और आपके दोस्त मेल को यूनिकॉर्न पसंद है. असल में, आपको यूनिकॉर्न बहुत पसंद आते हैं, तो आप मशीन लर्निंग का इस्तेमाल करके यूनिकॉर्न के दिखने का अनुमान लगाते हैं. आपके पास यूनिकॉर्न की दिखने वाली 10,000 इकाइयों का डेटासेट है. हर दिखावट के लिए, डेटासेट में जगह, दिन का समय, ऊंचाई, तापमान, नमी, जनसंख्या घनत्व, पेड़ों से ढकी जगह, इंद्रधनुष की मौजूदगी, और कई दूसरी सुविधाएं शामिल होती हैं.

आप अपने एमएल मॉडल को डेवलप करना शुरू करना चाहते हैं. डेवलपमेंट शुरू करने के लिए, इनमें से कौनसा तरीका अच्छा है?
यूनिकॉर्न अक्सर सुबह और शाम को दिखते हैं. इसलिए, लीनियर मॉडल बनाने के लिए "दिन का समय" सुविधा का इस्तेमाल करें.
सही. लीनियर मॉडल, एक या दो बेहतर अनुमान लगाने वाली सुविधाओं का इस्तेमाल शुरू करने का एक असरदार तरीका है.
यूनिकॉर्न के दिखने का अनुमान लगाना बहुत मुश्किल काम है. इसलिए, सभी उपलब्ध सुविधाओं के साथ डीप न्यूरल नेटवर्क का इस्तेमाल करें.
गलत. कॉम्प्लेक्स मॉडल से शुरू करने पर, डीबग करना आसान हो जाता है.
एक सामान्य लीनियर मॉडल के साथ शुरुआत करें, लेकिन सभी सुविधाओं का इस्तेमाल करके पक्का करें कि आसान मॉडल में अनुमानित पावर हो.
गलत. अगर आप लीनियर मॉडल के साथ भी कई सुविधाओं का इस्तेमाल करते हैं, तो नतीजे में मिलने वाला मॉडल मुश्किल होता है और उसे डीबग करना मुश्किल होता है.

बेसलाइन

औसत वर्ग गड़बड़ी (MSE) के नुकसान के साथ रिग्रेशन का इस्तेमाल करके, आप राइड की अवधि, दूरी, शुरुआत की जगह, और आखिर का इस्तेमाल करके एक टैक्सी राइड की लागत का अनुमान लगाते हैं. आपको पता है:

  • सामान्य राइड की कीमत 100 रुपये है.
  • राइड की लागत, एक किलोमीटर प्रति तय रकम से ज़्यादा होती है.
  • मुख्य इलाके में राइड का शुल्क अलग से लिया जाता है.
  • राइड की लागत कम से कम तीन डॉलर होनी चाहिए.

तय करें कि नीचे दी गई बेसलाइन उपयोगी हैं या नहीं.

क्या यह काम का है: हर राइड का शुल्क 15 डॉलर है.
हां
सही. औसत लागत, एक उपयोगी बेसलाइन है.
नहीं
गलत. हमेशा किसी दूसरी वैल्यू का अनुमान लगाने के बजाय, औसत तरीके से MSE का अनुमान लगाना. इसलिए, इस बेसलाइन के लिए किसी मॉडल की जांच करने से तुलना करने में मदद मिलती है.
यह राइड की कीमत के स्टैंडर्ड डिवीऐशन पर निर्भर करता है.
गलत. स्टैंडर्ड डिवीऐशन पर ध्यान दिए बिना, राइड की औसत लागत एक उपयोगी बेसलाइन है. ऐसा इसलिए, क्योंकि हमेशा किसी अन्य वैल्यू का अनुमान लगाने के मुकाबले, औसत MSE में औसत नतीजों का अनुमान लगाया जाता है.
क्या यह बेसलाइन है और एक प्रशिक्षित मॉडल है. इसमें, सुविधा के लिए सिर्फ़ समयसीमा और ऑरिजिन का इस्तेमाल किया जाता है.
हां
गलत. प्रोडक्शन में मॉडल की पूरी तरह से पुष्टि हो जाने के बाद ही आपको बेसलाइन के तौर पर, प्रशिक्षित मॉडल का इस्तेमाल करना चाहिए. इसके अलावा, बुनियादी मॉडल के मुकाबले, ट्रेनिंग वाले मॉडल की पुष्टि की जानी चाहिए.
नहीं
सही. प्रोडक्शन में मॉडल की पूरी तरह से पुष्टि हो जाने के बाद ही आपको बेसलाइन के तौर पर, प्रशिक्षित मॉडल का इस्तेमाल करना चाहिए.
क्या यह बेसलाइन है: राइड का शुल्क, राइड की दूरी (किलोमीटर में) को किलोमीटर से गुणा करके निकाला जाता है.
हां
सही. राइड की कीमत तय करने में डिस्टेंस ज़रूरी है. इसलिए, दूरी पर निर्भर करने वाली बेसलाइन मददगार होती है.
नहीं
गलत. दूरी तय करने में सबसे ज़रूरी वजह, यात्रा की लागत को तय करना होता है. इसलिए, दूरी पर निर्भर करने वाली बेसलाइन मददगार होती है.
क्या यह काम का बेसलाइन है: हर राइड की कीमत 1 डॉलर है. ऐसा इसलिए है, क्योंकि मॉडल को हमेशा इस बेसलाइन से आगे बढ़ना चाहिए. अगर मॉडल बुनियादी रेखा को पार नहीं करता है, तो हम यह पक्का कर सकते हैं कि मॉडल में गड़बड़ी है.
हां
गलत. यह बेसलाइन नहीं है, क्योंकि यह हमेशा गलत होता है. मॉडल को ऐसे बेसलाइन से तुलना करना सही नहीं है जो हमेशा गलत होता है.
नहीं
सही. यह बेसलाइन आपके मॉडल का उपयोगी टेस्ट नहीं है.

हाइपरपैरामीटर

नीचे दिए गए सवालों से, डेटा की कैटगरी तय करने वाले टूल की ट्रेनिंग से जुड़ी समस्याओं के बारे में पता चलता है. वे कार्रवाइयां चुनें जिनकी मदद से, बताई गई समस्या को ठीक किया जा सकता है.

ट्रेनिंग में 0.24 की कमी और पुष्टि का नुकसान 0.36 है. इनमें से कौनसी कार्रवाई, ट्रेनिंग और पुष्टि करने की प्रोसेस के बीच के अंतर को कम कर सकती है?
पक्का करें कि ट्रेनिंग और पुष्टि के सेट में, आंकड़ों से जुड़ी एक ही प्रॉपर्टी मौजूद है.
सही. अगर ट्रेनिंग और पुष्टि सेट में, आंकड़ों से जुड़ी अलग-अलग प्रॉपर्टी हैं, तो ट्रेनिंग डेटा की मदद से पुष्टि करने में कोई मदद नहीं मिलेगी.
ज़्यादा फ़िटिंग को रोकने के लिए रेगुलराइज़ेशन का इस्तेमाल करें.
सही. अगर ट्रेनिंग में कमी, पुष्टि करने के लिए तय की गई संख्या से कम है, तो हो सकता है कि आपका मॉडल, ट्रेनिंग डेटा से ज़्यादा हो. रेगुलराइज़ेशन, ज़रूरत से ज़्यादा फ़िटिंग को रोकता है.
प्रशिक्षण अवधि की संख्या बढ़ाएं.
गलत. अगर ट्रेनिंग में कमी, पुष्टि करने के लिए तय की गई संख्या से कम है, तो आपका मॉडल आम तौर पर ट्रेनिंग के डेटा से ज़्यादा हो गया है. ट्रेनिंग अवधि को बढ़ाने से, सिर्फ़ ज़्यादा फ़िटिंग वाली गतिविधियों में बढ़ोतरी होगी.
सीखने की दर घटाएं.
गलत. पुष्टि मिलने में हुई कमी, ट्रेनिंग में होने वाले नुकसान से ज़्यादा है. आम तौर पर, इससे पता चलता है कि ट्रेनिंग में ज़्यादा समय लग रहा है. सीखने की दर बदलने से, ज़्यादा फ़िट होने की समस्या कम नहीं होती.
आपने पिछले सवाल में बताई गई सही कार्रवाइयां की हैं और कई epoch के लिए ट्रेनिंग के बाद, ट्रेनिंग और पुष्टि के मौके 1.0 से घटकर 0.24 हो जाते हैं. इनमें से किस कार्रवाई से आपकी ट्रेनिंग के दौरान होने वाले नुकसान को कम किया जा सकता है?
अपने न्यूरल नेटवर्क की गहराई और चौड़ाई बढ़ाएं.
सही. अगर कई epoch के लिए ट्रेनिंग के बाद, ट्रेनिंग के समय में 0.24 की कमी बनी रहती है, तो हो सकता है कि आपके मॉडल के नुकसान की संभावना कम हो. मॉडल की गहराई और चौड़ाई बढ़ाने से, मॉडल को ट्रेनिंग के लिए होने वाले नुकसान को कम करने के लिए, अतिरिक्त अनुमानित क्षमता मिल सकती है.
प्रशिक्षण अवधि की संख्या बढ़ाएं.
गलत. अगर आपकी ट्रेनिंग के दौरान, 12 साल से ज़्यादा लोगों को ट्रेनिंग देने के बाद भी 0.24 मिनट या उससे ज़्यादा का समय बचता है, तो हो सकता है कि मॉडल को ट्रेनिंग देने से आपकी ट्रेनिंग में काफ़ी कमी न आए.
सीखने की दर में बढ़ोतरी करना.
गलत. इस बात को ध्यान में रखते हुए कि ट्रेनिंग में होने वाले नुकसान की वजह से, सीखने-सिखाने की प्रक्रिया में हुए हर बदलाव को कम नहीं किया जा सकता है. इसलिए, हो सकता है कि ट्रेनिंग की वजह से ट्रेनिंग पूरी न हो पाए. इसके बजाय, लर्निंग रेट बढ़ाने से आपकी ट्रेनिंग में बदलाव हो सकता है. इससे, आपके मॉडल को डेटा सीखने से रोका जा सकता है.
आपने पिछले सवाल में सही कार्रवाई की है. आपके मॉडल के ट्रेनिंग के अनुभव को 0.20 तक घटा दिया गया है. मान लें कि आपको मॉडल की ट्रेनिंग से मिलने वाले नुकसान को थोड़ा और कम करना है. आप कुछ सुविधाएं जोड़ते हैं जो अनुमानित पावर होती हैं. हालांकि, ट्रेनिंग लेने वाले लोगों की संख्या में करीब 0.20 का उतार-चढ़ाव होता रहता है. नीचे दिए गए तीन विकल्पों में से किस तरह आपकी ट्रेनिंग के दौरान होने वाले नुकसान को कम किया जा सकता है?
लेयर की गहराई और चौड़ाई बढ़ाएं.
सही. ऐसा हो सकता है कि आपके मॉडल में नई सुविधाओं के लिए, अनुमान लगाने के सिग्नल को सीखने की सुविधा उपलब्ध न हो.
प्रशिक्षण अवधि को बढ़ाएं.
गलत. अगर आपके मॉडल की ट्रेनिंग के दौरान 0.20 के आस-पास की संख्या में उतार-चढ़ाव हो रहा है, तो हो सकता है कि ट्रेनिंग की अवधि में 1.20 के आस-पास उत्सर्जन कम हो जाए.
इन सुविधाओं में, मौजूदा सुविधाओं के मुकाबले जानकारी को नहीं जोड़ा जाता. कोई दूसरी सुविधा आज़माएं.
सही. ऐसा हो सकता है कि अनुमानित सिग्नल के ज़रिए एन्कोड किए गए अनुमानित सिग्नल पहले से ही उन सुविधाओं में मौजूद हों जिनका आप इस्तेमाल कर रहे हैं.
सीखने की दर घटाएं.
सही. हो सकता है कि नई सुविधाओं को जोड़ने से समस्या ज़्यादा मुश्किल हो जाए. खास तौर पर, डेटा के नुकसान में होने वाले उतार-चढ़ाव से पता चलता है कि लर्निंग रेट बहुत ज़्यादा है और आपके मॉडल पर बहुत कम समय के लिए बात हो रही है. अपनी लर्निंग रेट में कमी करने से, आपके मॉडल को मिनीम सीखने में मदद मिलेगी.