डेटासेट, सामान्यीकरण, और ज़रूरत से ज़्यादा मेल खाने वाले डेटासेट: अपनी जानकारी को परखें

  1. एक स्थिर डेटासेट का उदाहरण इनमें से कौनसा है?

  2. आप एक मॉडल को ट्रेनिंग देने की तैयारी कर रहे हैं. इससे, इस्तेमाल की गई कारों की बिक्री की कीमत का अनुमान लगाया जा सकेगा. इसके लिए, आपको उस डेटासेट का इस्तेमाल करना होगा जिसमें ये सुविधाएं शामिल हैं: year, model, और mileage. डेटासेट की जांच करने पर आपको पता चलता है कि 2, 500 उदाहरणों में से 150 के लिए,माइलेज की वैल्यू मौजूद नहीं हैं. इनमें से किन विकल्पों का इस्तेमाल करना सही होगा? (लागू होने वाले सभी विकल्प चुनें)

    जितने जवाब सही लगते हैं उतने जवाब चुनें.

  3. आपको किसी स्ट्रीमिंग सेवा के फ़िल्म के सुझाव देने वाले मॉडल को ट्रेन करना है, ताकि वह किसी फ़िल्म के बारे में उपयोगकर्ता की राय का अनुमान लगा सके. "उपयोगकर्ता को फ़िल्म पसंद आई" के लिए, इनमें से कौनसा प्रॉक्सी लेबल सही होगा? (लागू होने वाले सभी विकल्प चुनें)

    जितने जवाब सही लगते हैं उतने जवाब चुनें.

  4. सही या गलत: अपने मॉडल को तब तक ट्रेनिंग दें, जब तक कि वह आपके टेस्ट डेटा पर कम नुकसान न पहुंचा दे. यह ओवरफ़िटिंग से बचने का एक अच्छा तरीका है.

  5. नीचे दिए गए वाक्य में खाली जगह भरें:
    रेगुलराइज़ेशन, आपके मॉडल की नए डेटा को सामान्य बनाने की क्षमता को बेहतर बनाता है. इसके लिए, ट्रेनिंग के दौरान ___ का इस्तेमाल किया जाता है.