एमएल में होना: अपनी समझ को समझना

वर्ग के आकार वाली औसत गड़बड़ी

नीचे दिए गए दो प्लॉट आज़माएं:

10 पॉइंट वाला प्लॉट. एक लाइन 6 पॉइंट से गुज़रती है. 2 पॉइंट 1 हैं <img "units"="" 1="" 2="" <="" ऊपर="" alt="10 पॉइंट का प्लॉट. एक लाइन के आठ से ज़्यादा बिंदु चलते हैं. 2.07

नीचे दिए गए विकल्प देखें.

पिछले प्लॉट में दिखाए गए दो डेटा सेट में से किनके ज़्यादा मीन स्क्वेयर्ड गड़बड़ी (एमएसई) हैं?
बाईं ओर डेटासेट.
लाइन पर मौजूद छह उदाहरणों की कुल वैल्यू 0 है. वे चार उदाहरण जो लाइन पर नहीं हैं, लाइन में बहुत दूर नहीं हैं. इसलिए, उनके ऑफ़सेट को रखने पर भी वैल्यू कम होती है: $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
दाईं ओर डेटासेट.
लाइन के आठ उदाहरणों में शून्य का कुल नुकसान हुआ है. हालांकि, लाइन पर सिर्फ़ दो पॉइंट लगे होते हैं, लेकिन दोनों बिंदुओं को लाइन से बाईं ओर के आंकड़ों के तौर पर दो बार दूर रखा जाता है. वर्ग के आधार पर होने वाली कमी से ये अंतर बढ़ जाते हैं, इसलिए दो के ऑफ़सेट से एक के ऑफ़सेट की तुलना में चार गुना की कमी होती है.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$