ML-এ অবতরণ: আপনার বোঝাপড়া পরীক্ষা করুন

গড় বর্গাকার ত্রুটি

নিম্নলিখিত দুটি প্লট বিবেচনা করুন:

10 পয়েন্টের একটি প্লট। একটি লাইন 6 পয়েন্ট দিয়ে চলে। 2 পয়েন্ট হল 110 পয়েন্টের একটি প্লট। একটি লাইন 8 পয়েন্ট দিয়ে চলে। 1 পয়েন্ট হল 2

নীচের বিকল্পগুলি অন্বেষণ করুন.

পূর্ববর্তী প্লটে দেখানো দুটি ডেটা সেটের কোনটিতে উচ্চতর গড় স্কয়ারড ত্রুটি (MSE) আছে?
বাম দিকে ডেটাসেট।
লাইনের ছয়টি উদাহরণের মোট ক্ষতি হয়েছে 0। লাইনে নেই এমন চারটি উদাহরণ লাইনের খুব বেশি দূরে নয়, তাই তাদের অফসেটকে বর্গ করলেও কম মান পাওয়া যায়: $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
ডানদিকে ডেটাসেট।
লাইনের আটটি উদাহরণের মোট ক্ষতি হয় 0। তবে, যদিও মাত্র দুটি বিন্দু লাইন থেকে দূরে থাকে, সেই দুটি পয়েন্টই বাম চিত্রের আউটলায়ার পয়েন্টের চেয়ে দ্বিগুণ দূরে। বর্গক্ষেত্র ক্ষয় সেই পার্থক্যগুলিকে প্রশস্ত করে, তাই দুটির অফসেট একটি অফসেটের চেয়ে চার গুণ বেশি ক্ষতি করে৷
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$