نزول به ML: درک خود را بررسی کنید

خطای میانگین مربعات

دو طرح زیر را در نظر بگیرید:

طرح 10 امتیازی. یک خط از 6 نقطه عبور می کند. 2 امتیاز 1 استطرح 10 امتیازی. یک خط از 8 نقطه عبور می کند. 1 امتیاز 2 است

گزینه های زیر را بررسی کنید.

کدام یک از دو مجموعه داده نشان داده شده در نمودارهای قبلی میانگین مربعات خطا (MSE) بالاتری دارد؟
مجموعه داده در سمت چپ.
شش نمونه روی خط متحمل ضرر کلی 0 می‌شوند. چهار مثالی که در خط نیستند خیلی دور از خط نیستند، بنابراین حتی مربع کردن آفست آنها همچنان مقدار کمی را به دست می‌دهد: $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
مجموعه داده در سمت راست.
هشت نمونه روی خط متحمل ضرر کلی 0 می شوند. با این حال، اگرچه تنها دو نقطه از خط فاصله دارند، هر دوی آن نقاط دو برابر از نقاط دورتر در شکل سمت چپ دورتر از خط هستند. تلفات مجذور این تفاوت ها را تقویت می کند، بنابراین جبران دو، ضرری چهار برابر بیشتر از جبران یک را متحمل می شود.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$