Lỗi bình phương trung bình
Hãy cân nhắc 2 cốt truyện sau:
<img "units"=%quot;" 1/><quot;" 2=%quot;" <=%quot;" trên=gquot;" alt=%quot;Cốt điểm 10 điểm. Một đường kẻ chạy qua 8 điểm. 1 điểm là 2 "dưới đâyquoquo;;quoquo; là iscquot;" line."=%quot;" line;/><quot;" else=%quot;" points=%quot;" src=%quot;/static/computer- Learning/crash-course/images/MCEDescquo;"quot;quot;quot;quot;quot;quot;quot;quot;quot;quét; |
Hãy khám phá các lựa chọn bên dưới.
Tập dữ liệu nào trong số hai tập dữ liệu đã hiển thị trong các biểu đồ trước
có Lỗi bình phương trung bình (MSE) cao hơn?
Tập dữ liệu ở bên trái.
Sáu ví dụ trên dòng mất tổng cộng là 0. Bốn ví dụ
không nằm trên dòng là cách xa không xa, vì vậy, ngay cả khi việc loại bỏ
giá trị chênh lệch vẫn mang lại giá trị thấp:
$$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 +
0^2} {10} = 0.4$$
Tập dữ liệu ở bên phải.
Tám ví dụ trên dòng bị mất tổng cộng là 0. Tuy nhiên, mặc dù chỉ có hai điểm nằm ngoài ranh giới, nhưng cả hai điểm này đều xa hơn hai lần so với điểm đầu tiên so với điểm bên ngoài trong hình bên trái. Tổn thất bình phương sẽ khuếch đại những khác biệt đó, vì vậy độ lệch là hai sẽ gây ra tổn thất lớn hơn gấp bốn lần so với độ lệch một.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 +
0^2} {10} = 0.8$$