Plongée dans le ML : testez vos connaissances

Erreur quadratique moyenne

Examinez les deux graphes suivants :

Un graphe de 10 points. Une droite passe par 6 des points. 2 points représentent 1 "unité" au-dessus de la droite ; 2 autres points représentent 1 "unité" au-dessous de la droite. Un graphe de 10 points. Une droite passe par 8 des points. 1 point représente 2 "unités" au-dessus de la droite ; 1 autre point représente 2 "unités" au-dessous de la droite.

Examinez les options suivantes.

Lequel des deux ensembles de données présentés dans les graphes précédents a l'erreur quadratique moyenne la plus élevée ?
L'ensemble de données situé à gauche.
Les six exemples sur la droite subissent une perte de 0. Les quatre exemples qui ne sont pas situés sur la droite n'en sont pas très éloignés, donc même la mise au carré de leur décalage génère une valeur faible : $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
L'ensemble de données situé à droite.
Les huit exemples sur la droite subissent une perte de 0. Cependant, bien que seulement deux points se trouvent hors de la droite, ces deux points sont deux fois plus éloignés de la droite que les points des anomalies sur la figure de gauche. La perte de la mise au carré amplifie ces différences, c'est pourquoi un décalage de deux subit une perte quatre fois plus grande qu'un décalage de un.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$