Plongée dans le ML: testez vos connaissances

Erreur quadratique moyenne

Prenons les deux graphiques suivants:

Un graphique à 10 points. Une ligne passe par 6 des points. 2 points correspondent à 1 Units Une ligne passe par 8 des points. 1 point est 2 bas

Explorez les options ci-dessous.

Lequel des deux ensembles de données présentés dans les graphiques précédents présente l'erreur quadratique moyenne la plus élevée ?
L'ensemble de données sur la gauche.
Les six exemples sur la ligne subissent une perte totale de 0. Les quatre exemples qui ne sont pas sur la ligne ne sont pas très éloignés de la ligne. Par conséquent, même si vous mettez carrément leur décalage, vous obtenez une valeur faible : $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
L'ensemble de données à droite.
Les huit exemples sur la ligne subissent une perte totale de 0. Toutefois, bien que seuls deux points se trouvent hors de la ligne, ces deux points sont deux fois plus éloignés de la ligne que les points aberrants dans la figure de gauche. La perte quadratique amplifie ces différences. Par conséquent, un décalage de deux subit une perte quatre fois plus importante qu'un décalage d'une différence.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$