Estudio detallado del AA: Comprueba tu comprensión

Error cuadrático medio

Considera las siguientes representaciones:

Una representación de 10 puntos. Una línea que se extiende a través de 6 de los puntos. Dos puntos son 1 "unidad" por encima de la línea; otros dos puntos son 1 "unidad" por debajo de la línea. Una representación de 10 puntos. Una línea que se extiende a través de 8 de los puntos. Un punto son 2 "unidades" por encima de la línea; otro punto son 2 "unidades" por debajo de la línea.

Explora las opciones que aparecen a continuación.

¿Cuál de los dos conjuntos de datos que se muestran en las representaciones anteriores tiene el error cuadrático medio (ECM) más alto?
El conjunto de datos a la izquierda.
Los seis ejemplos de la línea incurren en una pérdida total de 0. Los cuatro ejemplos que no están en la línea no están muy alejados de esta, de manera que al elevar su compensación al cuadrado, igualmente se obtiene un valor bajo: $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
El conjunto de datos a la derecha.
Los ocho ejemplos de la línea incurren en una pérdida total de 0. Sin embargo, aunque solo dos puntos están fuera de la línea, ambos están dos veces más alejados de la línea que los puntos de valores atípicos de la figura de la izquierda. La pérdida al cuadrado amplifica esas diferencias, de manera que una compensación de dos incurre en una pérdida cuatro veces mayor que una compensación de uno.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$