Error cuadrático medio
Considera las siguientes representaciones:
![]() |
![]() |
Explora las opciones que aparecen a continuación.
¿Cuál de los dos conjuntos de datos que se muestran en las representaciones anteriores tiene el error cuadrático medio (ECM) más alto?
El conjunto de datos a la izquierda.
Los seis ejemplos de la línea incurren en una pérdida total de 0. Los cuatro ejemplos que no están en la línea no están muy alejados de esta, de manera que al elevar su compensación al cuadrado, igualmente se obtiene un valor bajo:
$$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
El conjunto de datos a la derecha.
Los ocho ejemplos de la línea incurren en una pérdida total de 0. Sin embargo, aunque solo dos puntos están fuera de la línea, ambos están dos veces más alejados de la línea que los puntos de valores atípicos de la figura de la izquierda. La pérdida al cuadrado amplifica esas diferencias, de manera que una compensación de dos incurre en una pérdida cuatro veces mayor que una compensación de uno.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$