Interpreta las curvas de pérdida

El aprendizaje automático sería muy sencillo si todas nuestras curvas de pérdida se vieran así la primera vez que entrenamos nuestro modelo:

Un gráfico que muestra la curva de pérdida ideal cuando se entrena un modelo de aprendizaje automático.
La curva de pérdida representa la pérdida en el eje Y con la cantidad de pasos de entrenamiento en el eje X. A medida que aumenta la cantidad de pasos de entrenamiento, la pérdida comienza alta, disminuye de forma exponencial y, en última instancia, se aplana para alcanzar una pérdida mínima.

Pero, en realidad, las curvas de pérdida pueden ser bastante difíciles de interpretar. Comprende las curvas de pérdida para responder las siguientes preguntas.

1. ¡Mi modelo no se entrena!

Mel y tu amigo continúan trabajando en un predictor de la apariencia de un unicornio. Esta es tu primera curva de pérdida.

Un diagrama de curva de pérdida con los mismos ejes que el anterior. Aquí, la pérdida no se aplana, sino que aumenta y disminuye de forma errática, de modo que la representación oscila.

Describe el problema y cómo Mel podría solucionarlo:

2. ¡Explotó mi pérdida!

Mel te muestra otra curva. ¿Cuál es el problema aquí y cómo puede solucionarlo? Escribe tu respuesta a continuación.

Un gráfico de curvas de pérdida que muestra cómo la pérdida disminuye hasta cierto número de pasos de entrenamiento y, luego, aumenta repentinamente con más pasos de entrenamiento.

3. Mis métricas son contradictorias.

Mel quiere otra visión de ella. ¿Cuál es el problema y cómo puede solucionarlo? Escribe tu respuesta a continuación.

La imagen muestra dos trazados. El gráfico de la izquierda muestra la curva de pérdida ideal.
El gráfico de la derecha muestra que la métrica de recuperación se mantiene en 0, incluso a medida que aumenta la cantidad de pasos de entrenamiento.

Describe el problema y cómo Mel podría solucionarlo:

4. ¡La pérdida de prueba es muy alta!

Mel muestra las curvas de pérdida para entrenar y probar conjuntos de datos y pregunta "¿Qué sucede?". Escribe tu respuesta a continuación.

Un gráfico de curva de pérdida que muestra la diferencia entre el entrenamiento y la pérdida de prueba a medida que se entrena un modelo.

Describe el problema y cómo Mel podría solucionarlo:

5. Mi modelo se estanca

Eres paciente cuando Mel vuelve unos días más tarde con otra curva. ¿Cuál es el problema aquí y cómo puede Mel arreglarlo?

Un gráfico de una curva de pérdida que muestra cómo la pérdida comienza a converger con el entrenamiento y, luego, muestra patrones repetidos que parecen una onda rectangular.

Describe el problema y cómo Mel podría solucionarlo:

¡Está funcionando!

"¡Funciona a la perfección ahora!" Mel exclama. Está inclinada hacia atrás, sentada triunfante, y suspira con gran aire. La curva se ve genial y se transmite con logros. Mel y tú te tomes un momento para analizar las siguientes verificaciones adicionales a fin de validar tu modelo.

  • métricas reales
  • modelos de referencia
  • pérdida absoluta por problemas de regresión
  • otras métricas para problemas de clasificación
  • Un gráfico que muestra una curva de pérdida que converge.