Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
El aprendizaje automático sería muy sencillo si todas nuestras curvas de pérdida se vieran así la primera vez que entrenamos nuestro modelo:
Pero, en realidad, las curvas de pérdida pueden ser bastante difíciles de interpretar. Comprende las curvas de pérdida para responder las siguientes preguntas.
1. ¡Mi modelo no se entrena!
Mel y tu amigo continúan trabajando en un predictor de la apariencia de un unicornio.
Esta es tu primera curva de pérdida.
Describe el problema y cómo Mel podría solucionarlo:
Haz clic en el ícono de signo más para expandir la sección
y revelar la respuesta.
Tu modelo no está convergendo. Prueba estos pasos de depuración:
Verifica si tus atributos pueden predecir las etiquetas mediante los pasos que se indican en Depuración de modelos.
Verifica tus datos con un esquema de datos para detectar ejemplos incorrectos.
Si el entrenamiento parece inestable, como en este gráfico, reduce la tasa de aprendizaje para evitar que el modelo rebote en el espacio de parámetros.
Simplifica tu conjunto de datos a 10 ejemplos que sabes que tu modelo puede predecir. Obtén una pérdida muy baja del conjunto de datos reducido. Luego, continúa depurando tu modelo en el conjunto de datos completo.
Simplifica tu modelo y asegúrate de que el rendimiento supere el modelo de referencia. Luego, agrega complejidad al modelo de manera gradual.
2. ¡Explotó mi pérdida!
Mel te muestra otra curva. ¿Cuál es el problema aquí y cómo puede solucionarlo?
Escribe tu respuesta a continuación.
Haz clic en el ícono de signo más para expandir la sección y revelar
la respuesta.
Por lo general, un gran aumento en la pérdida se debe a valores anómalos en los datos de entrada. Las posibles causas son:
NaN en los datos de entrada.
Gradiente con alto crecimiento debido a datos anómalos.
División por cero.
Logaritmo de cero o números negativos.
Para corregir una pérdida con alto crecimiento, verifica si hay datos anómalos en tus lotes y en los datos de ingeniería. Si la anomalía parece problemática, investiga la causa. De lo contrario, si la anomalía se parece a los datos periféricos, asegúrate de distribuir los valores atípicos de manera uniforme entre los lotes mediante la redistribución de los datos.
3. Mis métricas son contradictorias.
Mel quiere otra visión de ella. ¿Cuál es el problema y
cómo puede solucionarlo? Escribe tu respuesta a continuación.
Describe el problema y cómo Mel podría solucionarlo:
Haz clic en el ícono de signo más para expandir la sección y revelar la respuesta.
La recuperación está atascada en 0 porque la probabilidad de clasificación de tus ejemplos nunca es superior al umbral para una clasificación positiva. Esta situación suele ocurrir en problemas con un gran desequilibrio de clases. Recuerda que las bibliotecas de AA, como TF Keras, suelen usar un umbral predeterminado de 0.5 para calcular las métricas de clasificación.
Prueba estos pasos:
Disminuye el umbral de clasificación.
Verifica las métricas que no varían, como el AUC.
4. ¡La pérdida de prueba es muy alta!
Mel muestra las curvas de pérdida para entrenar y probar conjuntos de datos y pregunta "¿Qué sucede?". Escribe tu respuesta a continuación.
Describe el problema y cómo Mel podría solucionarlo:
Haz clic en el ícono de signo más para expandir la sección y revelar
la respuesta.
Tu modelo se sobreajusta a los datos de entrenamiento. Sigue estos pasos:
Reduce la capacidad del modelo.
Agrega regularización.
Verifica que las divisiones de entrenamiento y de prueba sean equivalentes en términos estadísticos.
5. Mi modelo se estanca
Eres paciente cuando Mel vuelve unos días más tarde con otra curva. ¿Cuál es el problema aquí y cómo puede Mel arreglarlo?
Describe el problema y cómo Mel podría solucionarlo:
Haz clic en el ícono de signo más para expandir la sección y revelar
la respuesta.
Su pérdida muestra un comportamiento repetitivo similar a un paso. Es probable que los datos de entrada que ve tu modelo tengan un comportamiento repetitivo. Asegúrate de que la redistribución quite el comportamiento repetitivo de los datos de entrada.
¡Está funcionando!
"¡Funciona a la perfección ahora!" Mel exclama. Está inclinada hacia atrás, sentada triunfante, y suspira con gran aire. La curva se ve genial y se transmite con logros. Mel y tú te tomes un momento para analizar las siguientes verificaciones adicionales a fin de validar tu modelo.