Comprueba tu comprensión: Depuración de modelos

En las siguientes preguntas, haz clic en tu selección para expandirla y verificar tu respuesta.

Enfoque de modelado

A ti y a tu amiga Mel les gustan los unicornios. De hecho, te gustan tanto los unicornios que decides predecir su apariencia con el aprendizaje automático. Tienes un conjunto de datos de 10,000 apariciones de unicornios. Para cada apariencia, el conjunto de datos contiene la ubicación, la hora del día, la elevación, la temperatura, la humedad, la densidad poblacional, la cobertura arbórea, la presencia de un arcoíris y muchas otras características.

Desea comenzar a desarrollar su modelo de AA. ¿Cuál de los siguientes enfoques es una buena forma de comenzar el desarrollo?
Los unicornios suelen aparecer al amanecer y al atardecer. Por lo tanto, usa el atributo “hora del día” para crear un modelo lineal.
Correcto. Un modelo lineal que usa uno o dos atributos altamente predictivos es una manera eficaz de comenzar.
Predecir las apariciones de unicornios es un problema muy difícil. Por lo tanto, usa una red neuronal profunda con todos los atributos disponibles.
Incorrecto. Comenzar con un modelo complejo complicará la depuración.
Comienza con un modelo lineal simple, pero usa todas las funciones para asegurarte de que el modelo simple tenga poder predictivo.
Incorrecto. Si usas muchas características, incluso con un modelo lineal, el modelo resultante es complejo y difícil de depurar.

Modelo de referencia

Si usas la regresión con pérdida de error cuadrático medio (ECM), predices el costo de un viaje en taxi mediante la duración, la distancia, el origen y el final del viaje. Usted sabe:

  • El costo promedio del viaje es de USD 15.
  • El costo del viaje aumenta en un importe fijo por kilómetro.
  • Los viajes dentro del centro de la ciudad tienen un costo adicional.
  • Los viajes tienen un costo mínimo de USD 3.

Determina si los siguientes modelos de referencia son útiles.

¿Es un modelo de referencia útil? Cada viaje cuesta USD 15.
Correcto. El costo promedio es un valor de referencia útil.
No
Incorrecto. Siempre predecir el promedio da como resultado un ECM más bajo que siempre predecir cualquier otro valor. Por lo tanto, probar un modelo con este modelo de referencia proporciona una comparación significativa.
Depende de la desviación estándar del costo del viaje.
Incorrecto. Independientemente de la desviación estándar, el costo medio del viaje es un modelo de referencia útil porque siempre predice el promedio da como resultado un ECM más bajo en comparación con predecir siempre cualquier otro valor.
¿Esto es un modelo de referencia útil? Es un modelo entrenado que solo usa la duración y el origen como atributos.
Incorrecto. Solo debes usar un modelo entrenado como modelo de referencia después de que se valide por completo en producción. Además, el modelo entrenado debe validarse con un modelo de referencia más simple.
No
Correcto. Solo debes usar un modelo entrenado como modelo de referencia después de que se valide por completo en producción.
¿Es este un modelo de referencia útil? El costo de un viaje es la distancia (en kilómetros) del viaje multiplicada por la tarifa por kilómetro.
Correcto. La distancia es el factor más importante para determinar el costo del viaje. Por lo tanto, un modelo de referencia que se base en la distancia es útil.
No
Incorrecto. La distancia es el factor más importante para determinar el costo del viaje. Por lo tanto, un modelo de referencia que se base en la distancia es útil.
¿Es un modelo de referencia útil? Cada viaje cuesta USD 1. Porque el modelo siempre debe superar este modelo de referencia. Si el modelo no supera este modelo de referencia, podemos estar seguros de que el modelo tiene un error.
Incorrecto. Este no es un modelo de referencia útil porque siempre es incorrecto. Comparar un modelo con un modelo de referencia que siempre es incorrecto no es significativo.
No
Correcto. Este modelo de referencia no es una prueba útil de su modelo.

Hiperparámetros

Las siguientes preguntas describen problemas para entrenar un clasificador. Elige las acciones que podrían solucionar el problema descrito.

La pérdida de entrenamiento es de 0.24 y la de validación es de 0.36. ¿Cuáles de las siguientes acciones podrían reducir la diferencia entre el entrenamiento y la pérdida de validación?
Asegúrate de que los conjuntos de entrenamiento y validación tengan las mismas propiedades estadísticas.
Correcto. Si los conjuntos de entrenamiento y validación tienen propiedades estadísticas diferentes, los datos de entrenamiento no ayudarán a predecir los datos de validación.
Usa la regularización para evitar el sobreajuste.
Correcto. Si la pérdida de entrenamiento es menor que la pérdida de validación, es probable que tu modelo se sobreajuste a los datos de entrenamiento. La regularización evita el sobreajuste.
Aumenta la cantidad de ciclos de entrenamiento.
Incorrecto. Si la pérdida de entrenamiento es menor que la pérdida de validación, tu modelo suele sobreajustarse a los datos de entrenamiento. Aumentar los ciclos de entrenamiento solo aumentará el sobreajuste.
Disminuye la tasa de aprendizaje.
Incorrecto. Por lo general, tener una pérdida de validación mayor que la pérdida de entrenamiento indica un sobreajuste. Cambiar la tasa de aprendizaje no reduce el sobreajuste.
Realiza las acciones correctas que se describieron en la pregunta anterior y tus pérdidas de entrenamiento y validación disminuyen de 1.0 a alrededor de 0.24 después del entrenamiento durante muchos ciclos de entrenamiento. ¿Cuál de las siguientes acciones podría reducir aún más su pérdida de entrenamiento?
Aumenta la profundidad y el ancho de tu red neuronal.
Correcto. Si tu pérdida de entrenamiento se mantiene constante en 0.24 después del entrenamiento durante muchos ciclos de entrenamiento, es posible que el modelo no tenga la capacidad predictiva de reducir aún más la pérdida. Aumentar la profundidad y el ancho del modelo podría darle al modelo la capacidad predictiva adicional necesaria para reducir aún más la pérdida de entrenamiento.
Aumenta la cantidad de ciclos de entrenamiento.
Incorrecto. Si tu pérdida de entrenamiento se mantiene en 0.24 después del entrenamiento durante muchos ciclos de entrenamiento, es probable que la continuación del entrenamiento del modelo no disminuya de forma significativa.
Aumentar la tasa de aprendizaje
Incorrecto. Dado que la pérdida de entrenamiento no disminuyó durante muchos ciclos de entrenamiento, es probable que un aumento en la tasa de aprendizaje no disminuya la pérdida de entrenamiento final. En cambio, aumentar la tasa de aprendizaje podría hacer que tu entrenamiento sea inestable y evitar que tu modelo aprenda los datos.
Realizaste la acción correcta en la pregunta anterior. La pérdida de entrenamiento de tu modelo disminuyó a 0.20. Supongamos que necesitas reducir un poco más la pérdida de entrenamiento de tu modelo. Agrega algunas funciones que parecen tener poder predictivo. Sin embargo, la pérdida de entrenamiento continúa fluctuando alrededor de 0.20. ¿Cuáles de las siguientes opciones podrían reducir tu pérdida de entrenamiento?
Aumenta la profundidad y el ancho de tus capas.
Correcto. Es posible que tu modelo no tenga la capacidad de aprender los indicadores predictivos en los atributos nuevos.
Aumenta los ciclos de entrenamiento.
Incorrecto. Si la pérdida de entrenamiento de tu modelo fluctúa alrededor de 0.20, aumentar la cantidad de ciclos de entrenamiento probablemente hará que la pérdida de entrenamiento del modelo siga fluctuando alrededor de 0.20.
Las funciones no agregan información relacionada con las funciones existentes. Prueba una función diferente.
Correcto. Es posible que los indicadores predictivos codificados por los atributos ya existan en los atributos que usas.
Disminuye la tasa de aprendizaje.
Correcto. Es posible que agregar nuevas funciones haya hecho que el problema sea más complejo. En particular, la fluctuación en la pérdida indica que la tasa de aprendizaje es demasiado alta y que tu modelo salta alrededor del mínimo. Si disminuyes la tasa de aprendizaje, tu modelo podrá aprender los mínimos.