Validación: Comprueba tu intuición

Antes de comenzar este modelo, considera si existen inconvenientes para usar el proceso de entrenamiento que se describe en Conjuntos de entrenamiento y de prueba.

Explora las opciones que aparecen a continuación.

Observamos un proceso de usar un conjunto de prueba y uno de entrenamiento para impulsar las iteraciones del desarrollo de un modelo. En cada iteración, entrenamos los datos de entrenamiento y evaluamos los datos de prueba, y usamos los resultados de la evaluación en los datos de prueba para guiar las selecciones y los cambios de distintos hiperparámetros, como la tasa de aprendizaje y los atributos. ¿Hay algún problema con este enfoque? (Elige una sola respuesta).
Está absolutamente bien, estamos entrenando datos de entrenamiento y evaluando datos de prueba separados y retenidos.
En realidad, hay un pequeño problema aquí. Piensa en lo que ocurriría si hiciéramos muchas iteraciones de esta forma.
Realizar varias series de este procedimiento podría provocar que nos adaptáramos de manera implícita a las peculiaridades de nuestro conjunto de prueba específico.
¡Por supuesto! Cuanto más frecuentemente evaluemos un conjunto de prueba determinado, mayor riesgo corremos de sobreajustar de manera implícita ese conjunto de prueba. Observaremos un protocolo más eficaz la próxima vez.
Esto resulta ineficaz en relación al cómputo. Simplemente tenemos que elegir un conjunto de hiperparámetros predeterminado y adaptarnos a ellos para ahorrar recursos.
Aunque estos tipos de iteraciones son costosos, son una parte fundamental del desarrollo del modelo. La configuración de los hiperparámetros puede marcar una gran diferencia en la calidad del modelo, y siempre debemos presupuestar cierta cantidad de tiempo y recursos de cómputo para garantizar que se obtenga la mejor calidad posible.

Enviar comentarios sobre…

Curso intensivo de aprendizaje automático