Validación

Particionar un conjunto de datos en un conjunto de entrenamiento y uno de prueba te permite juzgar si un modelo determinado realizará generalizaciones eficaces sobre los datos nuevos. Sin embargo, usar solo dos particiones puede no ser suficiente cuando se realizan varias series de ajustes de los hiperparámetros.

Validación

¿Un flujo de trabajo posible?

Un diagrama de flujo de trabajo que consta de tres etapas. 1. Entrenar el modelo con el conjunto de entrenamiento. 2. Evaluar el modelo con el conjunto de prueba. 3. Ajustar el modelo en función de los resultados con el conjunto de prueba. Itera sobre 1, 2 y 3 y, en definitiva, selecciona el modelo que mejor se desempeñe con el conjunto de prueba.

División de conjuntos de datos

Una barra horizontal dividida en tres partes: el 70% es el conjunto de entrenamiento, el 15% es el conjunto de validación y el 15% es el conjunto de prueba

Flujo de trabajo más eficaz: Uso de un conjunto de validación

Un flujo de trabajo similar al de la Figura 2, excepto que, en lugar de evaluar el modelo con el conjunto de prueba, el flujo de trabajo evalúa el modelo con el conjunto de validación. A continuación, una vez que el conjunto de entrenamiento y el de validación concuerdan en mayor o menor grado, confirma el modelo con el conjunto de prueba.

Enviar comentarios sobre…

Curso intensivo de aprendizaje automático