Conjuntos de entrenamiento y prueba

Un conjunto de prueba es un conjunto de datos que se usa para evaluar un modelo desarrollado a partir de un conjunto de entrenamiento.

Conjuntos de entrenamiento y prueba

División de conjuntos de datos

Los datos se dividen en dos: un conjunto grande de datos de entrenamiento y un conjunto pequeño de datos de prueba

Entrenar y probar la evaluación

Dos modelos: una ejecución en los datos de entrenamiento y la otra en los de prueba. El modelo es muy simple: una línea divide los datos anaranjados de los azules. La pérdida en los datos de entrenamiento es similar a la pérdida en los datos de prueba.

¿Qué sucede si solo tenemos un conjunto de datos?

  • Se divide en dos conjuntos:
    • conjunto de entrenamiento
    • conjunto de prueba
  • Error clásico: no uses los datos de prueba para el entrenamiento
    • ¿Obtienes pérdidas sorprendentemente bajas?
    • Antes de celebrar, comprueba que no estés usando los datos de prueba para el entrenamiento por error

Enviar comentarios sobre…

Curso intensivo de aprendizaje automático