Conjuntos de entrenamiento y prueba

Un conjunto de prueba es un conjunto de datos que se usa para evaluar un modelo desarrollado a partir de un conjunto de entrenamiento.

Conjuntos de entrenamiento y prueba

Barra horizontal dividida en dos: el 80% corresponde al conjunto de entrenamiento y el 20%, al de prueba.
Dos modelos: uno se ejecuta con datos de entrenamiento y el otro con datos de prueba.  El modelo es muy sencillo: solo una línea divide los puntos anaranjados de los azules.  La pérdida en los datos de entrenamiento es similar a la pérdida en los datos de prueba.
  • Se divide en dos conjuntos:
    • conjunto de entrenamiento
    • conjunto de prueba
  • Error clásico: no uses los datos de prueba para el entrenamiento
    • ¿Obtienes una pérdida sorprendentemente baja?
    • Antes de celebrar, verifica si estás entrenando accidentalmente con datos de prueba