Conjuntos de entrenamiento y prueba

Un conjunto de prueba es un conjunto de datos que se usa para evaluar un modelo desarrollado a partir de un conjunto de entrenamiento.

Conjuntos de entrenamiento y prueba

Los datos se dividen en dos: un conjunto grande de datos de entrenamiento y un conjunto pequeño de datos de prueba
Dos modelos: una ejecución en los datos de entrenamiento y la otra en los de prueba. El modelo es muy simple: una línea divide los datos anaranjados de los azules. La pérdida en los datos de entrenamiento es similar a la pérdida en los datos de prueba.
  • Se divide en dos conjuntos:
    • conjunto de entrenamiento
    • conjunto de prueba
  • Error clásico: no uses los datos de prueba para el entrenamiento
    • ¿Obtienes pérdidas sorprendentemente bajas?
    • Antes de celebrar, comprueba que no estés usando los datos de prueba para el entrenamiento por error