Conjuntos de entrenamiento y de prueba

Regresamos a Playground para experimentar con conjuntos de entrenamiento y conjuntos de prueba.

Este ejercicio brinda un conjunto de prueba y uno de entrenamiento, ambos extraídos de el mismo conjunto de datos. De forma predeterminada, la visualización solo muestra el entrenamiento automático. Si también quieres verlo, haz clic en la casilla de verificación Mostrar datos de prueba justo debajo de la visualización. En la visual, ten en cuenta la siguiente distinción:

  • Los ejemplos de entrenamiento tienen un contorno blanco.
  • Los ejemplos de prueba tienen un contorno negro.

Tarea 1: Ejecuta Playground con la configuración dada. Para ello, haz lo siguiente lo siguiente:

  1. Haz clic en el botón Ejecutar/Pausar:
  2. Observa cómo cambian los valores de pérdida de prueba y pérdida de entrenamiento.
  3. Cuando los valores de pérdida de prueba y pérdida de entrenamiento dejan de cambiar o solo cambiarla de vez en cuando, presiona el botón Ejecutar/Pausar. de nuevo para pausar Playground.
Ten en cuenta el delta entre la pérdida de prueba y la pérdida de entrenamiento. Intentaremos reducir esto delta en las siguientes tareas.

Tarea 2: Haz lo siguiente:

  1. Presiona el botón Restablecer.
  2. Modifica el Aprendizaje promedio.
  3. Presiona el botón Ejecutar/Pausar:
  4. Permite que Playground ejecute al menos 150 ciclos de entrenamiento.

¿El delta entre la pérdida de prueba y la pérdida de entrenamiento es menor o más alta con esta nueva tasa de aprendizaje? ¿Qué sucede si modificas ambos La tasa de aprendizaje y tamaño del lote?

Tarea 3 (opcional): Un control deslizante con el nombre Porcentaje de datos de entrenamiento te permite controlar la proporción de datos de entrenamiento con respecto a los datos de prueba. Por ejemplo: cuando se configura en 90%, entonces el 90% de los datos se usa para el conjunto de entrenamiento y se usa el 10% restante para el conjunto de prueba.

Puedes hacer lo siguiente:

  1. Reduce el "Porcentaje de datos de entrenamiento" de 50% a 10%.
  2. Experimenta con la tasa de aprendizaje y el tamaño del lote, tomando notas sobre tu de los resultados de búsqueda.
¿Modificar el porcentaje de datos de entrenamiento cambia el valor óptimo? de configuración de aprendizaje que descubriste en la Tarea 2? Si es así, ¿por qué?