Conjuntos de entrenamiento y de prueba
Regresamos a Playground para experimentar con conjuntos de entrenamiento
y conjuntos de prueba.
Haz clic en el ícono de signo más para recordar lo que significan los puntos anaranjados y azules.
En la visualización:
- Cada punto azul representa un ejemplo de una clase de datos (por ejemplo,
spam).
- Cada punto naranja representa un ejemplo de otra clase de datos (por
por ejemplo, no es spam).
- El color de fondo representa la predicción del modelo de dónde los ejemplos
de ese color. Un fondo azul alrededor de un punto azul
significa que el modelo predice ese ejemplo de forma correcta. Por el contrario,
un fondo naranja alrededor de un punto azul significa que el modelo está
una predicción incorrecta para ese ejemplo.
Este ejercicio brinda un conjunto de prueba y uno de entrenamiento, ambos extraídos de
el mismo conjunto de datos. De forma predeterminada, la visualización solo muestra el entrenamiento
automático. Si también quieres verlo, haz clic en
la casilla de verificación Mostrar datos de prueba justo debajo de la visualización. En la
visual, ten en cuenta la siguiente distinción:
- Los ejemplos de entrenamiento tienen un contorno blanco.
- Los ejemplos de prueba tienen un contorno negro.
Tarea 1: Ejecuta Playground con la configuración dada. Para ello, haz lo siguiente
lo siguiente:
- Haz clic en el botón Ejecutar/Pausar:

- Observa cómo cambian los valores de pérdida de prueba y pérdida de entrenamiento.
- Cuando los valores de pérdida de prueba y pérdida de entrenamiento dejan de cambiar
o solo cambiarla de vez en cuando, presiona el botón Ejecutar/Pausar.
de nuevo para pausar Playground.
Ten en cuenta el delta entre la pérdida de prueba y la pérdida de entrenamiento. Intentaremos reducir esto
delta en las siguientes tareas.
Tarea 2: Haz lo siguiente:
- Presiona el botón Restablecer.

- Modifica el Aprendizaje
promedio.
- Presiona el botón Ejecutar/Pausar:
- Permite que Playground ejecute al menos 150 ciclos de entrenamiento.
¿El delta entre la pérdida de prueba y la pérdida de entrenamiento es menor o
más alta con esta nueva tasa de aprendizaje? ¿Qué sucede si modificas ambos
La tasa de aprendizaje y
tamaño del lote?
Tarea 3 (opcional): Un control deslizante con el nombre Porcentaje de datos de entrenamiento
te permite controlar la proporción de datos de entrenamiento con respecto a los datos de prueba. Por ejemplo:
cuando se configura en 90%, entonces el 90% de los datos se usa para el conjunto de entrenamiento y
se usa el 10% restante para el conjunto de prueba.
Puedes hacer lo siguiente:
- Reduce el "Porcentaje de datos de entrenamiento" de 50% a 10%.
- Experimenta con la tasa de aprendizaje y el tamaño del lote, tomando notas sobre tu
de los resultados de búsqueda.
¿Modificar el porcentaje de datos de entrenamiento cambia el valor óptimo?
de configuración de aprendizaje que descubriste en la Tarea 2? Si es así, ¿por qué?
Haz clic en el ícono de signo más para obtener la respuesta de la Tarea 1.
Con la tasa de aprendizaje establecida en 3 (el parámetro de configuración inicial),
La pérdida de prueba es significativamente más alta que la pérdida de entrenamiento.
Haz clic en el ícono de signo más para obtener la respuesta de la Tarea 2.
Si reduces la tasa de aprendizaje (por ejemplo, a 0.001),
La pérdida de prueba se reduce a un valor mucho más cercano a la pérdida de entrenamiento. En la mayoría de las ejecuciones,
aumentar el tamaño del lote no afecta la pérdida de entrenamiento ni la prueba
significativamente. Sin embargo, en un pequeño porcentaje de ejecuciones, aumentar
El tamaño del lote en 20 o más provoca que la pérdida de prueba se reduzca ligeramente.
por debajo de la pérdida de entrenamiento.
Los conjuntos de datos de Playground se generan de forma aleatoria. En consecuencia, nuestro
respuestas no siempre coinciden exactamente con las tuyas.
Haz clic en el ícono de signo más para obtener la respuesta de la Tarea 3.
Reducir el porcentaje de datos de entrenamiento de 50% a 10% drásticamente
y reduce la cantidad de datos
en el conjunto de entrenamiento. Con tan pocos datos,
un tamaño del lote alto y una tasa de aprendizaje alta hacen que el modelo de entrenamiento salte
alrededor de forma caótica (que saltan repetidamente sobre el punto mínimo).