Reducción de la pérdida: Optimización de la tasa de aprendizaje

Ejercicio 1

Establece una tasa de aprendizaje de 0.03 en el control deslizante. Sigue presionando el botón STEP hasta que el algoritmo de descenso de gradientes alcance el punto mínimo de la curva de pérdida. ¿Cuántos pasos tomó?

Ejercicio 2

¿Puedes alcanzar el mínimo con mayor rapidez si tienes una tasa de aprendizaje más alta? Establece una tasa de aprendizaje de 0.1 y sigue presionando STEP (PASO) hasta que el descenso de gradientes alcance el mínimo. ¿Cuántos pasos tomó esta vez?

Ejercicio 3

Imagina una tasa de aprendizaje aún mayor. Restablece el gráfico, establece una tasa de aprendizaje de 1 y trata de alcanzar el mínimo de la curva de pérdida. ¿Qué ocurrió esta vez?

Desafío opcional

¿Puedes encontrar la tasa de aprendizaje con valor dorado para esta curva, donde el descenso de gradientes llega al punto mínimo en la menor cantidad de pasos? ¿Cuál es la menor cantidad de pasos necesarios para alcanzar el mínimo?