Ridurre la perdita: ottimizzare il tasso di apprendimento

Esercizio 1

Imposta una velocità di apprendimento di 0,03 sul dispositivo di scorrimento. Continua a premere il pulsante PASSAGGIO finché l'algoritmo della discesa del gradiente raggiunge il punto minimo della curva della perdita. Quanti passi ha effettuato?

Esercizio 2

Puoi raggiungere il minimo più rapidamente con un tasso di apprendimento più elevato? Imposta una velocità di apprendimento di 0, 1 e continua a premere PASSAGGIO finché la discesa del gradiente non raggiunge il minimo. Quanti passi ha fatto questa volta?

Esercizio 3

Che ne dici di un tasso di apprendimento ancora più elevato? Reimposta il grafico, imposta una velocità di apprendimento pari a 1 e prova a raggiungere il minimo della curva delle perdite. Cosa è successo questa volta?

Sfida facoltativa

Riesci a trovare la percentuale di apprendimento Goldilocks per questa curva, in cui la discesa del gradiente raggiunge il punto minimo con il minor numero di passaggi? Qual è il numero minimo di passaggi necessari per raggiungere il minimo?