Una prima rete neurale

In questo esercizio addestreremo la nostra prima piccola rete neurale. Le reti neurali ci daranno un modo per imparare modelli non lineari senza l'uso di incroci di caratteristiche espliciti.

Attività 1: il modello come dato combina le nostre due caratteristiche di input in un singolo neurone. Il modello apprenderà eventuali non linearità? Eseguilo per confermare indovinare.

Attività 2: prova ad aumentare il numero di neuroni nello strato nascosto da 1 a 2 e prova anche a passare da un'attivazione lineare a una non lineare come ReLU. Puoi creare un modello in grado di apprendere le non linearità? Può modellare i dati in modo efficace?

Attività 3: prova ad aumentare il numero di neuroni nello strato nascosto da da 2 a 3, utilizzando un'attivazione non lineare come la funzione ReLU. Può modellare i dati in modo efficace? Come varia la qualità del modello da corsa a esecuzione?

Attività 4: continua a sperimentare aggiungendo o rimuovendo gli strati nascosti e neuroni per strato. Non esitare a modificare i tassi di apprendimento, regolarizzazione e altre impostazioni di apprendimento. Qual è la più piccola numero di neuroni e strati che puoi utilizzare e che fornisce la perdita di test di 0,177 o inferiore?

Aumentando le dimensioni del modello si migliora l'adattamento o la velocità di convezione? Cambia la frequenza con cui converge verso un buon modello? Ad esempio, prova la la seguente architettura:

  • Primo strato nascosto con 3 neuroni.
  • Secondo strato nascosto con 3 neuroni.
  • Terzo strato nascosto con 2 neuroni.

Le risposte vengono visualizzate immediatamente sotto l'esercizio.