Un premier réseau de neurones

Dans cet exercice, nous allons entraîner notre premier petit réseau de neurones. Les réseaux de neurones permettent d'apprendre des modèles non linéaires l'utilisation de croisements de caractéristiques explicites.

Tâche 1:le modèle donné combine nos deux caractéristiques d'entrée dans un un neurone unique. Ce modèle va-t-il apprendre des non-linéarités ? Exécutez-le pour confirmer deviner.

Tâche 2:essayez d'augmenter le nombre de neurones dans la couche cachée 1 à 2, et essayez de passer d'une activation linéaire à une activation non linéaire comme ReLU. Pouvez-vous créer un modèle capable d'apprendre les non-linéarités ? Modélisation efficacement les données ?

Tâche 3:essayez d'augmenter le nombre de neurones de la couche cachée de 2 à 3, à l'aide d'une activation non linéaire comme la fonction ReLU. Peut-il modéliser les données efficacement ? En quoi la qualité du modèle varie-t-elle d'une exécution à l'autre ?

Tâche 4:poursuivre l'expérimentation en ajoutant ou en supprimant des couches cachées et de neurones par couche. N'hésitez pas non plus à modifier les taux d'apprentissage, la régularisation et d'autres paramètres d'apprentissage. Quel est le plus petit de neurones et de couches qui donnent la perte d'évaluation de 0,177 ou moins ?

L'augmentation de la taille du modèle améliore-t-elle l'adéquation ou la vitesse de convergence ? Cela modifie-t-il la fréquence de convergence vers un bon modèle ? Par exemple, essayez la l'architecture suivante:

  • Première couche cachée comportant 3 neurones.
  • Deuxième couche cachée avec 3 neurones.
  • Troisième couche cachée contenant 2 neurones.

(Les réponses s'affichent juste en dessous de l'exercice.)