Verlust reduzieren: Playground-Übung

Lernrate und Konvergenz

Dies ist die erste von mehreren Playground-Übungen. Playground ist ein Programm, das speziell für diesen Kurs entwickelt wurde, um die Prinzipien des maschinellen Lernens zu vermitteln. Jede Playground-Übung in diesem Kurs enthält eine eingebettete Playground-Instanz mit Voreinstellungen.

Für jede Playground-Übung wird ein Dataset generiert. Das Label für dieses Dataset hat zwei mögliche Werte. Sie können sich diese beiden möglichen Werte als Spam oder kein Spam oder vielleicht gesunde Bäume vs. kranke Bäume vorstellen. Das Ziel der meisten Übungen besteht darin, verschiedene Hyperparameter zu optimieren, um ein Modell zu erstellen, das einen Labelwert erfolgreich von dem anderen klassifiziert (trennt oder unterscheidet). Beachten Sie, dass die meisten Datasets eine bestimmte Menge an Rauschen enthalten, sodass es nicht möglich ist, jedes Beispiel erfolgreich zu klassifizieren.

Die Benutzeroberfläche für diese Übung enthält drei Schaltflächen:

Icon Name Funktion
Schaltfläche „Zurücksetzen“ Zurücksetzen Setzt Iterationen auf 0 zurück. Setzt alle Gewichtungen zurück, die das Modell bereits gelernt hatte.
Schaltfläche für den Schritt Step Fahre eine Iteration fort. Mit jeder Iteration verändert sich das Modell – manchmal subtil, manchmal drastisch.
Schaltfläche „Neu generieren“. Neu generieren Erstellt einen neuen Datensatz. Setzt Iterationen nicht zurück.

In dieser ersten Playground-Übung testen Sie die Lernrate in zwei Aufgaben.

Aufgabe 1:Rechts oben in Playground finden Sie das Menü Lernrate. Die vorgegebene Lernrate (3) ist sehr hoch. Wenn Sie 10- oder 20-mal auf die Schaltfläche „Schritt“ klicken, können Sie beobachten, wie sich diese hohe Lernrate auf Ihr Modell auswirkt. Nach jeder ersten Iteration beobachten Sie, wie sich die Modellvisualisierung dramatisch ändert. Möglicherweise stellen Sie sogar eine Instabilität fest, nachdem das Modell konvergiert zu sein scheint. Beachten Sie auch die Linien, die von x1 und x2 zur Modellvisualisierung verlaufen. Die Gewichtung dieser Linien gibt die Gewichtung dieser Features im Modell an. Das heißt, eine dicke Linie steht für eine hohe Gewichtung.

Aufgabe 2:Führen Sie folgende Schritte aus:

  1. Klicken Sie auf die Schaltfläche Zurücksetzen.
  2. Verringern Sie die Lernrate.
  3. Drücke die Step-Taste mehrmals hintereinander.

Wie hat sich die niedrigere Lernrate auf die Konvergenz ausgewirkt? Untersuchen Sie sowohl die Anzahl der Schritte, die für die Konvergierung des Modells erforderlich sind, als auch, wie gleichmäßig und gleichmäßig das Modell konvergiert. Experimentieren Sie mit noch niedrigeren Werten für die Lernrate. Finden Sie eine Lernrate, die zu langsam ist, um nützlich zu sein? (Unter der Übung sehen Sie eine Diskussion.)