Trainings- und Testsets: Playground-Übung

Trainings- und Test-Datasets

Wir kehren zu Playground zurück, um mit Trainings- und Test-Datasets zu experimentieren.

In dieser Übung werden ein Test- und ein Trainings-Dataset bereitgestellt, die beide aus demselben Dataset stammen. Standardmäßig wird in der Visualisierung nur der Trainingssatz angezeigt. Wenn Sie auch das Test-Dataset sehen möchten, klicken Sie unter der Visualisierung auf das Kästchen Testdaten anzeigen. Beachten Sie in der Visualisierung die folgende Unterscheidung:

  • Die Trainingsbeispiele haben eine weiße Umrandung.
  • Die Testbeispiele haben eine schwarze Umrandung.

Aufgabe 1: Führen Sie Playground mit den angegebenen Einstellungen aus. Gehen Sie dazu so vor:

  1. Klicken Sie auf die Schaltfläche „Ausführen/Anhalten“:
  2. Sehen Sie sich an, wie sich die Werte für Test- und Trainingsverlust ändern.
  3. Wenn sich die Werte für Testverlust und Trainingsverlust nicht mehr ändern oder sich nur einmal ab und zu ändern, drücken Sie noch einmal die Schaltfläche „Run/Pause“, um Playground zu pausieren.
Beachten Sie das Delta zwischen dem Test- und dem Trainingsverlust. Wir versuchen, dieses Delta in den folgenden Aufgaben zu reduzieren.

Aufgabe 2:Führen Sie folgende Schritte aus:

  1. Drücken Sie die Taste zum Zurücksetzen.
  2. Ändern Sie die Lernrate.
  3. Taste „Ausführen/Pause“ drücken:
  4. Lass Playground mindestens 150 Epochen laufen.

Ist das Delta zwischen Test- und Trainingsverlust mit dieser neuen Lernrate kleiner oder größer? Was passiert, wenn Sie sowohl die Lernrate als auch die Batchgröße ändern?

Optionale Aufgabe 3: Mit dem Schieberegler Prozentsatz der Trainingsdaten können Sie den Anteil der Trainingsdaten zu Testdaten steuern. Wenn Sie beispielsweise 90 % festlegen, werden 90% der Daten für das Trainings-Dataset und die verbleibenden 10% für das Test-Dataset verwendet.

Gehen Sie dazu so vor:

  1. Verringern Sie den „Prozentsatz der Trainingsdaten“ von 50% auf 10%.
  2. Experimentieren Sie mit der Lernrate und der Batchgröße und machen Sie sich Notizen zu den Ergebnissen.
Wirkt sich eine Änderung des Prozentsatzes der Trainingsdaten auf die optimalen Lerneinstellungen aus, die Sie in Aufgabe 2 ermittelt haben? Wenn ja, warum?