Trainings- und Test-Datasets

Wir kehren zu Playground zurück, um mit den Trainings-Datasets zu experimentieren und Test-Datasets.

Diese Übung bietet sowohl ein Test-Dataset als auch ein Trainings-Dataset, die beide aus denselben Datensatz. Standardmäßig zeigt die Visualisierung nur das Training an festgelegt. Wenn Sie das Test-Dataset ebenfalls anzeigen möchten, klicken Sie auf das Kästchen Testdaten anzeigen direkt unter der Visualisierung. Im Visualisierung verwenden, beachten Sie den folgenden Unterschied:

  • Die Trainingsbeispiele sind weiß umrandet.
  • Die Testbeispiele sind schwarz umrandet.

Aufgabe 1: Führen Sie Playground mit den angegebenen Einstellungen aus, indem Sie Folgendes:

  1. Klicken Sie auf die Schaltfläche „Ausführen/Pause“:
  2. Beobachte, wie sich die Werte für den Test- und Trainingsverlust ändern.
  3. Wenn sich die Werte für den Test- und Trainingsverlust nicht mehr ändern oder nehmen Sie Änderungen vor, indem Sie die Schaltfläche "Ausführen/Pause" drücken. noch einmal, um Playground zu pausieren.
Achten Sie auf das Delta zwischen dem Test- und dem Trainingsverlust. Wir werden versuchen, diese Delta in den folgenden Aufgaben.

Aufgabe 2: Führen Sie die folgenden Schritte aus:

  1. Drücken Sie die Taste zum Zurücksetzen.
  2. Den Lernpfad ändern rate.
  3. Drücke auf die Schaltfläche „Laufen/Pause“:
  4. Lassen Sie Playground mindestens 150 Epochen laufen.

Ist das Delta zwischen Test- und Trainingsverlust niedriger oder Lernrate erhöhen? Was passiert, wenn Sie beide Änderungen vornehmen? Lernrate und Batchgröße?

Optionale Aufgabe 3: Ein Schieberegler mit der Bezeichnung Trainingsdatenprozentsatz. können Sie den Anteil der Trainingsdaten zu Testdaten steuern. Beispiel: auf 90 % gesetzt ist, werden 90% der Daten für das Dataset die restlichen 10% werden für das Test-Dataset verwendet.

Gehen Sie so vor:

  1. Den Prozentsatz der Trainingsdaten verringern von 50% auf 10%.
  2. Experimentieren Sie mit Lernrate und Batchgröße und machen Sie sich Notizen Ergebnisse.
Ändert sich durch die Änderung des Prozentsatzes der Trainingsdaten die optimale die Sie in Aufgabe 2 kennengelernt haben? Wenn ja, warum?