Datasets, Verallgemeinerung und Überanpassung

Einführung

Dieses Modul beginnt mit einer Suggestivfrage. Wählen Sie eine der folgenden Antworten aus:

Wenn Sie in einem der folgenden Bereiche Verbesserungsbedarf hatten, die in Ihrem ML-Projekt am meisten Auswirkungen?
Qualität des Datensatzes verbessern
Daten haben Vorrang vor allen. Die Qualität und Größe des Datasets ist viel wichtiger als das, mit dem Sie Ihr Modell erstellen.
Eine intelligentere Verlustfunktion für das Training Ihres Modells anwenden
Eine bessere Verlustfunktion kann zwar dazu beitragen, dass ein Modell schneller trainiert wird, sie ist aber immer noch weit abgeschlagen hinter einem anderen Element auf dieser Liste.

Und hier kommt eine noch Suggestivfrage:

Lassen Sie uns raten: Wie viel Zeit in Ihrem ML-Projekt widmen Sie sich normalerweise der Datenvorbereitung und -transformation?
Mehr als die Hälfte der Projektzeit
Ja, ML-Anwender verbringen den Großteil ihrer Zeit für das Erstellen von Datasets und für Feature Engineering.
Weniger als die Hälfte der Projektzeit
Planen Sie für mehr! Normalerweise werden 80 % der Zeit in einem Projekt für maschinelles Lernen für die Erstellung von Datasets und die Transformation von Daten aufgewendet.

In diesem Modul erfahren Sie mehr über die Eigenschaften des maschinellen Lernens. Datasets und wie Sie Ihre Daten aufbereiten, um qualitativ hochwertige Ergebnisse zu gewährleisten, wenn Ihr Modell zu trainieren und zu bewerten.