Der Prozess für die Datenvorbereitung und Feature Engineering

Wie sieht der Ablauf aus?

Wie bereits erwähnt, konzentrieren wir uns in diesem Kurs auf das Erstellen eines Datasets und das Transformieren Ihrer Daten.

Das Dataset besteht aus den folgenden Aufgaben: 1. Rohdaten erfassen.  2. Ermittle Merkmals- und Labelquellen. 3. Strategie für die Stichprobenerhebung auswählen
4. Daten aufteilen Das Transformieren von Daten umfasst folgende Aufgaben:
1. Daten prüfen und bereinigen 2. Feature Engineering durchführen

Hinweise

  • Die Abbildung zeigt einen typischen Prozess, der möglicherweise nicht für jedes Projekt ideal ist. Dieser Kurs eignet sich hauptsächlich für lineare Regressions- und neuronale Netze.
  • Der angezeigte Prozess erfolgt nicht immer sequenziell. Sie können Ihre Daten beispielsweise aufteilen, nachdem Sie sie transformiert haben. Möglicherweise müssen Sie mehr Daten erfassen. Möglicherweise müssen Sie den Featuresatz auch nach Beginn des Trainings ändern, wenn Sie erfahren, was funktioniert und was nicht.

Wie lange dauert das?

Klicken Sie bei der folgenden Frage auf den gewünschten Pfeil, um Ihre Antwort zu prüfen:

Wie lange brauchen Sie in Ihrem ML-Projekt normalerweise für die Datenvorbereitung und -transformation?
Mehr als die Hälfte der Projektzeit
Richtig: Sie verbringen die meiste Zeit in einem Projekt für maschinelles Lernen, um Datasets zu erstellen und Daten zu transformieren.
Weniger als die Hälfte der Projektzeit
Mehr planen! Normalerweise werden 80% der Zeit in einem Projekt für maschinelles Lernen mit dem Erstellen von Datasets und dem Umwandeln von Daten verbracht.