Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
ML-Anwender verbringen viel mehr Zeit damit, die Daten auszuwerten, zu bereinigen und zu transformieren.
als Modelle zu erstellen.
Daten sind so wichtig, dass dem Thema in diesem Kurs drei ganze Einheiten gewidmet sind:
In diesem Modul geht es um
numerische Daten
bedeutet Ganzzahlen oder Gleitkommawerte
die sich wie Zahlen verhalten. Das heißt, sie sind additiv, zählbar, geordnet
und so weiter. Im nächsten Modul geht es um
kategorische Daten enthalten, für die
enthalten Zahlen, die sich wie Kategorien verhalten. Im dritten Modul geht es darum,
Bereiten Sie Ihre Daten vor, um qualitativ hochwertige Ergebnisse beim Training und bei der Bewertung sicherzustellen.
für Ihr Modell erstellen.
Beispiele für numerische Daten:
Temperatur
Gewicht
Die Anzahl der Rehe, die in einem Naturschutzgebiet überwintern
Im Gegensatz dazu verwenden US-Postleitzahlen trotz
5- oder 9-stellige Zahlen sind, verhalten Sie sich nicht wie Zahlen und stellen Sie
mathematische Beziehungen. Die Postleitzahl 40004 (in Nelson County, Kentucky) ist
nicht doppelt so hoch wie die Postleitzahl 20002 (in Washington, D.C.). Diese Nummern
Kategorien, insbesondere geografische Bereiche, und werden als
kategorialen Daten verwendet werden.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Benötigte Informationen nicht gefunden","missingTheInformationINeed","thumb-down"],["Zu umständlich/zu viele Schritte","tooComplicatedTooManySteps","thumb-down"],["Nicht mehr aktuell","outOfDate","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Problem mit Beispielen/Code","samplesCodeIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2024-08-13 (UTC)."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]