Wahre numerische Daten können sinnvoll multipliziert werden. Stellen Sie sich zum Beispiel eine
Modell, das den Wert eines Hauses anhand seiner Fläche vorhersagt.
Ein nützliches Modell zur Bewertung von Hauspreisen basiert in der Regel
Hunderte Funktionen. Unter sonst gleichen Bedingungen sollte ein Haus mit 200 Quadratmetern etwa doppelt so viel wert sein wie ein identisches Haus mit 100 Quadratmetern.
Oft sollten Sie Merkmale darstellen, die Ganzzahlwerte als
kategorische Daten anstelle
numerischer Daten verwendet. Stellen Sie sich z. B. vor,
Code-Feature, bei dem die Werte Ganzzahlen sind. Wenn Sie diese Funktion numerisch statt kategorisch darstellen, wird das Modell aufgefordert, eine numerische Beziehung zwischen verschiedenen Postleitzahlen zu finden. Das Modell soll also die Postleitzahl 20004 als doppelt (oder halb) so starkes Signal wie die Postleitzahl 10002 behandeln. Wenn Sie Postleitzahlen als kategorische Daten darstellen, kann das Modell jede einzelne Postleitzahl separat gewichten.
Codierung
Codierung bezeichnet die Umwandlung kategorischer oder anderer Daten in numerische Vektoren
mit dem ein Modell trainieren kann. Diese Konvertierung ist notwendig, da Modelle
Trainieren Sie nur mit Gleitkommawerten. Modelle können nicht anhand von Strings wie
"dog" oder "maple". In diesem Modul werden verschiedene
Codierungsmethoden für kategorische Daten.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Benötigte Informationen nicht gefunden","missingTheInformationINeed","thumb-down"],["Zu umständlich/zu viele Schritte","tooComplicatedTooManySteps","thumb-down"],["Nicht mehr aktuell","outOfDate","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Problem mit Beispielen/Code","samplesCodeIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-07-27 (UTC)."],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]