Echte numerische Daten
sinnvoll vervielfältigt werden. Stellen Sie sich zum Beispiel eine
Modell, das den Wert eines Hauses anhand seiner Fläche vorhersagt.
Ein nützliches Modell zur Bewertung von Hauspreisen basiert in der Regel
Hunderte Funktionen. Bei ansonsten gleichen Bedingungen wäre ein Haus mit 200 Quadratmetern
Meter sind etwa doppelt so wertvoll wie ein identisches Haus mit 100 Quadratmetern.
Meter.
Oft sollten Sie Merkmale darstellen, die Ganzzahlwerte als
kategorische Daten anstelle
numerischer Daten verwendet. Stellen Sie sich z. B. vor,
Code-Feature, bei dem die Werte Ganzzahlen sind. Wenn Sie dies
numerisch und nicht kategorisch
gekennzeichnet ist, fragen Sie das Modell,
eine numerische Beziehung zu finden,
Postleitzahlen zu verknüpfen. Das heißt, Sie weisen das Modell an,
die Postleitzahl 20004 als doppelt (oder halb) so groß wie ein Signal wie die Postleitzahl behandeln
10.002. Wenn Postleitzahlen als kategorische Daten dargestellt werden, kann das Modell
jede Postleitzahl separat gewichten.
Codierung
Codierung bezeichnet die Umwandlung kategorischer oder anderer Daten in numerische Vektoren
mit dem ein Modell trainieren kann. Diese Konvertierung ist notwendig, da Modelle
Trainieren Sie nur mit Gleitkommawerten. Modelle können nicht anhand von Strings wie
"dog" oder "maple". In diesem Modul werden verschiedene
Codierungsmethoden für kategorische Daten.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Benötigte Informationen nicht gefunden","missingTheInformationINeed","thumb-down"],["Zu umständlich/zu viele Schritte","tooComplicatedTooManySteps","thumb-down"],["Nicht mehr aktuell","outOfDate","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Problem mit Beispielen/Code","samplesCodeIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2024-08-13 (UTC)."],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]