Diese Seite wurde von der Cloud Translation API übersetzt.

Kategorische Daten: Funktionsverknüpfungen

Merkmalskreuzungen werden durch Kreuzen (Kartesianisches Produkt) von zwei oder mehr kategorischen oder gebucketten Merkmalen des Datasets erstellt. Ähnlich wie bei polynomialen Transformationen können mithilfe von Funktionskreuzungen Nichtlinearitäten in linearen Modellen berücksichtigt werden. Außerdem werden damit Interaktionen zwischen Features codiert.

Betrachten Sie beispielsweise ein Blatt-Dataset mit den folgenden kategorischen Merkmalen:

edges mit den Werten smooth, toothed und lobed
arrangement mit den Werten opposite und alternate

Angenommen, die obige Reihenfolge ist die Reihenfolge der Feature-Spalten in einer One-Hot-Darstellung. Ein Blatt mit smooth Kanten und opposite Anordnung wird dann als {(1, 0, 0), (1, 0)} dargestellt.

Das Feature-Cross oder kartesische Produkt dieser beiden Funktionen würde so aussehen:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

wobei der Wert jedes Terms das Produkt der Basisfeaturewerte ist, z. B.:

Smooth_Opposite = edges[0] * arrangement[0]
Smooth_Alternate = edges[0] * arrangement[1]
Toothed_Opposite = edges[1] * arrangement[0]
Toothed_Alternate = edges[1] * arrangement[1]
Lobed_Opposite = edges[2] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]

Wenn ein Blatt beispielsweise eine lobed-Kante und eine alternate-Anordnung hat, hat der Feature-Kreuzvektor den Wert 1 für Lobed_Alternate und den Wert 0 für alle anderen Begriffe:

{0, 0, 0, 0, 0, 1}

Dieser Datensatz könnte verwendet werden, um Blätter nach Baumart zu klassifizieren, da diese Merkmale innerhalb einer Art nicht variieren.

Polynome Transformationen mit Feature-Kreuzungen vergleichen

Featureverknüpfungen sind in gewisser Weise mit polynomialen Transformationen vergleichbar. Bei beiden werden mehrere Features zu einer neuen synthetischen Funktion kombiniert, anhand derer das Modell Nichtlinearitäten lernen kann. Bei polynomen Transformationen werden in der Regel numerische Daten kombiniert, während bei Merkmalskreuzungen kategorische Daten kombiniert werden.

Wann sind Feature-Überschneidungen sinnvoll?

Fachwissen kann eine nützliche Kombination von Features vorschlagen, die kombiniert werden sollten. Ohne dieses Fachwissen kann es schwierig sein, effektive Feature-Kreuzungen oder Polynomtransformationen manuell zu bestimmen. Es ist oft möglich, aber rechenintensiv, neuronale Netze zu verwenden, um während des Trainings automatisch nützliche Kombinationen von Funktionen zu finden und anzuwenden.

Achtung: Wenn Sie zwei spärliche Elemente überschneiden, entsteht ein noch spärlicheres neues Element als die beiden ursprünglichen Elemente. Wenn Feature A beispielsweise ein spärliches Feature mit 100 Elementen und Feature B ein spärliches Feature mit 200 Elementen ist, ergibt die Feature-Kreuzung von A und B ein spärliches Feature mit 20.000 Elementen.

Hilfe

Zurück

Häufige Probleme mit kategorischen Daten (5 Min.)

Weiter

Übungen zu Feature-Überschneidungen (15 Min.)

Kategorische Daten: Funktionsverknüpfungen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Wann sind Feature-Überschneidungen sinnvoll?

Kategorische Daten: Funktionsverknüpfungen