Sehen Sie sich die folgenden Optionen an.
Die Unterschiede zwischen den Städten in Kalifornien
Immobilienpreise.
Angenommen, Sie müssen ein Modell erstellen, um die Immobilienpreise vorherzusagen. Welche der folgenden
oder Funktionsverknüpfungen lernen könnten,
stadtspezifischen Beziehungen zwischen
roomsPerPerson und
Immobilienpreis?
Drei separate gruppierte Merkmale: [gruppierter Breitengrad],
[gruppierter Längengrad], [gruppierte ZimmerProPerson]
Gruppieren eignet sich gut, da das Modell damit nicht lineares Lernen lernen kann.
Beziehungen innerhalb eines einzelnen Merkmals. Eine Stadt existiert jedoch
mehr als eine Dimension nutzen, um stadtspezifische
Beziehungen zu erlernen,
erfordert eine Verknüpfung von Breiten- und Längengrad.
Eine Merkmalsverknüpfung: [Breitengrad X Längengrad X
roomsPerPerson]
In diesem Beispiel ist es keine gute Idee, reellwertige Features zu verknüpfen.
Wenn der tatsächliche Wert z. B. der Breitengrad mit
ZimmerProPerson ermöglicht eine Änderung von 10% bei einem Feature (z. B. Breitengrad)
Dies entspricht einer Änderung von 10% beim anderen Merkmal (z. B.
ZimmerProPerson).
Eine Merkmalsverknüpfung: [gruppierter Breitengrad X gruppierter Längengrad X gruppiert
roomsPerPerson]
Durch das Verknüpfen des gruppierten Breitengrads mit dem gruppierten Längengrad wird die
um stadtspezifische Auswirkungen von ZimmernProPerson zu erlernen.
Gruppieren verhindert, dass eine Änderung des Breitengrads zum selben Ergebnis führt.
Änderung des Längengrads. Je nach Detaillierungsgrad
könnte diese Funktionsverknüpfung stadtspezifische oder
nachbarschafts- oder sogar blockspezifische Effekte.
Zwei Funktionsverknüpfungen: [gruppierter Breitengrad X gruppierte ZimmerProPerson]
und [gruppierter Längengrad X gruppierte ZimmerProPerson]
Gruppieren ist eine gute Idee, Eine Stadt ist jedoch das Zusammenspiel
Breiten- und Längengrad, sodass separate Funktionsverknüpfungen
anhand der stadtspezifischen Preise.