以下のオプションをご検討ください。
カリフォルニア州では都市によって顕著な違いが
住宅価格。
さて、カリフォルニアの住宅価格を予測するためのモデルを作成する必要があるとしましょう。次のうち、
学習した次の特徴セットまたは特徴クロスは
roomsPerPerson と都市固有の関係
住宅価格は?
ビニングした 3 つの対象物、[ビニングされた緯度]、
[ビニング経度]、[1 人あたりのビニング部屋数]
ビニングが適しているのは、モデルが非線形の学習を
複数の関係を 1 つの特徴にまとめますしかし、都市はある地域に
複数のディメンションがあるため、都市固有の関係を学習する
緯度と経度を交差させる必要があります。
1 つの特徴クロス: [緯度 X 経度 X
roomsPerPerson]
この例では、実数値の特徴を交差させることはおすすめしません。
たとえば緯度の真の値を、
RoomsPerPerson では、1 つの特徴(緯度など)で 10% の変更が可能です。
もう一方の特徴量(たとえば
1 人あたりの部屋数など)。
1 つの特徴クロス: [ビニング緯度 X ビニング経度 X ビニング
roomsPerPerson]
ビニングした緯度とビニングした経度を交差させることで、
モデルを使用して、1 人あたりの客室の都市固有の影響を学習します。
ビニングによって緯度の変更を防ぎ、同じ結果を生成する
経度の変化として表しますデータの粒度によっては、
この特徴クロスは都市固有または
周辺地域特有の効果やブロック特有の効果なども発揮できます。
2 つの特徴クロス: [ビニングされた緯度 X ビニングした部屋数(1 人あたり)]
と [ビニング経度 X ビニングした部屋 1 人あたり]
ビニングは良い考えです。ただし、「都市」は、
緯度と経度が異なるため、個別の特徴クロスを使用すると、
都市固有の価格を学習します。