特徴クロス: 理解度チェック

以下の選択肢をご確認ください。

カリフォルニア州の各都市では、住宅価格が大きく異なります。さて、カリフォルニアの住宅価格を予測するためのモデルを作成する必要があるとしましょう。roomsPerPerson と住宅価格の間の都市固有の関係を学習できる特徴セットまたは特徴クロスは、次のうちどれですか。
3 つの別々のビニングされた特徴: [binned Latitude], [binned 経度], [binned roomPerPerson]
ビニングは、モデルが 1 つの特徴内で非線形の関係を学習しられるため、適切です。ただし、都市は複数のディメンションに存在するため、都市固有の関係を学ぶには、緯度と経度を交差させる必要があります。
1 つの特徴量クロス: [緯度 X 経度 X 部屋数]
この例で、実数値の特徴を相互リンクすることはおすすめしません。たとえば、緯度の実際の値と roomPerPerson を掛けると、一方の特徴(緯度など)の 10% の変化がもう一方の特徴(roomPerPerson など)の 10% の変化と同じになります。
1 つの特徴量クロス: [binned Latitude X binned 経度 X binnedroomsPerPerson]
ビニング緯度とビニング経度を組み合わせると、モデルは roomPerPerson で都市固有の影響を学習できます。ビニングは、緯度の変更が経度の変更と同じ結果の生成を防ぎます。この特徴クロスは、ビンの粒度に応じて、都市固有または近隣固有、さらにはブロック固有効果を学習できます。
2 つの特徴クロス: [binned Latitude X binnedroomsPerPerson] [binbin 経度 X binnedroomsPerPerson]
ビニングは有効な手法です。ただし、経度と緯度を組み合わせたものです。そのため、1 つの都市で特徴が異なると、モデルは都市固有の価格を学習しません。