ML への降順: 線形回帰

クリケット(昆虫の種)は、寒い日より暑い日の方が頻繁に鳴ると言われています。何十年にもわたり、プロとアマチュアの科学者は、1 分あたりの気温と気温に関するデータをカタログ化してきました。ルースおばさんは、誕生日プレゼントとしてクリケットのデータベースを提供し、その関係を予測するためにモデルを学ぶよう求めています。 このデータを使用して、この関係について調べたいと考えています。

まず、データをプロットして調査します。

チャープ/分(x 軸)と温度(Y 軸)の元データ。

図 1. チャープ(1 分あたり)と温度(摂氏)の比較。

想定どおり、プロットはチャープ数に応じて温度が上昇しています。警告音と温度線形の関係はい。この関係を近似するため、次のような 1 本の直線を描画できます。

チャープ/分(x 軸)と温度(Y 軸)の関係を確立する最良の線。

図 2. 直線的な関係です。

確かに、この線はすべてのドットを通過しませんが、チャープと温度の関係を明確に示しています。線の方程式を使用すると、この関係を次のように記述できます。

$$ y = mx + b $$

ここで

  • \(y\) は摂氏(温度)です。これは予測しようとしている値です。
  • \(m\) は、ラインの傾きです。
  • \(x\) は、1 分あたりのチャープ数です。入力特徴の値です。
  • \(b\) は y 切片です。

機械学習の慣例では、モデルの方程式は少し異なります。

$$ y' = b + w_1x_1 $$

ここで

  • \(y'\) は、予測されるラベル(目的の出力)です。
  • \(b\) はバイアス(y 切片)で、 \(w_0\)とも呼ばれます。
  • \(w_1\) は、特徴 1 の重みです。重みは、ラインの従来の方程式にある「傾き」と同じ概念です。 \(m\)
  • \(x_1\) は特徴(既知の入力)です。

1 分単位の新しいチャープ値の温度を推定(予測)するには、このモデルに \(x_1\) 値を置き換えるだけです。

このモデルは 1 つの特徴のみを使用しますが、より高度なモデルは複数の特徴に依存し、それぞれに別の重み(\(w_1\)、 \(w_2\)など)がある場合もあります。たとえば、3 つの特徴に依存するモデルは次のようになります。

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$