ニューラル ネットワーク

前述したように、 特徴クロスの演習 カテゴリデータ モジュールでは、 次の分類問題が非線形であることがわかります。

図 1. 4 つの象限に分割されたデカルト座標平面。各象限には、正方形に似た形のランダムなドットが配置されています。右上と左下の四分円の点は青色で、左上と右下の四分円の点はオレンジ色です。
図 1. 非線形分類問題。線形関数では、青い点とオレンジ色の点をすべてきれいに分離することはできません。

「非線形」とは、 \(b + w_1x_1 + w_2x_2\)形式のモデルではラベルを正確に予測できないことを意味します。つまり、「決定サーフェス」は線ではありません。

ただし、特徴量 $x_1$ と $x_2$ で特徴量の交差を実行すると、線形モデル $b + w_1x_1 + w_2x_2 + w_3x_3$ を使用して、2 つの特徴量間の非線形関係を表すことができます。ここで、$x_3$ は $x_1$ と $x_2$ の特徴量の交差です。

図 2. 青とオレンジの同じデカルト座標平面
      ドットが表示されます。ただし、今回はグリッドの上に白色の双曲線がプロットされ、右上と左下の四分円の青いドット(青色の背景で網掛け)と、左上と右下の四分円のオレンジ色のドット(オレンジ色の背景で網掛け)が区別されています。
図 2. 特徴クロスを追加すること x1x2 の場合、線形モデルは 青い点とオレンジ色の点を分ける双曲線的な図形です。

次のデータセットについて考えてみましょう。

図 3. 4 つの象限に分割されたデカルト平面。青い点の円形クラスタがグラフの原点を中心に配置され、オレンジ色の点の輪で囲まれています。
図 3. より難しい非線形分類問題。

特徴の交差演習でも説明しましたが、このデータに線形モデルを適合させる正しい特徴の交差を決定するには、もう少しの労力とテストが必要でした。

しかし、そのようなテストをすべて自分で行う必要がないとしたらどうでしょうか。 ニューラル ネットワークは、 モデルアーキテクチャの nonlinear パターンです。ニューラル ネットワークのトレーニング中に、モデルは、損失を最小限に抑えるために入力データに対して実行する最適な特徴量の交差を自動的に学習します。

以降のセクションでは、ニューラル ネットワークの仕組みについて詳しく説明します。