Neuronale Netzwerke

Vielleicht erinnern Sie sich aus dem Funktionsübergreifende Übungen im Modul Kategoriale Daten dass das folgende Klassifizierungsproblem nicht linear ist:

Abbildung 1: kartesische Koordinatenebene, unterteilt in vier
      Quadranten, die alle mit zufälligen Punkten gefüllt sind, die einer Form ähneln,
      . Die Punkte im rechten oberen und linken unteren Quadranten sind blau, die Punkte im linken oberen und rechten unteren Quadranten sind orange.
Abbildung 1. Nicht lineares Klassifizierungsproblem. Eine lineare Funktion kann die blauen von den orangefarbenen Punkten.

„Nicht linear“ bedeutet, dass Sie ein Label mit einem der Form \(b + w_1x_1 + w_2x_2\). Mit anderen Worten: Die „Entscheidungsfläche“ ist keine Linie.

Wenn wir jedoch eine Merkmalskreuzung für die Merkmale x1 und x2 durchführen, können wir die nichtlineare Beziehung zwischen den beiden Merkmalen mit einem linearen Modell darstellen: $b + w_1x_1 + w_2x_2 + w_3x_3$, wobei x3 die Merkmalskreuzung zwischen x1 und x2 ist:

Abbildung 2. Die gleiche kartesische Koordinatenebene von Blau und Orange
      wie in Abbildung 1 dargestellt.  Diesmal ist jedoch eine weiße hyperbolische Kurve
      über dem Raster, wodurch die blauen Punkte oben rechts
      und die Quadranten unten links (jetzt mit blauem Hintergrund) von der
      die orangefarbenen Punkte oben links und rechts unten (jetzt
      orangefarbener Hintergrund).
Abbildung 2. Durch das Hinzufügen des Feature-Kreuzprodukts x1x2 kann das lineare Modell eine hyperbolische Form lernen, die die blauen Punkte von den orangefarbenen trennt.

Betrachten Sie nun den folgenden Datensatz:

Abbildung 3: Kartesische Koordinatenebene, unterteilt in vier Quadranten.
      Ein kreisförmiger Cluster mit blauen Punkten ist am Ursprung des
      und wird von einem Ring aus orangefarbenen Punkten umgeben.
Abbildung 3: Ein schwierigeres nichtlineares Klassifizierungsproblem.

Vielleicht erinnern Sie sich auch aus den Übungsreihen zu Funktionsverknüpfungen. dass die Bestimmung des richtigen Merkmals sich überschneidet, um ein lineares Modell an diese Daten anzupassen. etwas mehr Aufwand und Experimentierfreude.

Aber was wäre, wenn Sie all diese Tests nicht selbst durchführen müssten? neuronale Netzwerke gehören zu einer Familie von Modellarchitekturen, die darauf ausgelegt sind, nonlinear Muster in Daten. Während des Trainings eines neuronalen Netzes lernt das Modell automatisch die optimalen Feature-Kreuzungen, die auf den Eingabedaten ausgeführt werden müssen, um den Verlust zu minimieren.

In den folgenden Abschnitten sehen wir uns genauer an, wie sie funktionieren.