Absteigend in ML: Lineare Regression

Es ist seit Langem bekannt, dass Grillen (eine Insektenart) an wärmeren Tagen häufiger piepten als an kühleren Tagen. Jahrzehntelang haben professionelle und Amateurwissenschaftler Daten zu Pieptonen pro Minute und Temperatur katalogisiert. Als Geburtstagsgeschenk bekommst du von deiner Tante Ruth ihre Kricketdatenbank und wirst gebeten, ein Modell zu lernen, um diese Beziehung vorherzusagen. Anhand dieser Daten möchten Sie mehr über diese Beziehung erfahren.

Sehen Sie sich zuerst Ihre Daten an, indem Sie sie darstellen:

Rohdaten des Pieptons/Minute (x-Achse) im Vergleich zur Temperatur (y-Achse).

Abbildung 1. Piepton pro Minute im Vergleich zur Temperatur in Celsius.

Wie Sie sehen, zeigt die Grafik die steigende Temperatur zusammen mit der Anzahl der Pieptöne. Ist diese Beziehung zwischen Piepton und Temperatur linear? Ja, Sie können eine einzelne gerade Linie wie die folgende zeichnen, um diese Beziehung zu schätzen:

Beste Linie, die die Beziehung zwischen Piepton/Minute (X-Achse) und Temperatur (Y-Achse) bestimmt.

Abbildung 2. Eine lineare Beziehung.

Richtig, die Linie verläuft nicht durch jeden Punkt, aber die Linie zeigt deutlich die Beziehung zwischen Piepton und Temperatur. Wenn Sie die Gleichung für eine Linie verwenden, schreiben Sie diese Beziehung so:

$$ y = mx + b $$

wobei

  • \(y\) ist die Temperatur in Celsius, der Wert, den wir vorhersagen möchten.
  • \(m\) ist die Neigung der Linie.
  • \(x\) ist die Anzahl der Pieptöne pro Minute – der Wert unserer Eingabefunktion.
  • \(b\) ist der y-Achsenabschnitt.

Über Konventionen des maschinellen Lernens schreiben Sie die Gleichung für ein Modell etwas anders:

$$ y' = b + w_1x_1 $$

wobei

  • \(y'\) ist das vorhergesagte Label (eine gewünschte Ausgabe).
  • \(b\) ist die Verzerrung (der Y-Achsenabschnitt), die manchmal auch als \(w_0\)bezeichnet wird.
  • \(w_1\) ist die Gewichtung von Merkmal 1. Das Gewicht entspricht dem Konzept der Neigung nach \(m\) in der herkömmlichen Gleichung einer Linie.
  • \(x_1\) ist eine Funktion (bekannte Eingabe).

Wenn Sie die Temperatur \(y'\) für einen neuen Piepton pro Minute \(x_1\)ableiten möchten, ersetzen Sie einfach den \(x_1\) Wert in diesem Modell.

Obwohl dieses Modell nur ein Feature verwendet, kann ein komplexeres Modell auf mehreren Features basieren, die jeweils eine separate Gewichtung haben (\(w_1\), \(w_2\)usw.). Ein Modell, das auf drei Funktionen basiert, könnte beispielsweise so aussehen:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$