ML'ye azalan: Doğrusal Regresyon

Kriket (böcek türleri) serin günlerde değil, daha sık günlerde böcek sokağı olarak bilinir. Onlarca yıl boyunca profesyonel ve amatör bilim insanları, dakika başına tempo ve sıcaklığın kataloglu verilerini kullanır. Ruun Teyze, doğum günü hediyesi olarak size kriket veritabanını sunar ve bu ilişkiyi tahmin etmek için bir model öğrenmenizi ister. Bu verileri kullanarak bu ilişkiyi incelemek istiyorsunuz.

Öncelikle, verilerinizi grafiğe dökerek inceleyin:

Dakika/dakika (x ekseni) ile sıcaklık (y ekseni) karşılaştırması için ham veriler.

Şekil 1. Santimetre cinsinden dakika ve tempo cinsinden sıcaklık.

Beklendiği gibi, sıcaklık, şempanzelerin sayısıyla birlikte artan sıcaklığı gösterir. Sesler ile sıcaklık arasında ilişki var mı? Evet, bu ilişkiyi tahmin etmek için aşağıdaki gibi tek bir düz çizgi çizebilirsiniz:

Dakika/dakika (x ekseni) ile sıcaklık (y ekseni) arasındaki ilişkiyi gösteren en iyi çizgi.

Şekil 2. Doğrusal bir ilişki.

Doğru, çizgi her noktadan geçmiyor ancak çizgi, şempanzeler ile sıcaklık arasındaki ilişkiyi açık bir şekilde gösteriyor. Çizginin denklemini kullanarak bu ilişkiyi aşağıdaki gibi yazabilirsiniz:

$$ y = mx + b $$

Bu örnekte:

  • \(y\) Santigrat cinsinden sıcaklık değeridir. Tahmin etmeye çalıştığımız değer budur.
  • \(m\) doğrunun eğimidir.
  • \(x\) , dakika özelliğimizin dakika sayısıdır. Giriş özelliğimizin değeridir.
  • \(b\) , y kesme noktasıdır.

Makine öğrenimindeki kurallara göre, bir modelin denklemini biraz farklı yazacaksınız:

$$ y' = b + w_1x_1 $$

Bu örnekte:

  • \(y'\) tahmini etikettir (istenen çıkış).
  • \(b\) diğer adıyla ön yargıdır (y-kesimi) \(w_0\).
  • \(w_1\) 1. özelliğin ağırlığıdır. Ağırlık, bir çizginin geleneksel denklemindeki "yamaca \(m\) " ile aynı kavramdır.
  • \(x_1\) bir özelliktir (bilinen bir giriştir).

Sıcaklığı (tahmin etmek) için yeni bir dakika değeri \(y'\) tahmin etmek üzere \(x_1\), bu modelde \(x_1\) değerini kullanmanız yeterlidir.

Bu model yalnızca bir özellik kullansa da, daha karmaşık bir model, her birinin ayrı ağırlığı (\(w_1\), \(w_2\)vb.) olan birden fazla özelliği kullanabilir. Örneğin, üç özelliği temel alan bir model aşağıdaki gibi görünebilir:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$