Lojistik Regresyon: Olasılığı Hesaplama

Birçok sorun, çıktı olarak bir olasılık tahmini gerektirir. Lojistik regresyon, olasılıkların hesaplanmasında son derece etkili bir mekanizmadır. Uygulamalı olarak, döndürülen olasılığı aşağıdaki iki yöntemden birini kullanarak kullanabilirsiniz:

  • "Olduğu gibi"
  • İkili kategoriye dönüştürüldü.

"Olasılık" değerini nasıl kullanabileceğimizi inceleyelim. Gece yarısında köpeklerin havlama olasılığını tahmin etmek için lojistik regresyon modeli oluşturduğumuzu varsayalım. Bu olasılığı,

\[p(bark | night)\]

Lojistik regresyon modeli \(p(bark | night) = 0.05\)tahmin ediyorsa köpeğin sahipleri bir yıl boyunca yaklaşık 18 kez uyanık kalmalıdır:

\[\begin{align} startled &= p(bark | night) \cdot nights \\ &= 0.05 \cdot 365 \\ &~= 18 \end{align} \]

Çoğu durumda, lojistik regresyon çıktısını, çözümlemeye ikili bir sınıflandırma sorunuyla eşlersiniz.Burada amaç, mümkün olan iki etiketten birini (ör. "spam" veya "spam değil") Daha sonraki bir Modül bu konuya odaklanır.

Lojistik regresyon modelinin, her zaman 0 ile 1 aralığında olan çıkışları nasıl sağladığını merak ediyor olabilirsiniz. Bu durumda, sigmoid işlevi aşağıda tanımlandığı gibi aynı özelliklere sahip çıkışlar üretir:

$$y = \frac{1}{1 + e^{-z}}$$

Sigmoid işlevi aşağıdaki grafiği sunar:

Sigmoid işlevi. X ekseni, ham çıkarım değeridir. Y ekseni 0'dan +1'e kadar (bu değerler hariç).

Şekil 1: Sigmoid işlevi.

Lojistik regresyonla eğitilen bir modelin doğrusal katmanının \(z\) sonucunu temsil etmesi \(sigmoid(z)\) , 0 ile 1 arasında bir değer (olasılık) sağlar. Matematiksel terimler:

$$y' = \frac{1}{1 + e^{-z}}$$

Bu örnekte:

  • \(y'\) belirli bir örnek için lojistik regresyon modelinin sonucudur.
  • \(z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N\)
    • \(w\) Değerler, modelin öğrendiği ağırlıklar olup \(b\) ön yargılı olur.
    • \(x\) Değerler, belirli bir örnek için özellik değerleridir.

\(z\) Sigortanın tersi, \(z\) \(1\) etiket olasılığını (ör. "Köpek havlaması"etiketi, \(0\) etiketin (ör. "köpek havlaması"):

$$ z = \log\left(\frac{y}{1-y}\right) $$

Burada, makine öğrenimi etiketleri olan sigmoid işlevi verilmiştir:

x ekseninin tüm ağırlıkların ve özelliklerin toplamıyla (artımlı ağırlık) etiketlendiği Sigmoid işlevi; y ekseni, Olasılık Çıkışı olarak etiketlenir.

2. Şekil: Lojistik regresyon çıktısı.