Doğrusal regresyon: Gradyan inişi

Gradyan inişi, ağırlıkları ve sapmayı yinelemeli olarak bulup en düşük kayıpla modeli üreten matematiksel bir tekniktir. Gradyan inişi, kullanıcı tarafından tanımlanan bir dizi yineleme için aşağıdaki işlemi tekrarlayarak en iyi ağırlığı ve yanlılığı bulur.

Model, sıfıra yakın rastgele ağırlıklar ve önyargılarla eğitime başlar ve ardından aşağıdaki adımları tekrarlar:

  1. Mevcut ağırlık ve önyargıyla kaybı hesaplayın.

  2. Ağırlıkları ve kaybı azaltan önyargıyı hangi yönde hareket ettireceğinizi belirleyin.

  3. Ağırlık ve önyargı değerlerini, kaybı azaltacak yönde küçük bir miktar hareket ettirin.

  4. Birinci adıma dönün ve model kaybı daha fazla azaltamayacak duruma gelene kadar işlemi tekrarlayın.

Aşağıdaki şemada, en düşük kayıpla modeli üreten ağırlıkları ve önyargıyı bulmak için gradyan inişinin gerçekleştirdiği yinelemeli adımlar özetlenmektedir.

Şekil 11. Gradyan iniş sürecinin görseli.

Şekil 11. Gradyan inişi, en düşük kayıpla modeli üreten ağırlıkları ve yanlılığı bulan yinelemeli bir süreçtir.

Model yakınsama ve kayıp eğrileri

Bir modeli eğitirken modelin yakınlaşmış olup olmadığını belirlemek için genellikle kayıp eğrisine bakarsınız. Kayıp eğrisi, model eğitilirken kaybın nasıl değiştiğini gösterir. Tipik bir kayıp eğrisi aşağıdaki gibidir. Kayıp y ekseninde, yinelemeler ise x ekseninde gösterilir:

12. şekil. Önce keskin, ardından yavaş bir düşüş gösteren kayıp eğrisi grafiği.

Şekil 12. Modelin 1.000. yineleme işaretinin etrafında yakınlaştığını gösteren kayıp eğrisi.

Kayıp değerinin ilk birkaç yinelemede önemli ölçüde azaldığını, ardından 1.000. yineleme civarında düzleşmeden önce kademeli olarak azaldığını görebilirsiniz. 1.000 yinelemeden sonra modelin yakınsadığından neredeyse emin olabiliriz.

Aşağıdaki şekillerde, modeli eğitim sürecinde üç noktada çiziyoruz: başlangıç, orta ve bitiş. Eğitim süreci sırasında modelin durumunu anlık görüntülerle görselleştirmek, ağırlıkların ve önyargının güncellenmesi, kaybın azaltılması ve model yakınsaması arasındaki bağlantıyı güçlendirir.

Şekillerde, modeli temsil etmek için belirli bir yinelemede türetilmiş ağırlıkları ve yanlılığı kullanırız. Veri noktaları ve model anlık görüntüsünün bulunduğu grafikte, modelden veri noktalarına giden mavi kayıp çizgileri kayıp miktarını gösterir. Çizgiler ne kadar uzun olursa kayıp da o kadar fazla olur.

Aşağıdaki şekilde, yaklaşık ikinci yinelemede modelin yüksek kayıp miktarı nedeniyle tahmin yapmada iyi olmadığı görülmektedir.

Şekil 13. Veri noktalarından uzaklaşan modelin kayıp eğrisi ve ilgili grafiği.

Şekil 13. Eğitim sürecinin başlangıcındaki modelin kayıp eğrisi ve anlık görüntüsü.

Yaklaşık 400. yinelemede, gradyan inişinin daha iyi bir model üreten ağırlığı ve önyargıyı bulduğunu görebiliriz.

Şekil 14. Veri noktalarından geçen ancak optimum açıda olmayan modelin kayıp eğrisi ve ilgili grafiği.

Şekil 14. Eğitimin yaklaşık ortasında modelin kaybı eğrisi ve anlık görüntüsü.

Yaklaşık 1.000 tekrardan sonra modelin yakınsadığını ve mümkün olan en düşük kayba sahip bir model oluşturduğunu görebiliriz.

Şekil 15. Verilere iyi uyan modelin kayıp eğrisi ve ilgili grafiği.

Şekil 15. Eğitim sürecinin sonuna doğru modelin kayıp eğrisi ve anlık görüntüsü.

Alıştırma: Öğrendiklerinizi test etme

Doğrusal regresyonda gradyan inişinin rolü nedir?
Gradyan inişi, kaybı en aza indiren en iyi ağırlıkları ve önyargıyı bulan yinelemeli bir süreçtir.
Gradyan inişi, bir modeli eğitirken hangi tür kaybın kullanılacağını belirlemeye yardımcı olur (ör. L1 veya L2).
Model eğitimi için kayıp fonksiyonu seçilirken gradyan inişi kullanılmaz.
Gradyen inişi, modelin daha iyi tahminler yapmasına yardımcı olmak için aykırı değerleri veri kümesinden kaldırır.
Gradyan inişi, veri kümesini değiştirmez.

Yakınsama ve dışbükey fonksiyonlar

Doğrusal modellerin kayıp işlevleri her zaman dışbükey bir yüzey oluşturur. Bu özellik sayesinde, doğrusal regresyon modeli yakınsadığında modelin en düşük kaybı üreten ağırlıkları ve önyargıyı bulduğunu biliriz.

Tek bir özelliğe sahip bir modelin kayıp yüzeyini grafiğe dökersek dışbükey şeklini görebiliriz. Aşağıda, varsayımsal bir galon başına mil veri kümesinin kayıp yüzeyi gösterilmektedir. Ağırlık x ekseninde, sapma y ekseninde ve kayıp z eksenindedir:

Şekil 16. Kayıp yüzeyinin 3 boyutlu grafiği.

Şekil 16. Dışbükey şeklini gösteren kayıp yüzey.

Bu örnekte, -5,44 ağırlık ve 35,94 önyargı ile 5,54'te en düşük kayıp elde edilir:

Şekil 17. En altta (-5.44, 35.94, 5.54) değerlerinin bulunduğu kayıp yüzeyinin 3 boyutlu grafiği.

Şekil 17. En düşük kaybı üreten ağırlık ve önyargı değerlerini gösteren kayıp yüzeyi.

Doğrusal bir model, minimum kaybı bulduğunda yakınsar. Eğim inişi sırasında ağırlık ve önyargı noktalarını grafiğe dökersek noktalar, bir tepeden aşağı yuvarlanan ve sonunda aşağı doğru eğimin kalmadığı noktada duran bir top gibi görünür.

Şekil 18. Gradyan iniş noktalarının en düşük noktaya hareket ettiği dışbükey 3 boyutlu kayıp yüzeyi.

Şekil 18. Gradyan iniş noktalarının grafikteki en düşük noktada durduğunu gösteren kayıp grafiği.

Siyah kayıp noktalarının, kayıp eğrisinin tam şeklini oluşturduğuna dikkat edin: Kayıp yüzeyindeki en düşük noktaya ulaşana kadar kademeli olarak aşağı eğimlenmeden önce dik bir düşüş.

En düşük kaybı üreten ağırlık ve önyargı değerlerini (bu örnekte -5,44 ağırlık ve 35,94 önyargı) kullanarak modeli grafiğe dökebilir ve verilere ne kadar iyi uyduğunu görebiliriz:

Şekil 19. Verilere uyan modelle birlikte, 1.000'lik birimler halinde ağırlık ile galon başına mil grafiği.

Şekil 19. En düşük kaybı üreten ağırlık ve önyargı değerleri kullanılarak oluşturulan model grafiği.

Başka hiçbir ağırlık ve önyargı değeri daha düşük kayıplı bir model üretmediği için bu veri kümesi için en iyi model budur.