Kaybı Azaltma: Yinelemeli Bir Yaklaşım

Önceki modül kayıp kavramını tanıtmıştı. Bu modülde, makine öğrenimi modelinin kaybı nasıl azalttığını öğreneceksiniz.

Yinelemeli öğrenim, size çocuk oyuncağı gibi "Hot and Soğuk" oyunu hatırlatabilir. Bu oyunda, "gizli nesne" mümkün olan en iyi modeldir. Çılgın bir tahminle (" \(w_1\) değeri 0">") başlarsınız ve sistemden, kaybın ne olduğunu söylemesini beklersiniz. Ardından, başka bir tahminde (" \(w_1\) değeri 0.5'tir.") denersiniz ve kaybın ne olduğunu görürsünüz. Aslında, bu oyunu doğru oynarsanız genellikle daha ısınmaya başlar. Buradaki asıl sorun, mümkün olan en iyi modeli olabildiğince verimli bir şekilde bulmaya çalışmaktır.

Aşağıdaki şekilde, makine öğrenimi algoritmalarının bir modeli eğitmek için kullandığı yinelemeli deneme-yanılma süreci gösterilmektedir:

Özellikler ile etiketlerden modellere ve tahminlere geçiş döngüsü.

Şekil 1. Model eğitmeye yönelik yinelemeli bir yaklaşım.

Özellikle "Model (Tahmin İşlevi)" etiketli bu fırtınalı bulutta çeşitli sorunları ayrıntılı bir şekilde açıklayarak Makine Öğrenimi Kilitlenme Kursu boyunca aynı tekrarlı yaklaşımı uygulayacağız. Yinelemeli stratejiler, makine öğreniminde yaygındır. Bunun başlıca nedeni, bu stratejilerin büyük veri kümelerinde çok iyi ölçeklenebilmesidir.

"Model", giriş olarak bir veya daha fazla özelliği alır ve çıkış olarak bir tahmini döndürür. Basitleştirmek için, bir özelliği (\(x_1\)) alıp bir tahmin (\(y'\)) döndüren bir model düşünün:

$$ y' = b + w_1x_1 $$

\(b\)ve \(w_1\)için hangi başlangıç değerlerini belirlemeliyiz? Doğrusal regresyon problemlerinde, başlangıç değerlerinin önemli olmadığı ortaya çıkar. Rastgele değerler seçebiliriz, ancak bunun yerine aşağıdaki önemsiz değerleri alacağız:

  • \(b\) = 0
  • \(w_1\) = 0

İlk özelliğin değerinin 10 olduğunu varsayalım. Bu özellik değerini tahmin işlevine bağlamak şunları sağlar:

$$ y' = 0 + 0 \cdot 10 = 0 $$

Şemanın "Hesaplama Kaybı" bölümü, modelin kullanacağı kayıp işlevidir. Kare kayıp fonksiyonunu kullandığımızı varsayalım. Kayıp işlevi iki girdi değeri alır:

  • \(y'\): Modelin x özellikleriyle ilgili tahmini
  • \(y\): x özelliklerine karşılık gelen doğru etiket.

Son olarak diyagramın "İşlem parametresi güncellemeleri" bölümüne geldik. Bu noktada makine öğrenimi sistemi, kayıp işlevinin değerini inceler ve \(b\) ve \(w_1\)için yeni değerler oluşturur. Şimdilik, bu gizemli kutunun yeni değerler geliştirdiğini ve ardından makine öğrenimi sisteminin tüm bu etiketlere göre tüm bu özellikleri yeniden değerlendirdiğini ve yeni parametre değerleri veren kayıp fonksiyonu için yeni bir değer elde ettiğini varsayalım. Algoritma, olası en düşük kayba sahip model parametrelerini bulana kadar öğrenme işlemi yinelenmeye devam eder. Genellikle, toplam kayıp durana veya en azından çok yavaş değişene kadar yineleme yaparsınız. Bu gerçekleştiğinde, modelin tümleşik olduğunu belirtiriz.