Gerçek Dünyada ML Sistemleri: Edebiyat

Bu derste, 18. yüzyıl edebiyatı ile ilgili gerçek dünyadan makine öğrenimi sorunlarını* ayıklayacaksınız.

Gerçek Dünya Örneği: 18. Yüzyıl Edebiyatı

  • 18. Yüzyıl Edebiyatı Profesörü, yazarların yalnızca "aksanlı metaforlara" dayanarak politik bağlantısını tahmin etmek istedi.
Eski Kitaplar
  • 18. Yüzyıl Edebiyatı Profesörü, yazarların yalnızca "aksanlı metaforlara" dayanarak politik bağlantısını tahmin etmek istedi.
  • Araştırmacılardan oluşan bir ekip, çok sayıda yazardan oluşan büyük bir etiketli veri kümesi oluşturdu. Eserler, cümleler halinde ve tren/doğrulama/test kümelerine bölündü.
Eski Kitaplar
  • 18. Yüzyıl Edebiyatı Profesörü, yazarların yalnızca "aksanlı metaforlara" dayanarak politik bağlantısını tahmin etmek istedi.
  • Araştırmacılardan oluşan bir ekip, çok sayıda yazardan oluşan büyük bir etiketli veri kümesi oluşturdu. Eserler, cümleler halinde ve tren/doğrulama/test kümelerine bölündü.
  • Eğitilen model test verilerinde neredeyse kusursuzdu ancak araştırmacılar sonuçların şüpheli olduğunu düşündü. Sorun ne olabilir?
Eski Kitaplar

Sizce test doğruluğunun neden şüpheli şekilde yüksek olduğunu düşünüyorsunuz? Sorunu bulup çözemediğinize bakın ve ardından doğru olup olmadığını öğrenmek için aşağıdaki Oynat düğmesini ▶ tıklayın.

  • Veri Bölmesi: Araştırmacılar her yazarın bazı örneklerini eğitim grubuna, bazıları doğrulama grubuna, bazıları da test grubuna koydu.
Richardson'ın tüm örnekleri eğitim kümesinde, Swift'in tüm örnekleri ise doğrulama kümesinde olabilir.
Eğitim, doğrulama ve test kümelerindeki yazar örneklerinin dökümünü gösteren şema. Her kümeden üç yazarın örnekleri verilir.
  • Veri B Bölümü: Araştırmacılar her yazarın tüm örneklerini tek bir sette toplar.
Eğitim, doğrulama ve test kümelerindeki yazar örneklerinin dökümünü gösteren şema. Eğitim kümesi yalnızca Swift'ten örnekler, doğrulama grubu yalnızca Blake'ten örnekler içerir ve test grubu yalnızca Defoe'dan örnekler içerir.
  • Veri Bölmesi: Araştırmacılar her yazarın bazı örneklerini eğitim grubuna, bazıları doğrulama grubuna, bazıları da test grubuna koydu.
  • Veri B Bölümü: Araştırmacılar her yazarın tüm örneklerini tek bir sette toplar.
  • Sonuçlar: Veri B Ayırması'nda eğitilen modelin, Veri B Bölümü'nde eğitilen modelden çok daha yüksek doğruluğu vardı.

Mantık: Örnekleri nasıl bölüştürdüğünüzü dikkatlice düşünün.

Verilerin neyi temsil ettiğini öğrenin.

* Bu modülü esas olarak; Anlam ve Madencilik: Sculley ve Pasanek'in Beşeri Bilimler için Veri Madenciliği'ndeki Dolaylı Varsayımların Etkisi temelinde oldukça gevşek bir şekilde oluşturduk.