Veri kümeleri, genelleme ve aşırı uyum

Giriş

Bu modül bir soruyla başlar. Aşağıdaki yanıtlardan birini seçin:

Makine öğrenimi projenizde aşağıdaki alanlardan birine öncelik vermeniz gerekirse hangisi en fazla etkiye sahip olur?
Veri kümenizin kalitesini iyileştirme
Veriler her şeyin üzerindedir. Veri kümesinin kalitesi ve boyutu, modelinizi oluşturmak için kullandığınız parlak algoritmadan çok daha önemlidir.
Modelinizi eğitmek için daha akıllı bir kayıp işlevi uygulama
Daha iyi bir kayıp işlevinin modelin daha hızlı eğitilmesine yardımcı olabileceği doğrudur ancak bu listedeki diğer bir öğeye kıyasla yine de ikinci sıradadır.

Daha da yönlendirici bir soru:

Makine öğrenimi projenizde genellikle veri hazırlama ve dönüştürme işlemlerine ne kadar zaman ayırıyorsunuz?
Proje süresinin yarısından fazlası
Evet, makine öğrenimi uzmanları zamanlarının büyük bir kısmını veri kümeleri oluşturarak ve özellik mühendisliği yaparak geçirir.
Proje süresinin yarısından az
Daha fazlası için plan yapın. Genelde makine öğreniminin% 80'inde veri kümelerini oluşturmak ve verileri dönüştürmek için harcanıyor.

Bu modülde, makine öğreniminin özellikleri ve verilerinizi hazırlayarak yüksek kaliteli sonuçlar elde etmek için ve değerlendirme sürecidir.