Eğitim Setleri ve Test Setleri
Eğitim setleri ve test kümeleriyle denemeler yapmak
için Playground'a geri dönüyoruz.
Turuncu ve mavi noktaların ne anlama geldiğini hatırlamak için artı simgesini tıklayın.
Görselleştirmede:
- Her mavi nokta, bir veri sınıfının (örneğin, spam) bir örneğini temsil eder.
- Her turuncu nokta, başka bir veri sınıfının (örneğin spam değil) bir örneğini ifade eder.
- Arka plan rengi, modelin söz konusu rengin örneklerinin nerede bulunduğuna dair tahminini temsil eder. Mavi noktanın çevresindeki mavi arka plan, modelin söz konusu örneği doğru şekilde tahmin ettiği anlamına gelir. Buna karşılık, mavi noktanın etrafındaki turuncu arka plan, modelin söz konusu örnek için yanlış bir tahminde bulunduğu anlamına gelir.
Bu alıştırma hem test hem de eğitim kümesi sağlar. Her ikisi de aynı veri kümesinden alınır. Varsayılan olarak, görselleştirme yalnızca eğitim kümesini gösterir. Test grubunu da görmek isterseniz görselleştirmenin hemen altındaki Test verilerini göster onay kutusunu tıklayın. Görselleştirmede şu ayrıma dikkat edin:
- Eğitim örneklerinin dış çizgisi beyazdır.
- Test örneklerinin dış çizgisi siyahtır.
1. Görev: Aşağıdakileri yaparak Playground'u belirtilen ayarlarla çalıştırın:
- Çalıştır/Duraklat düğmesini tıklayın:
- Test kaybı ve eğitim kaybı değerlerinin nasıl değiştiğini izleyin.
- Test kaybı ve Eğitim kaybı değerleri değişmeyi durdurduğunda veya arada bir kez değiştirildiğinde, Playground'u duraklatmak için Çalıştır/Duraklat düğmesine tekrar basın.
Test kaybı ile Eğitim kaybı arasındaki deltaya dikkat edin. Aşağıdaki görevlerde bu
deltayı azaltmaya çalışacağız.
2. Görev: Aşağıdakileri yapın:
- Sıfırla düğmesine basın.
- Öğrenme hızını değiştirin.
- Çalıştır/Duraklat düğmesine basın:
- Playground'u en az 150 dönem boyunca çalıştırsın.
Bu yeni Öğrenme oranıyla Test kaybı ile Eğitim kaybı arasındaki
delta daha mı düşük yoksa daha mı yüksek? Hem öğrenme ücretini hem de toplu boyutu değiştirirseniz ne olur?
İsteğe Bağlı 3. Görev: Eğitim verisi yüzdesi etiketli bir kaydırma çubuğu, verileri test etmek için eğitim verilerinin oranını kontrol etmenizi sağlar. Örneğin, %90'a ayarlandığında verilerin% 90'ı eğitim kümesi için, kalan% 10'u ise test kümesi için kullanılır.
Aşağıdakileri yapın:
- "Eğitim verisi yüzdesi"ni% 50'den %10'a düşürün.
- Bulgularınız hakkında notlar alarak, Öğrenme oranı ve Grup boyutu ile denemeler yapın.
Eğitim verisi yüzdesini değiştirmek, 2. görevde keşfettiğiniz optimum öğrenme ayarlarını değiştirir mi? Neden duruyorlar?
1. Görev cevabı için artı simgesini tıklayın.
Öğrenme hızı 3'e (ilk ayar) ayarlandığında, test kaybı Eğitim kaybından önemli ölçüde daha yüksektir.
2. Görevin yanıtı için artı simgesini tıklayın.
Öğrenme hızı (örneğin, 0,001'e) düşürüldüğünde test kaybı, eğitim kaybına çok daha yakın bir değere düşer. Çoğu çalıştırmada, Grup boyutunun artırılması Eğitim kaybını veya Test kaybını önemli ölçüde etkilemez. Bununla birlikte, çalıştırmaların küçük bir yüzdesinde, Grup boyutunun 20 veya daha büyük bir değere yükseltilmesi, Test kaybının Eğitim kaybının biraz altına düşmesine neden olur.
Playground'un veri kümeleri rastgele oluşturulur. Sonuç olarak, verdiğimiz cevaplar
her zaman sizinkilerle tam olarak örtüşmeyebilir.
3. Görev cevabı için artı simgesini tıklayın.
Eğitim verisi yüzdesinin% 50'den% 10'a düşürülmesi, eğitim kümesindeki veri noktası sayısını önemli ölçüde azaltır. Bu kadar az veri olduğunda, yüksek grup boyutu ve yüksek öğrenme hızı, eğitim modelinin düzensiz bir şekilde atlamasına (minimum noktanın üzerine tekrar tekrar atlamasına) neden olur.