Rastgele Orman

Bu bir Ox.

Eski bir öküzün fotoğrafı.

Şekil 19. Ox.

 

1906 yılında Birleşik Krallık'ta ağırlık değerlendirme yarışması yapıldı. 787 katılımcı bir öküzün ağırlığını tahmin etti. Tek bir tahmine ait ortanca hata 37 lb (%3,1 hatası)ydı. Ancak tahminlerin genel ortanca değeri, oksit ağırlığından (1.198 lb) yalnızca 9 lb'lik bir mesafedeydi. Bu da sadece %0,7'lik bir hataydı.

Çoğu tahminin, oksitin gerçek ağırlığı etrafında toplanmış tahminleri gösteren histogram.

Şekil 20. Ayrı ayrı kilo tahminlerinin histogramı.

 

Bu fıkra, kalabalığın bilgeliğini tasvir eder: Belirli durumlarda toplu görüş, kişilerin sağduyularını yansıtır.

Matematiksel olarak kalabalığın bilgeliği Merkezi sınır teoremi ile modellenebilir: Bilinçli olarak, bir değerin ve bu değerin N gürültülü tahmininin ortalaması arasındaki kare hatası 1/N faktörüyle sıfıra düşme eğilimi gösterir. Ancak değişkenler bağımsız değilse değişken daha büyük olur.

Makine öğreniminde topluluk, tahminlerinin ortalaması alınan (veya bir şekilde toplanan) modeller koleksiyonudur. Birim modelleri tek tek çok kötü olmadan yeterince farklıysa topluluğun kalitesi genellikle her bir modelin kalitesinden daha iyidir. Bir topluluk, tek bir modelden daha fazla eğitim ve çıkarım süresi gerektirir. Sonuçta, tek bir model yerine birden fazla model üzerinde eğitim ve çıkarım yapmanız gerekir.

Bir topluluğun en iyi şekilde çalışması için bağımsız modellerin bağımsız olması gerekir. Resim olarak, tamamen aynı modellerden 10 (yani bağımsız olmayan) oluşan bir topluluk, her bir modelden daha iyi değildir. Öte yandan, modelleri bağımsız hale getirmek, onları daha kötü hale getirmek anlamına gelebilir. Etkili birleştirme, modelin bağımsız modeli ile alt modellerinin kalitesi arasındaki dengeyi gerektirir.