יער אקראי

זהו אוקס.

תצלום ישן של שועל.

איור 19. שור.

 

בשנת 1906 נערכה באנגליה תחרות תחרות משקל. 787 משתתפים ניחשו את המשקל של שור. השגיאה החציונית של הניסוי בהשוואה ליחידים הייתה 18 ק"ג (שגיאה של 3.1%). עם זאת, החציון הכולל של הניחושים היה במרחק של 3 ק"ג בלבד מהמשקל בפועל של השור (1,198 פאונד), כלומר שגיאה של 0.7% בלבד.

היסטוגרמה של ניחושים, המציגה את רוב הניחושים המקיפים את המשקל בפועל של השור.

איור 20. היסטוגרמה של ניחושים בודדים.

 

האנקדוטה הזו מדגימה את חוכמת הקהל: במצבים מסוימים, הדעה הקולקטיבית מספקת שיקול דעת טוב מאוד.

החישוב המתמטי של חוכמה של הקהל ניתן למודלים באמצעות משפט הגבול המרכזי: באופן לא רשמי, השגיאה המרובעת בין ערך לבין הממוצע של N אומדנים רועשים נוטה לאפס עם גורם 1/N. עם זאת, אם המשתנים אינם עצמאיים, השונות גדולה יותר.

בלמידה חישובית, מבנה הוא אוסף של מודלים שהממוצעים שלהם מחושבים (או נצברים בצורה מסוימת). אם המודלים של המכשירים שונים מספיק בלי שיהיו ספציפיים מדי, איכות השילוב תהיה בדרך כלל טובה יותר מהאיכות של כל אחד מהדגמים. כדי להטמיע מתחם, צריך להשקיע זמן רב יותר בהדרכה ובמסקנות מאשר במודל יחיד. אחרי הכול, אתם צריכים לבצע הדרכה והסקת מסקנות לגבי מספר מודלים, במקום מודל אחד.

באופן רשמי, כדי שמתחם כלשהו יפעל בצורה הטובה ביותר, המודלים הנפרדים צריכים להיות עצמאיים. בתור איור, מתחם המורכב מ-10 מודלים זהים (כלומר, בלתי תלוי בכלל) לא יהיה טוב יותר מהמודל הספציפי. מצד שני, כפייה של מודלים עצמאיים יכולה להיות גם גרוע יותר. כדי שהמודל יהיה אפקטיבי, צריך למצוא את האיזון בין העצמאות של מודל המודל לבין האיכות של מודלי המשנה.