קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
יעילות יערות ההחלטות גבוהה במיוחד כשיש לכם מערך נתונים בטבלה (נתונים שאפשר לייצג בגיליון אלקטרוני, בקובץ CSV או בטבלת מסד נתונים). נתונים בטבלאות הם אחד מהפורמטים הנפוצים ביותר, ויערות החלטות הם הפתרון המומלץ ליצירת מודלים שלהם.
טבלה 1. דוגמה למערך נתונים בטבלה.
מספר השלבים
מספר העיניים
משקל (פאונד)
זן (תווית)
2
2
12
פינגווין
8
6
0.1
עכביש
4
2
44
כלב
…
…
…
…
בניגוד לרשתות נוירונים, יערות החלטות צורכים באופן מקורי נתונים טבלאיים של מודלים.
כשמפתחים יערות החלטות, אין צורך לבצע משימות כמו:
ביצוע עיבוד מקדים, כמו נורמליזציה של מאפיינים או קידוד one-hot.
ביצוע הטמעה (למשל, החלפת ערך חסר ב--1).
עם זאת, יערות החלטות לא מתאימים לשימוש ישיר בנתונים לא טבלאיים (שנקראים גם נתונים לא מובְנים), כמו תמונות או טקסט. כן, יש דרכים לעקוף את המגבלה הזו, אבל בדרך כלל רשתות נוירונליות מטפלות טוב יותר בנתונים לא מובְנים.
ביצועים
יעילות הדגימה של יערות החלטות גבוהה. כלומר, יערות החלטות מתאימים לאימון על מערכי נתונים קטנים, או על מערכי נתונים שבהם היחס בין מספר המאפיינים למספר הדוגמאות גבוה (יכול להיות שהוא גבוה מ-1). למרות שיעילות הדגימה של יערות החלטות גבוהה, כמו בכל המודלים של למידת מכונה, הביצועים של יערות החלטות הכי טובים כשיש הרבה נתונים זמינים.
בדרך כלל, יער החלטות מסיק מהר יותר מרשתות עצביות דומות. לדוגמה, יער החלטות בגודל בינוני מפעיל את היסק הנתונים בתוך כמה מיקרו-שניות במעבד (CPU) מודרני.
[[["התוכן קל להבנה","easyToUnderstand","thumb-up"],["התוכן עזר לי לפתור בעיה","solvedMyProblem","thumb-up"],["סיבה אחרת","otherUp","thumb-up"]],[["חסרים לי מידע או פרטים","missingTheInformationINeed","thumb-down"],["התוכן מורכב מדי או עם יותר מדי שלבים","tooComplicatedTooManySteps","thumb-down"],["התוכן לא עדכני","outOfDate","thumb-down"],["בעיה בתרגום","translationIssue","thumb-down"],["בעיה בדוגמאות/בקוד","samplesCodeIssue","thumb-down"],["סיבה אחרת","otherDown","thumb-down"]],["עדכון אחרון: 2025-02-25 (שעון UTC)."],[[["Decision forests are highly effective for modeling tabular data, making them a primary choice for datasets commonly found in spreadsheets, CSV files, or databases."],["Unlike neural networks, decision forests directly handle tabular data without requiring preprocessing steps like feature normalization or imputation."],["While decision forests can be adapted for non-tabular data like images or text, neural networks are generally better suited for such data types."],["Decision forests are sample efficient, performing well even with small datasets or those with a high feature-to-example ratio, but still benefit from larger datasets."],["Decision forests offer faster inference speeds compared to neural networks, typically completing predictions within microseconds on modern CPUs."]]],[]]