تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
التقييم خارج العلبة
لا تتطلّب الغابات العشوائية مجموعة بيانات للتحقّق من الصحة. تستخدِم معظم الغابات العشوائية تقنية تُعرَف باسم التقييم خارج الحقيبة (تقييمخارج الحقيبة) لتقييم
جودة النموذج. يتعامل تقييم البيانات خارج النطاق مع مجموعة التدريب كما لو كانت
في مجموعة اختبار التحقق التبادلي.
كما هو موضّح سابقًا، يتم عادةً تدريب كل شجرة قرارات في الغابة العشوائية
على% 67 تقريبًا من أمثلة التدريب. وبالتالي، لا ترى كل شجرة قرارات% 33 تقريبًا من أمثلة التدريب. في ما يلي الفكرة الأساسية للتقييم خارج النطاق:
لتقييم الغابة العشوائية في مجموعة التدريب
لكل مثال، استخدِم فقط أشجار القرارات التي لم تَظهر لها المثال
أثناء التدريب.
يوضِّح الجدول التالي تقييمًا خارج النطاق لحديقة عشوائية تتضمّن 3
أشجار قرارات تم تدريبها على 6 أمثلة. (نعم، هذا هو الجدول نفسه الوارد في
قسم "التجميع"). يعرض الجدول شجرة القرار التي يتم استخدامها مع
المثال أثناء التقييم خارج النطاق.
الجدول 7: تقييم خارج النطاق: تمثل الأرقام عدد المرات التي يتم فيها استخدام مثال تدريبي معيّن أثناء تدريب المثال المعيّن.
أمثلة على التدريب
أمثلة على التقييم خارج النطاق
#1
#2
#3
#4
#5
#6
مجموعة البيانات الأصلية
1
1
1
1
1
1
شجرة القرار 1
1
1
0
2
1
1
#3
شجرة القرار 2
3
0
1
0
2
0
#2 و#4 و #6
شجرة القرار 3
0
1
3
1
0
1
رقم 1 ورقم 5
في المثال الموضّح في الجدول 7، سيتم احتساب التوقّعات خارج النطاق لمثال التدريب 1
باستخدام شجرة القرار رقم 3 (لأنّ شجرتا القرار رقم 1 و2 استخدمتا
هذا المثال للتدريب). في الممارسة العملية، في مجموعة بيانات ذات حجم معقول وباستخدام بضع أشجار قرارات، تتضمّن جميع الأمثلة توقّعات خارج النطاق.
رمز YDF
في YDF، يتوفّر تقييم الأداء خارج النطاق في سجلّات التدريب إذا تم تدريب النموذج باستخدام compute_oob_performances=True.
يُعدّ تقييم خارج النطاق فعّالاً أيضًا لاحتساب أهمية متغيّر التبادل ل نماذج الغابة العشوائية. من أهمية المتغيّرات، تذكَّر أنّ
أهمية متغيّر الترتيب العشوائي تقيس أهمية متغيّر من خلال
قياس انخفاض جودة النموذج عند ترتيب هذا المتغيّر عشوائيًا. "أهمية متغيّر الترتيب العشوائي خارج النطاق (OOB)" في الغابة العشوائية هي أهمية متغيّر الترتيب العشوائي يتم احتسابها باستخدام التقييم خارج النطاق.
رمز YDF
في YDF، تتوفّر أهميّات متغيّرات الترتيب العشوائي خارج النطاق في سجلّات
التدريب إذا تم تدريب النموذج باستخدام
compute_oob_variable_importances=True.
تاريخ التعديل الأخير: 2025-02-25 (حسب التوقيت العالمي المتفَّق عليه)
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],["تاريخ التعديل الأخير: 2025-02-25 (حسب التوقيت العالمي المتفَّق عليه)"],[[["Random forests utilize out-of-bag (OOB) evaluation, eliminating the need for a separate validation dataset by treating the training set as a test set in a cross-validation-like approach."],["OOB evaluation leverages the fact that each decision tree in the forest is trained on approximately 67% of the training data, allowing the remaining 33% to be used for evaluation, similar to a test set."],["During OOB evaluation, predictions for a specific example are generated using only the decision trees that did not include that example in their training process."],["YDF provides access to OOB evaluation metrics and OOB permutation variable importances within the training logs, offering insights into model performance and feature relevance."]]],[]]