أنواع الشروط

تركز هذه الوحدة على أنواع مختلفة من conditions المستخدمة لبناء أشجار القرار.

الشروط التي تتم محاذاتها مع المحور مقارنةً بالشروط المائلة

يتضمّن الحالة محاذاته ميزة واحدة فقط. يتضمن الحالة المائلة ميزات متعددة. على سبيل المثال، ما يلي هو شرط بمحاذاة المحور:

num_legs ≥ 2

بينما يكون ما يلي شرطًا مائلاً:

num_legs ≥ num_fingers

في كثير من الأحيان، يتم تدريب أشجار القرارات باستخدام شروط تتم محاذاتها مع المحور فقط. ومع ذلك، تكون الانقسامات المائلة أكثر قوة لأنها يمكن أن تعبر عن أنماط أكثر تعقيدًا. ينتج عن التقسيمات المائلة في بعض الأحيان نتائج أفضل على حساب تكاليف التدريب والاستنتاج الأعلى.

رمز YDF
في YDF، يتم تطبيق أشجار القرارات بشكل افتراضي باستخدام شرط محاذاة المحور. يمكنك تفعيل أشجار القرارات المائلة باستخدام المَعلمة split_axis="SPARSE_OBLIQUE".

شرط محاذاة المحور هو "num_legs >= 3". الشرط المائل هو
  "num_legs + weight * 5 >= 12".

الشكل 4. أمثلة على شرط بمحاذاة المحور وشرط مائل

 

يؤدي الرسم البياني للشرطين السابقَين إلى الفصل التالي بين مساحة الميزات:

رسم بياني للوزن مقابل عدد الأرجل. لا تتجاهل شرط محاذاة المحور الوزن، وبالتالي فهي مجرد خط عمودي. وتعرِض الحالة المائلة خطًا مائلاً سلبًا.

الشكل 5. فصل مساحة الميزات للشروط الواردة في الشكل 4

 

الشروط الثنائية مقابل الشروط غير الثنائية

يُطلق على الشروط التي لها نتيجتان محتملتان (على سبيل المثال، صواب أو خطأ) اسم الشروط الثنائية. يُطلق على أشجار القرارات التي تحتوي على شروط ثنائية فقط اسم أشجار القرارات الثنائية.

الشروط غير الثنائية لها أكثر من نتيجتين محتملتين. لذلك، فإن الشروط غير الثنائية لها قوة تمييزية أكثر من الحالات الثنائية. يُطلق على القرارات التي تتضمّن شرطًا واحدًا أو أكثر غير ثنائي اسم أشجار القرارات غير الثنائية.

يشير ذلك المصطلح إلى مقارنة بين أشجار القرارات الثنائية وغير الثنائية. تحتوي شجرة القرارات الثنائية على شرطَين ثنائيَين، بينما تحتوي شجرة القرارات غير الثنائية على شرط واحد غير ثنائي.

الشكل 6: أشجار القرارات الثنائية مقابل أشجار القرارات غير الثنائية.

 

من المرجح أيضًا أن تؤدي الظروف التي تحتوي على الكثير من الطاقة إلى فرط التوافق. ولهذا السبب، تستخدم غابات القرار بشكل عام أشجار القرارات الثنائية، لذلك ستركز هذه الدورة عليها.

النوع الأكثر شيوعًا للشرط هو شرط الحد الأدنى، ويتم التعبير عنه على النحو التالي:

featurethreshold

مثال:

num_legs ≥ 2

توجد أنواع أخرى من الشروط. فيما يلي أنواع أخرى شائعة الاستخدام من الشروط الثنائية:

 

الجدول 2. الأنواع الشائعة للحالات الثنائية

الاسم الشرط مثال
شرط الحدّ $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
شرط المساواة $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
حالة محدّدة $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``cat", ``كلب", ``طائر"\}$
شرط مائل $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
الميزة غير موجودة $\mathrm{feature}_i \mathrm{is} \mathrm {ّبضم}$ $\mathrm{num\_legs} \mathrm{is} \mathrm {فقدان}$