اختبار الفهم

تساعدك الأسئلة التالية في ترسيخ فهمك للمفاهيم الأساسية لتعلُّم الآلة.

قوة التوقّع

يتم تدريب نماذج تعلُّم الآلة الخاضعة للإشراف باستخدام مجموعات بيانات تتضمّن أمثلة مصنّفة. يتعلم النموذج كيفية التنبؤ بالتسمية من الميزات. ومع ذلك، ليس لكل ميزة في مجموعة البيانات قوة تنبؤية. في بعض الحالات، تعمل بعض الميزات فقط كتنبؤات للتسمية. في مجموعة البيانات أدناه، استخدم السعر كتسمية والأعمدة المتبقية كميزات.

مثال مصنّف لسمات السيارات.

ما الميزات الثلاث التي تعتقد أنها من المرجح أن تكون أكبر المتنبئات لسعر السيارة؟
Make_model، السنة، الأميال.
من المرجح أن تكون ماركة/طراز السيارة وسنة وميلها من بين أقوى مؤشرات سعرها.
اللون والارتفاع وmake_model.
لا يعتبر ارتفاع السيارة ولونها مؤشرين قويين لسعر السيارة.
الأميال، صندوق التروس، make_model.
صندوق التروس ليس مؤشرًا رئيسيًا للسعر.
Tire_size، wheel_base، السنة.
لا يعتبر حجم الإطار وقاعدة العجلات مؤثرين قويين لسعر السيارة.

التعلّم المُوجّه وغير المُوجّه

بناءً على المشكلة، ستستخدم نهجًا خاضعًا للإشراف أو غير خاضع للإشراف. فعلى سبيل المثال، إذا كنت تعرف مسبقًا القيمة أو الفئة التي تريد التنبؤ بها، فيمكنك استخدام التعلم المُوجّه. ومع ذلك، إذا أردت معرفة ما إذا كانت مجموعة بياناتك تحتوي على أي تصنيفات أو مجموعات من الأمثلة ذات الصلة، فننصحك باستخدام التعلم غير المُوجّه.

افترض أن لديك مجموعة بيانات من المستخدمين لأحد مواقع التسوق عبر الإنترنت، وكانت تحتوي على الأعمدة التالية:

صورة لصف من سمات العملاء

إذا كنت تريد معرفة أنواع المستخدمين الذين يزورون الموقع الإلكتروني، هل ستستخدم التعلم المُوجّه أم غير المُوجّه؟
التعلّم غير المُوجّه
وبما أنّنا نريد أن يجمّع النموذج مجموعات من العملاء ذوي الصلة، سنستخدم التعلم غير المُوجّه. بعد أن يجمّع النموذج المستخدمين، ننشئ أسماءنا الخاصة لكل مجموعة، على سبيل المثال "الباحثون عن خصومات" و"صائدو الصفقات" و"راكبو الأمواج" و"الأوفياء" و"المتجوّلون".
التعلُّم الخاضع للإشراف لأنّني أحاول توقّع الفئة التي ينتمي إليها المستخدم.
في التعلّم الخاضع للإشراف، يجب أن تحتوي مجموعة البيانات على التصنيف الذي تحاول توقُّعه. ولا يتوفر تصنيف في مجموعة البيانات يشير إلى فئة من المستخدمين.

افترض أن لديك مجموعة بيانات استخدام الطاقة للمنازل ذات الأعمدة التالية:

صورة لصف من سمات المنزل.

ما هو نوع تقنية تعلُّم الآلة الذي ستستخدمه لتوقّع وحدات الكيلوواط ساعة المستخدَمة سنويًا لمنزل تم بناؤه حديثًا؟
التعلُّم الخاضع للإشراف
يتدرب التعلم المُوجّه على أمثلة مصنفة. في مجموعة البيانات هذه، سيكون "الكيلوواط ساعة المستخدَمة في السنة" تصنيفًا لأنّ هذه هي القيمة التي تريد أن يتوقّعها النموذج. وتكون تلك الميزات على شكل "مساحات مربعة" و"الموقع الجغرافي" و"سنة الإنشاء".
التعلّم غير المُوجّه
يستخدم التعلم غير المُوجه أمثلة غير مُصنفة. في هذا المثال، سيكون "الكيلوواط ساعة المستخدَمة في السنة" التصنيف لأنّ هذه هي القيمة التي تريد أن يتوقّعها النموذج.

افترض أن لديك مجموعة بيانات رحلة تحتوي على الأعمدة التالية:

صورة لصف من بيانات الرحلات الجوية.

إذا أردت التنبؤ بتكلفة تذكرة المدرب، هل ستستخدم الانحدار أم التصنيف؟
الانحدار
ناتج نموذج الانحدار هو قيمة رقمية.
التصنيف
ناتج نموذج التصنيف هو قيمة منفصلة تكون في العادة كلمة. في هذه الحالة، تكون تكلفة تذكرة الحافلة قيمة رقمية.
استنادًا إلى مجموعة البيانات، هل يمكنك تدريب نموذج تصنيف لتصنيف تكلفة تذكرة المدرب على أنها "عالية" أو "متوسطة" أو "منخفضة"؟
نعم، ولكننا نحتاج أولاً إلى تحويل القيم الرقمية في العمود coach_ticket_cost إلى قيم فئوية.
من الممكن إنشاء نموذج تصنيف من مجموعة البيانات. يمكنك تنفيذ إجراء مثل ما يلي:
  1. ابحث عن متوسط تكلفة التذكرة من مطار المغادرة إلى مطار الوجهة.
  2. حدِّد الحدود التي يمكن أن تشكّل "مرتفعة" و"متوسطة" و "منخفضة".
  3. قارِن التكلفة المتوقّعة بالحدود الدنيا ومخرجات الفئة التي تندرج تحتها القيمة.
لا، لا يمكن إنشاء نموذج تصنيف. يجب أن تكون قيم coach_ticket_cost رقمية وليست فئوية.
مع قدر قليل من العمل، يمكنك إنشاء نموذج تصنيف.
لا، لا تتوقّع نماذج التصنيف سوى فئتَين، مثل spam أو not_spam. سيحتاج هذا النموذج إلى التنبؤ بثلاث فئات.
ويمكن لنماذج التصنيف التنبؤ بعدة فئات. ويُطلق عليها نماذج التصنيف متعددة الفئات.

التدريب والتقييم

بعد تطبيق نموذج، نقيّمه باستخدام مجموعة بيانات تحتوي على أمثلة مصنفة ونقارن القيمة المتوقعة للنموذج بالقيمة الفعلية للتصنيف.

اختر أفضل إجابتين للسؤال.

إذا كانت تنبؤات النموذج بعيدة، فما الذي يمكنك فعله لتحسينها؟
أعد تدريب النموذج، ولكن استخدم فقط الميزات التي تعتقد أنها لديها أقوى قوة تنبؤية للتصنيف.
فإعادة تدريب النموذج باستخدام ميزات أقل، ولكن لديها قدر أكبر من القدرة التنبؤية، يمكن أن ينتج عنه نموذج يقدم تنبؤات أفضل.
لا يمكنك إصلاح نموذج يكون تنبؤاته بعيدة المنال.
من الممكن إصلاح نموذج تكون تنبؤاته غير مفعّلة، علمًا بأنّ معظم النماذج تتطلب جولات متعددة من التدريب حتى تقدِّم تنبؤات مفيدة.
أعد تدريب النموذج باستخدام مجموعة بيانات أكبر وأكثر تنوعًا.
يمكن للنماذج المدرَّبة على مجموعات البيانات التي تحتوي على المزيد من الأمثلة ومجموعة أكبر من القيم أن ينتج عنها تنبؤات أفضل لأن النموذج يحتوي على حل معمم أفضل للعلاقة بين الميزات والتصنيف.
جرّب منهجًا مختلفًا للتدريب. على سبيل المثال، إذا استخدمت منهجًا خاضعًا للإشراف، جرِّب اتّباع نهج غير خاضع للإشراف.
نهج التدريب المختلف لن يؤدي إلى تنبؤات أفضل.

أنت الآن جاهز لاتخاذ الخطوة التالية في رحلتك في تعلُّم الآلة: