التعلّم الخاضع للإشراف

وتكون مهام التعلّم المُوجّه محددة جيدًا ويمكن تطبيقها على العديد من السيناريوهات، مثل تحديد المحتوى غير المرغوب فيه أو توقع هطول الأمطار.

مفاهيم التعلُّم الأساسي المُوجّه

يستند تعلُّم الآلة المراقَب إلى المفاهيم الأساسية التالية:

  • البيانات
  • النموذج
  • التدريب
  • التقييم
  • الاستنتاج

البيانات

البيانات هي القوة الدافعة لتعلُّم الآلة. تأتي البيانات في شكل كلمات وأرقام مخزنة في الجداول، أو كقيم وحدات البكسل والأشكال الموجية التي تم التقاطها في الصور والملفات الصوتية. نخزن البيانات ذات الصلة في مجموعات البيانات. على سبيل المثال، قد يكون لدينا مجموعة بيانات لما يلي:

  • صور قطط
  • أسعار المساكن
  • معلومات عن حالة الطقس

تتكون مجموعات البيانات من أمثلة فردية تحتوي على ميزات وتصنيف. يمكنك التفكير في مثال على أنه مشابه لصف واحد في جدول بيانات. الميزات هي القيم التي يستخدمها النموذج الخاضع للإشراف للتنبؤ بالتسمية. التسمية هي "الإجابة"، أو القيمة التي نريد أن يتنبأ بها النموذج. وفي نموذج الطقس الذي يتوقّع هطول الأمطار، قد تكون الخصائص خط العرض وخط الطول ودرجة الحرارة والرطوبة وتغطية السحب واتجاه الرياح والضغط الجوي. سيكون التصنيف مقدار هطول الأمطار.

تُعرف الأمثلة التي تحتوي على ميزات وتصنيف على أنها أمثلة مصنَّفة.

مثالان مصنفان

هذه الصورة هي عنصر نائب.

في المقابل، تحتوي الأمثلة غير المصنَّفة على ميزات، ولكن لا تحتوي على تصنيف. بعد إنشاء نموذج، يتنبأ النموذج بالتسمية من الميزات.

مثالان غير مصنفين

هذه الصورة هي عنصر نائب.

خصائص مجموعة البيانات

تتميز مجموعة البيانات بحجمها وتنوعها. يشير الحجم إلى عدد الأمثلة. يشير التنوع إلى النطاق الذي تغطيه هذه الأمثلة. مجموعات البيانات الجيدة كبيرة ومتنوعة للغاية.

بعض مجموعات البيانات كبيرة ومتنوعة. ومع ذلك، فإن بعض مجموعات البيانات كبيرة ولكنها ذات تنوع منخفض، وبعضها صغير ولكنه متنوع للغاية. بعبارة أخرى، لا تضمن مجموعة البيانات الكبيرة تنوعًا كافيًا، كما أن مجموعة البيانات المتنوعة للغاية لا تضمن أمثلة كافية.

على سبيل المثال، قد تحتوي مجموعة البيانات على 100 عام من البيانات، ولكن فقط لشهر يوليو. سيؤدي استخدام مجموعة البيانات هذه للتنبؤ بهطول الأمطار في يناير إلى توقع تنبؤات سيئة. وعلى العكس من ذلك، قد تغطي مجموعة البيانات بضع سنوات فقط ولكنها تحتوي على كل شهر. قد ينتج عن مجموعة البيانات هذه تنبؤات سيئة لأنها لا تحتوي على سنوات كافية لمراعاة التباين.

التحقّق من استيعابك

ما سمات مجموعة البيانات التي ستكون مثالية للاستخدام في التعلم الآلي؟
حجم كبير / تنوّع كبير
من الضروري توفّر عدد كبير من الأمثلة التي تتناول مجموعة متنوعة من حالات الاستخدام ليتمكّن نظام تعلُّم الآلة من فهم الأنماط الأساسية في البيانات. ومن المرجّح أن يقدّم النموذج المدرّب على هذا النوع من مجموعات البيانات توقّعات جيدة بشأن البيانات الجديدة.
حجم كبير / تنوّع منخفض
لا تقل جودة نماذج تعلُّم الآلة عن الأمثلة المستخدَمة لتدريبها. سينتج عن النموذج توقعات أسوأ على بيانات جديدة لم يتم التدريب عليها مطلقًا.
حجم صغير / تنوّع كبير
لا يمكن لمعظم النماذج العثور على أنماط موثوقة في مجموعة بيانات صغيرة. فستفتقر عبارات البحث المقترحة إلى الثقة التي تقدّمها مجموعة البيانات الأكبر.
حجم صغير / تنوّع منخفض
وإذا كانت مجموعة البيانات صغيرة ولا تتضمّن اختلافات كبيرة، قد لا تستفيد من تقنية تعلُّم الآلة.

يمكن أيضًا وصف مجموعة البيانات بعدد خصائصها. على سبيل المثال، قد تحتوي بعض مجموعات بيانات الطقس على مئات الميزات، بدءًا من صور الأقمار الصناعية إلى قيم تغطية السحابة. قد تحتوي مجموعات البيانات الأخرى على ثلاث أو أربع ميزات فقط، مثل الرطوبة والضغط الجوي ودرجة الحرارة. يمكن أن تساعد مجموعات البيانات التي تتضمن المزيد من الميزات النموذج في اكتشاف أنماط إضافية وإجراء تنبؤات أفضل. في المقابل، إنّ مجموعات البيانات التي تتضمّن المزيد من الميزات لا تنتج دائمًا نماذج تقدّم توقّعات أفضل، لأنّ بعض الميزات قد لا يكون لها علاقة سببية بالتصنيف.

النموذج

في التعلم المُوجّه، يكون النموذج عبارة عن مجموعة معقدة من الأرقام التي تحدد العلاقة الرياضية من أنماط ميزات إدخال محددة إلى قيم تصنيف إخراج محددة. ويكتشف النموذج هذه الأنماط من خلال التطبيق.

التدريب

قبل أن يتمكّن أي نموذج خاضع للإشراف من إجراء توقّعات، يجب تدريبه. لتدريب نموذج ما، نعطي النموذج مجموعة بيانات بأمثلة مصنفة. إن هدف النموذج هو إيجاد أفضل حل للتنبؤ بالتسميات من الميزات. يبحث النموذج عن أفضل حل من خلال مقارنة قيمته المتوقعة بالقيمة الفعلية للتصنيف. استنادًا إلى الفرق بين القيم المتوقّعة والفعلية، التي يتم تعريفها على أنّها الخسارة، يتم تعديل الحلّ تدريجيًا في النموذج. بعبارة أخرى، يتعلم النموذج العلاقة الرياضية بين الخصائص والتسمية بحيث يمكنه تقديم أفضل تنبؤات للبيانات غير المرئية.

على سبيل المثال، إذا توقّع النموذج تساقط الأمطار بـ 1.15 inches، لكن القيمة الفعلية كانت .75 inches، سيعدّل النموذج الحلّ ليصبح التوقّع أقرب إلى .75 inches. بعد أن ينظر النموذج إلى كل مثال في مجموعة البيانات - في بعض الحالات، عدة مرات - يصل إلى حل يقدم أفضل التوقعات، في المتوسط، لكل مثال من الأمثلة.

يوضح ما يلي تدريب نموذج:

  1. يستخدم النموذج مثالاً واحدًا مُصنَّفًا ويقدم توقعًا.

    صورة لنموذج يقدّم تنبؤًا.

    الشكل 1. يشير ذلك المصطلح إلى نموذج للتعلُّم الآلي يقدّم توقّعًا باستخدام مثال مصنّف.

     

  2. يقارن النموذج قيمته المتنبأ بها بالقيمة الفعلية ويتم تحديث الحلّ.

    صورة لنموذج تقارن تنبؤه بالقيمة الفعلية.

    الشكل 2. نموذج تعلُّم الآلة يعدّل القيمة المتوقّعة

     

  3. يكرر النموذج هذه العملية لكل مثال مصنف في مجموعة البيانات.

    يشير ذلك المصطلح إلى صورة لنموذج يكرِّر عملية توقُّعه مقارنةً بقيمته الفعلية.

    الشكل 3. يشير ذلك المصطلح إلى نموذج تعلُّم الآلة الذي يعدِّل توقّعاته لكل مثال مصنَّف في مجموعة بيانات التدريب.

     

بهذه الطريقة، يتعلّم النموذج تدريجيًا العلاقة الصحيحة بين الميزات والتسمية. هذا الفهم التدريجي هو أيضًا السبب في أن مجموعات البيانات الكبيرة والمتنوّعة تنتج نموذجًا أفضل. رأى النموذج المزيد من البيانات مع نطاق أوسع من القيم وحسّن فهمه للعلاقة بين الميزات والتسمية.

وأثناء التدريب، يمكن لممارسي تعلُّم الآلة إجراء تعديلات دقيقة على التكوينات والميزات التي يستخدمها النموذج لإجراء التنبؤات. على سبيل المثال، تمتلك بعض الميزات قوة تنبؤية أكثر من غيرها. لذلك، يمكن لممارسي تعلم الآلة تحديد الميزات التي يستخدمها النموذج أثناء التدريب. على سبيل المثال، لنفترض أن مجموعة بيانات الطقس تحتوي على time_of_day كميزة. في هذه الحالة، يمكن لممارس تكنولوجيا تعلُّم الآلة إضافة أو إزالة time_of_day أثناء التدريب لمعرفة ما إذا كان النموذج يقدّم توقّعات أفضل باستخدامه أو بدونه.

التقييم

نقوم بتقييم النموذج المدرَّب لتحديد مدى نجاحه في تعلمه. عندما نقيّم أي نموذج، نستخدم مجموعة بيانات مصنفة، لكننا لا نعطي سوى ميزات مجموعة البيانات للنموذج. ثم نقارن تنبؤات النموذج بالقيم الحقيقية للتصنيف.

يشير ذلك المصطلح إلى صورة توضّح نموذجًا مدرَّبًا يقدّم توقّعاته مقارنةً بالقيم الفعلية.

الشكل 4. تقييم نموذج تعلُّم الآلة من خلال مقارنة توقعاته بالقيم الفعلية

 

وبناءً على تنبؤات النموذج، قد نجري المزيد من التدريب والتقييم قبل نشر النموذج في التطبيق في العالم الحقيقي.

التحقّق من استيعابك

لماذا يحتاج النموذج إلى تدريب قبل أن يتمكن من إجراء تنبؤات؟
أي نموذج يحتاج إلى التدريب لتعلم العلاقة الرياضية بين الخصائص والتسمية في أي مجموعة بيانات.
لا يحتاج النموذج إلى تدريب. تتوفّر النماذج على معظم أجهزة الكمبيوتر.
يجب تدريب النموذج حتى لا يتطلب بيانات لإجراء تنبؤ.

الاستنتاج

بمجرد أن نرضى عن نتائج تقييم النموذج، يمكننا استخدام النموذج لعمل تنبؤات، تسمى الاستنتاجات، على الأمثلة غير المصنفة. في مثال تطبيق الطقس، سنعطي النموذج ظروف الطقس الحالية، مثل درجة الحرارة وضغط الهواء والرطوبة النسبية، وسيتنبأ بكمية هطول الأمطار.