الانحدار الخطي: أسلوب التدرّج المتّجه

النزول التدريجي هو أسلوب رياضي يحدّد بشكل متكرّر القيمتين الأفضل للوزن والانحياز اللذين يؤديان إلى إنشاء نموذج بأقل خسارة. تجد طريقة "النزول التدريجي" أفضل وزن وانحياز من خلال تكرار العملية التالية لعدد من التكرارات التي يحدّدها المستخدم.

يبدأ النموذج التدريب بأوزان وتحيزات عشوائية قريبة من الصفر، ثم يكرّر الخطوات التالية:

  1. احسب مقدار الخسارة باستخدام الوزن والانحياز الحاليين.

  2. تحديد الاتجاه الذي يجب تحريك الأوزان والانحيازات فيه لتقليل الخسارة

  3. نقل قيم الوزن والانحياز بمقدار صغير في الاتجاه الذي يقلل من الخسارة

  4. ارجع إلى الخطوة الأولى وكرِّر العملية إلى أن يتعذّر على النموذج تقليل الخسارة أكثر من ذلك.

يوضّح الرسم البياني أدناه الخطوات التكرارية التي تنفّذها طريقة "النزول التدريجي" للعثور على الأوزان والانحياز اللذين ينتجان النموذج بأقل خسارة.

الشكل 11. صورة توضيحية لعملية النزول التدرّجي

الشكل 11 النزول التدرّجي هو عملية تكرارية للعثور على الأوزان والانحياز اللذين ينتجان النموذج بأقل خسارة.

تقارب النماذج ومنحنيات الخسارة

عند تدريب نموذج، ستنظر غالبًا إلى منحنى الخسارة لتحديد ما إذا كان النموذج قد تقارب. يعرض منحنى الخسارة كيفية تغيُّر الخسارة أثناء تدريب النموذج. في ما يلي شكل منحنى الخسارة النموذجي. يظهر معدّل الخطأ على المحور الصادي والتكرارات على المحور السيني:

الشكل 12: رسم بياني لمنحنى الخسارة يوضّح انخفاضًا حادًا ثم انخفاضًا طفيفًا.

الشكل 12 منحنى الخسارة الذي يعرض النموذج الذي يتقارب حول علامة التكرار الألف.

يمكنك ملاحظة أنّ الخسارة تنخفض بشكل كبير خلال التكرارات القليلة الأولى، ثم تنخفض تدريجيًا قبل أن تستقر عند التكرار رقم 1,000 تقريبًا. بعد 1,000 تكرار، يمكننا التأكّد بشكل كبير من أنّ النموذج قد تقارب.

في الأشكال التالية، نرسم النموذج في ثلاث نقاط خلال عملية التدريب: البداية والمنتصف والنهاية. يؤدي عرض حالة النموذج في لقطات أثناء عملية التدريب إلى تعزيز العلاقة بين تعديل الأوزان والتحيّز وتقليل الخسارة وتقارب النموذج.

في الأشكال، نستخدم الأوزان والانحياز المشتقَّين في تكرار معيّن لتمثيل النموذج. في الرسم البياني الذي يتضمّن نقاط البيانات ولقطة النموذج، تعرض خطوط الفقدان الزرقاء من النموذج إلى نقاط البيانات مقدار الفقدان. وكلما طالت الخطوط، زادت الخسارة.

في الشكل التالي، نلاحظ أنّه في التكرار الثاني تقريبًا، لن يكون النموذج جيدًا في تقديم التوقعات بسبب ارتفاع مقدار الخسارة.

الشكل 13. منحنى الخسارة والرسم البياني المقابل للنموذج، والذي يميل بعيدًا عن نقاط البيانات

الشكل 13 رسم بياني لفقدان البيانات ولقطة للنموذج في بداية عملية التدريب

في التكرار رقم 400 تقريبًا، نلاحظ أنّ طريقة "النزول التدريجي" قد عثرت على الوزن والانحياز اللذين ينتجان نموذجًا أفضل.

الشكل 14 منحنى الخسارة والرسم البياني المقابل للنموذج، والذي يمر بنقاط البيانات ولكن ليس بالزاوية المثالية

الشكل 14 منحنى الخسارة ولقطة للنموذج في منتصف عملية التدريب تقريبًا

وبعد حوالي 1,000 تكرار، نلاحظ أنّ النموذج قد تقارب، ما أدّى إلى إنشاء نموذج بأقل خسارة ممكنة.

الشكل 15 منحنى الخسارة والرسم البياني المقابل للنموذج الذي يتوافق مع البيانات بشكل جيد

الشكل 15 منحنى الخسارة ولقطة للنموذج بالقرب من نهاية عملية التدريب

تمرين: التحقّق من فهمك

ما هو دور نزول تدرّجي في الانحدار الخطي؟
انحدار التدرّج هو عملية تكرارية تعثر على أفضل قيم للأوزان والانحياز تؤدي إلى تقليل الخسارة.
تساعد عملية "النزول التدريجي" في تحديد نوع الخسارة التي يجب استخدامها عند تدريب نموذج، مثل L1 أو L2.
لا يتم استخدام طريقة "النزول التدريجي" في اختيار دالة الخسارة لتدريب النموذج.
تزيل طريقة "النزول التدريجي" القيم الشاذة من مجموعة البيانات لمساعدة النموذج في تقديم توقّعات أفضل.
لا تغيّر طريقة "النزول التدريجي" مجموعة البيانات.

التقارب والدوال المحدّبة

تنتج دوال الخسارة للنماذج الخطية دائمًا سطحًا محدبًا. نتيجةً لهذه السمة، عندما يتقارب نموذج الانحدار الخطي، نعلم أنّ النموذج قد وجد الأوزان والانحياز اللذين يؤديان إلى أقل خسارة.

إذا رسمنا بيانيًا سطح دالة الخسارة لنموذج يتضمّن ميزة واحدة، يمكننا ملاحظة شكله المحدّب. في ما يلي سطح الخسارة لمجموعة بيانات افتراضية حول عدد الأميال المقطوعة لكل غالون. الوزن على المحور السيني، والانحياز على المحور الصادي، والخسارة على المحور العيني:

الشكل 16. رسم بياني ثلاثي الأبعاد لسطح الدالة الهدف.

الشكل 16. سطح الخسارة الذي يعرض شكله المحدّب

في هذا المثال، يؤدي وزن -5.44 وانحياز 35.94 إلى أقل خسارة عند 5.54:

الشكل 17 رسم بياني ثلاثي الأبعاد لسطح الخسارة، مع النقطة (-5.44, 35.94, 5.54) في الأسفل

الشكل 17 رسم بياني لسطح الدالة الهدف يعرض قيم الأوزان والانحياز التي تؤدي إلى أقل خسارة

يتقارب النموذج الخطي عندما يعثر على الحد الأدنى من الخسارة. إذا رسمنا بيانيًا للأوزان ونقاط الانحياز أثناء عملية نزول التدرّج، ستبدو النقاط وكأنّها كرة تتدحرج نزولاً من تلّ، وتتوقف أخيرًا عند النقطة التي لا يوجد فيها المزيد من المنحدرات.

الشكل 18 سطح خسارة ثلاثي الأبعاد محدّب مع نقاط نزول تدرّجي تتحرّك إلى أدنى نقطة

الشكل 18 رسم بياني للخسارة يعرض نقاط نزول التدرّج التي تتوقف عند أدنى نقطة في الرسم البياني

لاحظ أنّ نقاط الخسارة السوداء تشكّل الشكل الدقيق لمنحنى الخسارة: انخفاض حاد قبل أن ينحدر تدريجيًا إلى أن يصل إلى أدنى نقطة على سطح الخسارة.

باستخدام قيمتَي الوزن والانحياز اللتين تؤديان إلى أقل خسارة، أي وزن يبلغ ‎-5.44 وانحياز يبلغ ‎35.94 في هذه الحالة، يمكننا رسم النموذج بيانيًا لمعرفة مدى ملاءمته للبيانات:

الشكل 19 رسم بياني يوضّح العلاقة بين وزن السيارة بالكيلوغرامات مقسومًا على 1000 وعدد الكيلومترات المقطوعة لكل غالون، مع تطابق النموذج مع البيانات

الشكل 19. النموذج الذي تم رسمه بيانيًا باستخدام قيم الوزن والانحياز التي تؤدي إلى أقل خسارة

سيكون هذا هو النموذج الأفضل لمجموعة البيانات هذه لأنّه لا توجد قيم أخرى للأوزان والانحياز تنتج نموذجًا بأقل خسارة.