الانحدار اللوجستي: احتساب الاحتمالية

يتطلب العديد من المشاكل تقدير الاحتمال كإخراج. التراجع اللوجستي هو آلية فعّالة جدًا لحساب الاحتمالات. عمليًا، يمكنك استخدام الاحتمالية المعروضة بأي من الطريقتين التاليتين:

  • "كما هي"
  • تم تحويلها إلى فئة ثنائية.

لنأخذ كيفية استخدام الاحتمالية "وكما هي" في "الاحتمالات". لنفترض أنّنا ننشئ نموذجًا للانحدار اللوجستي لتوقّع احتمالية نباح كلب في منتصف الليل. سنشير إلى ذلك الاحتمال:

\[p(bark | night)\]

إذا توقّع نموذج التراجع اللوجستي \(p(bark | night) = 0.05\)، على مدار عام، يجب أن يندهش مالكو الكلاب من اليقظة 18 مرة تقريبًا.

\[\begin{align} startled &= p(bark | night) \cdot nights \\ &= 0.05 \cdot 365 \\ &~= 18 \end{align} \]

في العديد من الحالات، عليك ربط مخرجات الانحدار اللوجستي بالحل لمشكلة التصنيف الثنائي، حيث يكون الهدف هو توقع أحد التصنيفين المحتملين بشكل صحيح (على سبيل المثال، "spam" أو &&;;;";الرسائل غير المرغوب فيها"). وتركّز الوحدة لاحقًا على ذلك.

قد تتساءل عن كيفية مساهمة نموذج التراجع اللوجستي في ضمان الإخراج الذي يقع دائمًا بين 0 و1. في هذه الحالة، تنتج الدالة الإستاذية، التي تظهر على النحو التالي، نتيجةً لها السمات نفسها:

$$y = \frac{1}{1 + e^{-z}}$$

تؤدي الدالة السينية إلى الرسم البياني التالي:

دالة Sigmoid المحور س هو قيمة الاستنتاج الأولي. ويمتد المحور ص من 0 إلى +1، بشكل حصري.

الشكل 1: دالة Sigmoid.

إذا كانت \(z\) تمثّل مخرجات الطبقة الخطية في نموذج تم تدريبه على الانحدار اللوجستي، \(sigmoid(z)\) سيؤدي ذلك إلى قيمة (احتمالية) بين 0 و1. من حيث الرياضيات:

$$y' = \frac{1}{1 + e^{-z}}$$

المكان:

  • \(y'\) هي مخرجات نموذج التراجع اللوجستي لمثال معيّن.
  • \(z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N\)
    • تُعد القيم \(w\) الأوزان المستخرَجة للنموذج's، و \(b\) هو الانحياز.
    • قيم \(x\) هي قيم الميزة لمثال معين.

تجدر الإشارة إلى أن \(z\) يُشار إليه أيضًا باسم log-odds لأنّ المعكوس الذي يُحدَّد \(z\) بأنّه سجلّ لاحتمالية \(1\) التصنيف (مثل، "dog Bark") مقسومة على احتمالية \(0\)التصنيف (مثل، "dog do't Bark"):

$$ z = \log\left(\frac{y}{1-y}\right) $$

في ما يلي الدالة الدالّية مع تصنيفات تعلُّم الآلة:

الدالة "Sigmoid" هي المحور "س" المصنّفة باعتبارها مجموع كل الأوزان والميزات (بالإضافة إلى الانحياز)، بينما يُصنَّف المحور "ص" كإخراج احتمالي.

الشكل 2: نتائج التراجع اللوجستي.