تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

التصنيف: الدقة والتذكر والدقة والمقاييس ذات الصلة

وتُستخدَم القيم الموجبة والسالبة الصحيحة والخاطئة لاحتساب عدة مقاييس مفيدة لتقييم النماذج. تعتمد مقاييس التقييم الأكثر أهمية على النموذج المحدّد والمهمّة المحدّدة، وتكلفة الأخطاء المختلفة في التصنيف، وما إذا كانت مجموعة البيانات متوازنة أم غير متوازنة.

يتم احتساب جميع المقاييس في هذا القسم عند حدّ ثابت واحد، ويتغيّر ذلك عند تغيُّر الحدّ. في كثير من الأحيان، يعدّل المستخدِم الحدّ الأدنى لتحسين أحد هذه المقاييس.

الدقة

الدقة هي نسبة كل التصنيفات الصحيحة، سواء كانت إيجابية أو سلبية. ويتم تعريفه mathemathically على النحو التالي:

\[\text{Accuracy} = \frac{\text{correct classifications}}{\text{total classifications}} = \frac{TP+TN}{TP+TN+FP+FN}\]

في مثال تصنيف الرسائل غير المرغوب فيها، تقيس الدقة النسبة المئوية لجميع الرسائل الإلكترونية التي تم تصنيفها بشكل صحيح.

سيتضمّن النموذج المثالي صفر حالات إيجابية خاطئة وصفر حالات سلبية خاطئة، وبالتالي دقة تبلغ 1.0 أو %100.

ولأنّها تدمج جميع النتائج الأربعة من مصفوفة الالتباس (TP وFP وTN وFN)، في حال توفّر مجموعة بيانات متوازنة، مع أعداد مماثلة من الأمثلة في كلا الفئتَين، يمكن أن تُستخدم الدقة كقياس دقيق لجودة النموذج. لهذا السبب، غالبًا ما يكون مقياس التقييم التلقائي المستخدَم للنماذج العامة أو غير المحدّدة التي تُنفّذ مهام عامة أو غير محدّدة.

ومع ذلك، عندما تكون مجموعة البيانات غير متوازنة، أو عندما يكون نوع واحد من الأخطاء (خطأ النوع الثاني أو خطأ النوع الأول) أكثر تكلفة من الآخر، وهو ما هو عليه الحال في معظم التطبيقات في العالم الواقعي، من الأفضل تحسين أحد المقاييس الأخرى بدلاً من ذلك.

بالنسبة إلى مجموعات البيانات غير المتوازنة بشكل كبير، حيث تظهر فئة واحدة نادرًا جدًا، على سبيل المثال% 1 من الوقت، سيحصل النموذج الذي يتنبأ بنتائج سلبية بنسبة% 100 من الوقت على تقييم% 99 من الدقة، على الرغم من أنّه غير مفيد.

نسبة التذكر أو نسبة الموجب الصحيح

يُعرف معدل الموجب الصحيح (TPR)، أو نسبة جميع النتائج الموجبة الفعلية التي تم تصنيفها بشكل صحيح على أنّها موجبة، أيضًا باسم التذكر.

يتم تعريف دقة التذكر رياضيًا على النحو التالي:

\[\text{Recall (or TPR)} = \frac{\text{correctly classified actual positives}}{\text{all actual positives}} = \frac{TP}{TP+FN}\]

الحالات السالبة الخاطئة هي حالات موجبة فعلية تم تصنيفها بشكل خاطئ على أنّها سالبة، وهو سبب ظهورها في المقام. في مثال تصنيف الرسائل غير المرغوب فيها، يقيس الالتقاط النسبة المئوية للرسائل الإلكترونية غير المرغوب فيها التي تم تصنيفها بشكل صحيح على أنّها غير مرغوب فيها. لهذا السبب، يُعرف المعدل أيضًا باسم احتمالية رصد الرسائل غير المرغوب فيها: فهو يجيب عن السؤال "ما هو الجزء من الرسائل الإلكترونية غير المرغوب فيها الذي يرصده هذا النموذج؟"

لن يتضمّن النموذج المثالي الافتراضي أي نتائج خاطئة سلبية، وبالتالي سيكون له قياس تذكر (TPR) يساوي 1.0، أي نسبة رصد تبلغ% 100.

في مجموعة بيانات غير متوازنة يكون فيها عدد القيم الإيجابية الفعلية منخفضًا جدًا، يكون مقياس الاسترجاع أكثر فائدة من الدقة لأنّه يقيس قدرة النموذج على تحديد جميع القيم الإيجابية بشكل صحيح. بالنسبة إلى التطبيقات، مثل توقّع الأمراض، من المهم تحديد الحالات الإيجابية بشكل صحيح. عادةً ما يكون للنتيجة السلبية الخاطئة عواقب أكثر خطورة مقارنةً بالنتيجة الإيجابية الخاطئة. للحصول على مثال محدّد يقارن بين مقياسَي التذكر والدقة، اطّلِع على الملاحظات الواردة في تعريف التذكر.

معدل الموجب الخاطئ

معدل الموجب الخاطئ (FPR) هو نسبة جميع القيم السالبة الفعلية التي تم تصنيفها بشكل غير صحيح على أنّها موجبة، ويُعرف أيضًا باسم احتمالية الإنذار الخاطئ. ويتم تعريفه mathemathically على النحو التالي:

\[\text{FPR} = \frac{\text{incorrectly classified actual negatives}} {\text{all actual negatives}} = \frac{FP}{FP+TN}\]

الحالات الموجبة الخاطئة هي حالات سلبية فعلية تم تصنيفها بشكل خاطئ، ولهذا السبب تظهر في المقام. في مثال تصنيف الرسائل غير المرغوب فيها، يقيس مقياس FPR النسبة المئوية للرسائل الإلكترونية المشروعة التي تم تصنيفها بشكل غير صحيح على أنّها رسائل غير مرغوب فيها، أو نسبة الإنذارات الخاطئة في النموذج.

سيتضمّن النموذج المثالي صفر نتائج إيجابية خاطئة، وبالتالي سيكون معدّل الخطأ الإيجابي 0.0، أي أنّ معدّل الإنذارات الخاطئة سيكون 0%.

في مجموعة بيانات غير متوازنة يكون فيها عدد القيم السالبة الفعلية منخفضًا جدًا، أي من مثال إلى مثالَين في المجمل، يكون مقياس معدّل الخطأ الموجب أقلّ فائدةً كمقياس.

الدقة

الدقة هي نسبة جميع التصنيفات الموجبة للنموذج التي تكون موجبة فعليًا. ويتم تعريفه رياضيًا على النحو التالي:

\[\text{Precision} = \frac{\text{correctly classified actual positives}} {\text{everything classified as positive}} = \frac{TP}{TP+FP}\]

في مثال تصنيف الرسائل غير المرغوب فيها، تقيس الدقة النسبة المئوية للرسائل الإلكترونية التي تم تصنيفها كرسائل غير مرغوب فيها وكانت في الواقع رسائل غير مرغوب فيها.

لن يتضمّن النموذج المثالي الافتراضي أي نتائج إيجابية خاطئة، وبالتالي سيكون قياس دقة النموذج هو 1.0.

في مجموعة بيانات غير متوازنة يكون فيها عدد القيم الموجبة الفعلية منخفضًا جدًا، أي من مثال إلى مثالَين في المجمل، تكون الدقة أقل أهمية وأقل فائدة بصفتها مقياسًا.

تتحسن الدقة مع انخفاض الحالات الموجبة الخاطئة، بينما تتحسن نسبة الاسترجاع مع انخفاض الحالات السالبة الخاطئة. ولكن كما هو موضّح في القسم السابق، يؤدي رفع حدّ التصنيف إلى تقليل عدد النتائج الموجبة الخاطئة وزيادة عدد النتائج السالبة الخاطئة، في حين يؤدي خفض الحدّ إلى عكس ذلك. ونتيجةً لذلك، غالبًا ما تُظهر الدقة ومعدل الاسترجاع علاقة عكسية، حيث يؤدي تحسين أحدهما إلى تفاقم الآخر.

جرِّب ذلك بنفسك:

ما معنى NaN في المقاييس؟

يظهر NaN أو "ليس رقمًا" عند القسمة على 0، ويمكن أن يحدث ذلك مع أيّ من هذه المقاييس. على سبيل المثال، عندما تكون كلّ من TP وFP مساوية 0، تحتوي صيغة للدّقة على 0 في المقام، ما يؤدي إلى ظهور NaN. في بعض الحالات، يمكن أن يشير القيمة NaN إلى أداء مثالي ويمكن استبدالها بنتيجة 1.0، ولكن يمكن أن يكون مصدرها أيضًا نموذجًا غير مجدي. على سبيل المثال، لن يقدّم نموذج لا يتوقّع أبدًا نتيجة إيجابية أي نتائج إيجابية و0 نتائج خاطئة، وبالتالي سيؤدي احتساب دقته إلى القيمة NaN.

اختيار المقياس والمفاضلات

إنّ المقاييس التي تختارها لتحديد أولوياتها عند تقييم النموذج وتحديد حدّ معيّن تعتمد على التكاليف والمزايا والمخاطر المتعلّقة بالمشكلة المحدّدة. في مثال تصنيف الرسائل غير المرغوب فيها، غالبًا ما يكون من المفيد منح الأولوية لميزة "الاسترجاع"، أي رصد جميع الرسائل الإلكترونية غير المرغوب فيها، أو ميزة "الدقة"، أي محاولة التأكّد من أنّ الرسائل الإلكترونية المصنّفة كغير مرغوب فيها هي في الواقع غير مرغوب فيها، أو تحقيق التوازن بين الاثنين، وذلك فوق الحدّ الأدنى من مستوى الدقة.

المقياس	الإرشادات
الدقة	استخدِم هذا المقياس كمؤشر تقريبي لمدى تقدّم/تقارب عملية تدريب النموذج لمجموعات البيانات المتوازنة. بالنسبة إلى أداء النموذج، لا تستخدِم هذا المقياس إلا مع مقاييس أخرى. تجنَّب استخدامها مع مجموعات البيانات غير المتوازنة. ننصحك باستخدام مقياس آخر.
نسبة التذكر (معدل الموجب الصحيح)	استخدِم هذا النموذج عندما تكون الحالات السالبة الخاطئة أكثر تكلفة من الحالات الموجبة الخاطئة.
معدل الموجب الخاطئ	استخدِم هذا النموذج عندما تكون الحالات الموجبة الخاطئة أكثر تكلفة من الحالات السالبة الخاطئة.
الدقة	استخدِم هذا المقياس عندما يكون من المهم جدًا أن تكون التوقّعات الإيجابية دقيقة.

(اختياري ومتقدّم) درجة F1

مقياس دقة الاختبار هو المتوسط التوافقي (أحد أنواع المتوسطات) لدقة الاختبار واكتمال التوقعات الإيجابية.

من الناحية الرياضية، يتم التعبير عن ذلك من خلال:

\[\text{F1}=2*\frac{\text{precision * recall}}{\text{precision + recall}} = \frac{2\text{TP}}{2\text{TP + FP + FN}}\]

يوازن هذا المقياس أهمية الدقة ومعدل الاسترجاع، وهو أفضل من الدقة في مجموعات البيانات غير المتوازنة من حيث الفئات. عندما تحصل كلّ من الدقة والتذكر على علامتَين مثاليتَين تبلغان 1.0، سيحصل مقياس دقة الاختبار أيضًا على علامة مثالية تبلغ 1.0. وعلى نطاق أوسع، عندما تكون الدقة والتذكر قريبَين من حيث القيمة، سيكون مقياس F1 قريبًا من قيمتهما. عندما تكون الدقة والتذكر بعيدَين عن بعضهما، سيكون مقياس F1 مشابهًا لأي مقياس أسوأ.

تمرين: التحقّق من فهمك

يُخرج نموذج 5 حالات صحيحة إيجابية و6 حالات صحيحة سلبية و3 حالات خاطئة إيجابية وحالتين خاطئتَين سلبية. احتساب نسبة التذكُّر

0.714

يتم احتساب نسبة التذكُّر على النحو التالي \(\frac{TP}{TP+FN}=\frac{5}{7}\).

0.455

يأخذ مقياس التذكر في الاعتبار جميع القيم الموجبة الفعلية، وليس جميع التصنيفات الصحيحة. صيغة التذكير هي \(\frac{TP}{TP+FN}\).

0.625

تأخذ ميزة "التذكر" في الاعتبار جميع القيم الموجبة الفعلية، وليس جميع التصنيفات الإيجابية. صيغة التذكير هي \(\frac{TP}{TP+FN}\)

يُخرج النموذج 3 حالات صحيحة إيجابية و4 حالات صحيحة سلبية وحالتين خطأ إيجابي وحالة خطأ سلبي واحدة. احتسِب الدقة.

0.6

يتم احتساب الدقة على النحو التالي \(\frac{TP}{TP+FP}=\frac{3}{5}\).

0.75

تأخذ الدقة في الاعتبار جميع التصنيفات الموجبة، وليس كل الحالات الموجبة الفعلية. صيغة الدقة هي \(\frac{TP}{TP+FP}\).

0.429

تأخذ الدقة في الاعتبار جميع التصنيفات الإيجابية، وليس كل التصنيفات الصحيحة. معادلة الدقة هي \(\frac{TP}{TP+FP}\)

أنت بصدد إنشاء مصنّف ثنائي يفحص صور مصائد الحشرات للتحقّق من توفّر أنواع خطيرة من الأنواع الغازية. إذا رصد النموذج النوع، يتم إرسال إشعار إلى عالم الحشرات المناوب. من المهم رصد هذه الحشرة في مرحلة مبكرة لمنع انتشارها. من السهل التعامل مع بلاغ خاطئ (نتيجة إيجابية خاطئة): يلاحظ عالم الحشرات أنّه تم تصنيف الصورة بشكل خاطئ ويضع علامة عليها بذلك. بافتراض مستوى مقبولاً للدقة، ما هو المقياس الذي يجب تحسين هذا النموذج من أجله؟

التذكُّر

في هذا السيناريو، تكون الإنذارات الخاطئة (FP) منخفضة التكلفة، وتكون النتائج الخاطئة السلبية مرتفعة التكلفة، لذا من المنطقي زيادة نسبة الاسترجاع إلى أقصى حدّ، أو احتمال رصده.

معدّل الموجب الخاطئ (FPR)

في هذا السيناريو، تكون الإنذارات الخاطئة منخفضة التكلفة. ولا يُجدي محاولة تقليلها مع المخاطرة بعدم رصد الإيجابيات الفعلية.

الدقة

في هذا السيناريو، لا تكون الإنذارات الخاطئة (FP) ضارة بشكل خاص، لذا لا معنى لمحاولة تحسين صحة التصنيفات الموجبة.

مركز المساعدة

الحدود الدنيا ومصفّفة الارتباك (12 دقيقة)

ROC وAUC (10 دقائق)

التصنيف: الدقة والتذكر والدقة والمقاييس ذات الصلة تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

الدقة

نسبة التذكر أو نسبة الموجب الصحيح

معدل الموجب الخاطئ

الدقة

ما معنى NaN في المقاييس؟

اختيار المقياس والمفاضلات

(اختياري ومتقدّم) درجة F1

تمرين: التحقّق من فهمك

التصنيف: الدقة والتذكر والدقة والمقاييس ذات الصلة