التصنيف: التحقق من فهمك (الدقة، والدقّة، والتذكُّر)

الدقة

يُرجى الاطّلاع على الخيارات أدناه.

في أي من السيناريوهات التالية، تقترح القيمة العالية الدقة أنّ نموذج تعلُّم الآلة يؤدي أداءً جيدًا؟
تصيب الحالة الطبية المميتة والقابلة للعلاج، نسبة 01% من السكان. ويستخدِم نموذج تعلُّم الآلة الأعراض كميزات ويتوقّع هذا الارتباط بدقة 99.99%.
الدقة هي مقياس رديء هنا. وعلى الرغم من ذلك، فإنّ كلاً من النموذج "dumb" الذي ينبّه دائمًا أنّه لن يكون دقيقًا بنسبة 99.99%، بلوق: التوقع الخاطئ عن طريق الخطأ، مثل شخص مريض، يمكن أن يكون مميتًا
دجاج آلي باهظ الثمن يعبر طريقًا مزدحمًا جدًّا ألف مرة في اليوم. يقيّم نموذج تعلُّم الآلة أنماط حركة المرور ويتوقّع الوقت الذي يمكن أن تصل فيه هذه الدجاجة إلى الشارع بأمان بدقة 99.99%.
تشير قيمة الدقة بنسبة 99.99% على طريق مزدحم جدًا إلى أن نموذج تعلُّم الآلة أفضل من الصدفة. وفي بعض الإعدادات، لا تزال تكلفة ارتكاب عدد قليل من الأخطاء مرتفعةً جدًا. وتعني الدقة بنسبة 99.99% أنه يجب استبدال الدجاج الباهظ في المتوسط كل 10 أيام. (قد يتسبب الدجاج أيضًا في حدوث ضرر جسيم على السيارات التي ينقر عليها.)
في لعبة الروليت، يتم إسقاط كرة على عجلة دوّارة، وتصل في النهاية إلى واحدة من الـ 38 فتحة. باستخدام الميزات المرئية (دوران الكرة) وموضع العجلة عند إسقاط الكرة وارتفاعها فوق العجلة)، يمكن أن ينبّه نموذج تعلُّم الآلة الخانة التي ستهبط فيها الكرة بدقة %4.
وهذا النموذج في تعلُّم الآلة يجعل التوقّعات أفضل بكثير من صدفة، وبالتالي سيكون التخمين العشوائي صحيحًا بنسبة 1/38 من الوقت، ما يؤدي إلى تحقيق دقة تبلغ 2.6%. على الرغم من أنّ دقة النموذج هي &quot%&9%4%، فإن فوائد النجاح تفوق تلك التي تنطوي على سلبيات الفشل.

مسابقة دقة التصويب

يُرجى الاطّلاع على الخيارات أدناه.

جرِّب نموذج تصنيف يقسّم البريد الإلكتروني إلى فئتين: "spam" أو "وليس الرسائل غير المرغوب فيها.& إذا رفعت حدّ التصنيف، ماذا سيحدث للدقة؟
بالتأكيد.
عادةً ما يؤدي رفع حدّ التصنيف إلى زيادة الدقة، ولكن لا يمكن ضمان زيادة الدقة أحاديًا أثناء زيادة الحدّ.
على الأرجح أن تكون الزيادة.
وبشكل عام، تؤدي زيادة الحدّ الأدنى للتصنيف إلى تقليل النتائج الموجبة الخاطئة، ما يؤدي إلى زيادة الدقة.
من المحتمل أن ينخفض.
وبشكل عام، تؤدي زيادة الحدّ الأدنى للتصنيف إلى تقليل النتائج الموجبة الخاطئة، ما يؤدي إلى زيادة الدقة.
بالتأكيد.
وبشكل عام، تؤدي زيادة الحدّ الأدنى للتصنيف إلى تقليل النتائج الموجبة الخاطئة، ما يؤدي إلى زيادة الدقة.

التذكُّر

يُرجى الاطّلاع على الخيارات أدناه.

جرِّب نموذج تصنيف يقسّم البريد الإلكتروني إلى فئتين: "spam" أو "وليس الرسائل غير المرغوب فيها.& إذا رفعت الحدّ الأدنى لتصنيف البيانات، ماذا ستتذكّر؟
احرص دائمًا على الزيادة.
سيؤدي رفع حدّ التصنيف إلى ما يلي:
  • سينخفض عدد النتائج الموجبة الصحيحة أو يظل كما هو.
  • سيزداد عدد النتائج السلبية الخاطئة أو يظل كما هو.
وبالتالي، لن تزيد ميزة تذكُّر المحتوى أبدًا.
للبقاء كما هو أو تقليله دائمًا.
سيؤدي رفع الحدّ الأدنى لتصنيفنا إلى تقليل عدد الحالات الموجبة الصحيحة أو خفضه، كما سيؤدي ذلك إلى زيادة عدد النتائج السلبية الخاطئة أو الحفاظ عليه. وبالتالي، فإنّ معدّل تذكّر الصوت سيبقى ثابتًا أو منخفضًا.
حافِظ على الثبات دائمًا.
سيؤدي رفع الحدّ الأدنى لتصنيفنا إلى تقليل عدد الحالات الموجبة الصحيحة أو خفضه، كما سيؤدي ذلك إلى زيادة عدد النتائج السلبية الخاطئة أو الحفاظ عليه. وبالتالي، فإنّ معدّل تذكّر الصوت سيبقى ثابتًا أو منخفضًا.

الدقة والتذكّر

يُرجى الاطّلاع على الخيارات أدناه.

لنأخذ في الاعتبار نموذجَين (أ) و(ب) يقيّمان كل منهما مجموعة البيانات نفسها. أي من العبارات التالية صحيحة؟
وإذا كان النموذج "أ" أفضل من النموذج "ب"، يكون النموذج "أ" أفضل.
على الرغم من أنّ الدقة المحسّنة تكون جيّدة، إلا أنّها قد تؤدي إلى انخفاض كبير في تذكّر المعلومات. بشكل عام، علينا أن ننظر إلى كلٍّ من الدقة والتذكّر معًا أو ملخّص المقاييس، مثل محتوى AUC الذي سنتحدث عنه بعد ذلك.
إذا كان النموذج "أ" أفضل من تذكّر النموذج "ب"، يكون النموذج "أ" أفضل.
وفي حين أنّ تذكُّر المحتوى بشكل أفضل يكون جيّدًا، قد يعود هذا الانخفاض على خفض كبير في الدقّة. وبوجه عام، علينا أن ننظر إلى الدقة والتذكّر معًا، أو إلى ملخّص المقاييس مثل AUC، والتي سنتحدّث عنها بعد ذلك.
إذا كان النموذج (أ) أكثر دقة وتذكّرًا أفضل من النموذج (ب)، من المحتمل أن يكون النموذج (أ) أفضل.
بشكل عام، من الأفضل اختيار نموذج يتفوق في الأداء على نموذج آخر في كل من الدقة والتذكّر. وبالتأكيد، سنحتاج إلى التأكّد من أن المقارنة تتم على نقطة دقة / تذكير مفيدة في الممارسة لكي تكون مفيدة. على سبيل المثال، لنفترض أنّ نموذج رصد المحتوى غير المرغوب فيه يحتاج إلى دقة لا تقل عن 90% لكي يكون مفيدًا وتجنّب التنبيهات الخاطئة غير الضرورية. وفي هذه الحالة، لا تُعدّ مقارنة طراز واحد بنسبة {20% من الدقة و99% من تذكّره} بنموذج آخر بدقة {15% وسعر 98%} مفيدًا بشكل خاص لأنّ أيًا من النموذجين لا يستوفي متطلبات الدقة 90%. ومع أخذ هذا التحذير في الاعتبار، ننصحك بالتفكير في مقارنة النماذج عند الدقة والتذكّر.