اختبار لنشر نماذج تعلُّم الآلة

بإمكانك الآن نشر الفيديو. إذا كان نشر النموذج فقط سهلاً مثل الضغط على زر أحمر كبير. وعند النشر، تريد تشغيل مسارك، وتحديثه، وعرضه بدون أي ربط. وتؤدي هذه المتطلبات إلى المتطلبات والحلول التي تمت مناقشتها في هذه الصفحة.

تحديثات النماذج التجريبية باستخدام تدريب قابل للتكرار

لا شك أنك تريد مواصلة تحسين جهاز توقع ظهور قرن وحيد القرن. لنفترض أنك أعدت استخدام رمز هندسة الميزة لميزة "الوقت من اليوم". كيف يمكنك اختبار صحة الرمز؟ فتقرر تدريب النموذج مرة أخرى، وتتحقّق مما إذا حصلت على النتيجة نفسها. ندرك أنّ تدريب النموذج الخاص بك لا يمكن تكراره. ونحن مصمّمون على مواصلة توقّع مظهر "وحيد القرن"، لذا يمكنك إجراء المزيد من التحقيقات. وتجد أنّه بإمكانك تحقيق قابلية إعادة الإنتاج من خلال اتّباع الخطوات التالية:

  • تحديد كيفية إنشاء مُنشئ الأرقام (RNG) بشكل عشوائي. لمعرفة التفاصيل، يُرجى الاطّلاع على المزج في إنشاء البيانات من الدورة التدريبية حول إعداد البيانات وهندسة الميزات في تعلُّم الآلة.

  • يجب إعداد مكوّنات النموذج بترتيب ثابت لضمان حصول المكوّنات على الرقم العشوائي نفسه من رقم RNG في كل عملية تشغيل. وتعالج مكتبات تعلّم الآلة هذا المطلب تلقائيًا.

  • متوسط عدد مرات تشغيل النموذج.

  • استخدِم التحكُّم في الإصدارات، حتى عند التكرارات الأولية، بحيث يمكنك تحديد الرمز والمعلّمات عند فحص النموذج أو مسار التعلّم.

حتى بعد اتّباع هذه الخطوات، قد تتوفّر لديك مصادر أخرى غير محدّدة.

اختبار تحديثات النماذج على المواصفات وطلبات البيانات من واجهة برمجة التطبيقات

بعد تحديث النموذج إلى Unicorn Predictor 2.0، عليك اختبار النموذج الجديد لتصحيح الخوارزمية، بالإضافة إلى أي تغييرات في طلبات البيانات من واجهة برمجة التطبيقات. لنناقش كيفية تنفيذ ذلك.

اختبار طلبات البيانات من واجهة برمجة التطبيقات

كيف يتم اختبار التحديثات على طلبات البيانات من واجهة برمجة التطبيقات؟ حسنًا، يمكنك إعادة تدريب النموذج، لكنّ ذلك يستغرق وقتًا طويلاً. بدلاً من ذلك، اكتب اختبار الوحدة لإنشاء بيانات إدخال عشوائية وتنفيذ خطوة واحدة من التدرج المتدرج. تريد إكمال الخطوة بدون أخطاء في وقت التشغيل.

اختبار لتصحيح الخوارزمية

على سبيل المثال، يجب ألا يتنبّه النموذج بشكل صحيح، بل يجب أن يكون صحيحًا أيضًا لأنّه صحيح من الناحية الخوارزمية وليس محظوظًا. على سبيل المثال، إذا كانت 99% من الرسائل الإلكترونية ليست رسائل غير مرغوب فيها، سيؤدي تصنيف جميع الرسائل الإلكترونية على أنها ليست رسائل غير مرغوب فيها إلى دقة 99% عن طريق الصدفة. وبالتالي، يجب التحقق من النموذج للتحقق من صحة الخوارزمية. يُرجى اتّباع الخطوات التالية:

  • درّب النموذج على بعض التكرارات وتحقّق من انخفاض الخسارة.
  • يمكنك تدرّب الخوارزمية بدون تسوية منتظمة. إذا كان النموذج معقّدًا بما فيه الكفاية، سيتذكر بيانات التدريب وسيتم فقدان خسارة التدريب بالقرب من الصفر.
  • اختبِر عمليات حسابية فرعية لخوارزمياتك. على سبيل المثال، يمكنك اختبار أن جزءًا من RNN يتم تشغيله مرة واحدة لكل عنصر من بيانات الإدخال.

كتابة اختبارات الدمج لمكونات مسار الأنابيب

في مسار تعلّم الآلة، يمكن أن تتسبب التغييرات في مكوّن واحد في حدوث أخطاء في المكوّنات الأخرى. تحقق من عمل المكوّنات معًا من خلال كتابة اختبار يتم تشغيله من خلال مسار شامل. ويُعرف هذا الاختبار باسم اختبار الدمج.

بالإضافة إلى إجراء اختبارات التكامل بشكل مستمر، يجب إجراء اختبارات التكامل عند إرسال نماذج جديدة وإصدارات جديدة من البرامج. ويؤدّي بطء تشغيل مسار الإحالة الناجحة بأكمله إلى صعوبة اختبار التكامل المستمر. لإجراء اختبارات الدمج بشكل أسرع، يمكنك التدريب على مجموعة فرعية من البيانات أو باستخدام نموذج أكثر بساطة. وتعتمد التفاصيل على الطراز والبيانات. للحصول على تغطية مستمرة، عليك ضبط اختباراتك الأسرع بحيث يتم تشغيلها مع كل إصدار جديد من الطراز أو البرامج. وفي الوقت نفسه، سيتم إجراء الاختبارات البطيئة باستمرار في الخلفية.

التحقّق من جودة النموذج قبل عرضه

قبل إرسال إصدار نموذج جديد إلى مرحلة الإنتاج، اختبِر النوعين التاليين من الانخفاضات في الجودة:

  • الانخفاض المفاجئ: قد يؤدي حدوث خطأ في الإصدار الجديد إلى انخفاض جودة الجودة بشكل كبير. تحقق من النُسخ الجديدة من خلال التحقق من جودتها مقارنة بالإصدار السابق.

  • البطء في التراجع: قد لا يؤدي اختبار الانخفاض المفاجئ إلى اكتشاف انخفاض بطيء في جودة النموذج على مستوى إصدارات متعددة. وبدلاً من ذلك، تأكّد من أن توقعات نموذجك في مجموعة بيانات التحقّق تستوفي الحد الأدنى الثابت. إذا خرجت مجموعة بيانات التحقّق عن البيانات المباشرة، عليك تعديل مجموعة بيانات التحقّق والتأكد من أن النموذج لا يزال يستوفي الحد الأدنى من الجودة نفسه.

التحقّق من توافق النموذج بالبنية الأساسية مع البيانات قبل العرض

إذا تم تحديث النموذج بشكل أسرع من الخادم، سيتضمّن النموذج اعتماديات مختلفة عن الخادم، ما قد يؤدي إلى عدم توافق العناصر. تأكّد من أنّ العمليات التي يستخدمها النموذج موجودة في الخادم من خلال تقسيم النموذج إلى إصدار في وضع الحماية من الخادم.