إنتاج

لإعداد خطوط أنابيب تعلُّم الآلة للإنتاج، عليك تنفيذ ما يلي:

  • توفير موارد حسابية لخطوط الإنتاج
  • تنفيذ التسجيل والمراقبة والتنبيه

توفير موارد الحوسبة

يتطلّب تشغيل خطوط أنابيب تعلُّم الآلة موارد حوسبة، مثل ذاكرة الوصول العشوائي (RAM) ووحدات المعالجة المركزية (CPU) ووحدات معالجة الرسومات (GPU) أو وحدات معالجة الموتّرات (TPU). بدون قدرة حوسبة كافية، لا يمكنك تشغيل خطوط الأنابيب. لذلك، احرص على الحصول على حصة كافية لتوفير الموارد اللازمة التي تحتاجها خطوط الإنتاج لتنفيذها في بيئة الإنتاج.

  • عمليات عرض الإعلانات وتدريب النماذج والتحقّق من صحة البيانات تتطلّب هذه المسارات وحدات TPU أو وحدات معالجة الرسومات أو وحدات المعالجة المركزية. واستنادًا إلى حالة الاستخدام، يمكنك التدريب والتقديم على أجهزة مختلفة أو استخدام الأجهزة نفسها. على سبيل المثال، قد يتم إجراء التدريب على وحدات المعالجة المركزية، ولكن قد تستخدم عملية العرض وحدات TPU، أو العكس. بشكل عام، من الشائع التدريب على أجهزة أكبر حجمًا ثم العرض على أجهزة أصغر حجمًا.

    عند اختيار الأجهزة، ضَع في اعتبارك ما يلي:

    • هل يمكن التدريب على أجهزة أقل تكلفة؟
    • هل سيؤدي التبديل إلى جهاز مختلف إلى تحسين الأداء؟
    • ما هو حجم النموذج وما هي الأجهزة التي ستعمل على تحسين أدائه؟
    • ما هي الأجهزة المثالية استنادًا إلى بنية النموذج؟
  • مسارات البيانات: تتطلّب مسارات نقل البيانات حصة من ذاكرة الوصول العشوائي ووحدة المعالجة المركزية عليك تقدير مقدار الحصة التي يحتاجها مسار البيانات لإنشاء مجموعات بيانات التدريب والاختبار.

قد لا يتم تخصيص حصة لكل مسار. بدلاً من ذلك، يمكنك تخصيص حصة مشتركة بين خطوط الإنتاج. في مثل هذه الحالات، تأكَّد من توفّر حصة كافية لتشغيل جميع مسارات البيانات، واضبط إعدادات المراقبة والتعديل لمنع مسار بيانات واحد خاطئ من استهلاك كل الحصة.

تقدير الحصة

لتقدير الحصة التي ستحتاج إليها لخطوط نقل البيانات والتدريب، ابحث عن مشاريع مشابهة تستند إليها في تقديراتك. لتقدير حصة العرض، حاوِل توقّع عدد الطلبات في الثانية التي تتلقّاها الخدمة. توفّر هذه الطرق مرجعًا أساسيًا. عندما تبدأ في إنشاء نموذج أوّلي للحل خلال مرحلة التجربة، ستبدأ في الحصول على تقدير أكثر دقة للحصة.

عند تقدير الحصة، تذكَّر أن تأخذ في الاعتبار الحصة المخصّصة ليس فقط لخطوط إنتاجك، ولكن أيضًا للتجارب الجارية.

التحقّق من فهمك

عند اختيار أجهزة لتقديم التوقّعات، يجب دائمًا اختيار أجهزة أكثر فعالية من تلك التي تم استخدامها لتدريب النموذج.
خطأ
إجابة صحيحة. عادةً ما يتطلّب التدريب أجهزة أكبر من العرض.
True

التسجيل والمراقبة والتنبيه

يُعدّ تسجيل سلوك نموذج الإنتاج ومراقبته أمرًا بالغ الأهمية. تؤكّد البنية الأساسية القوية للمراقبة أنّ نماذجك تقدّم توقعات موثوقة وعالية الجودة.

تساعد ممارسات التسجيل والمراقبة الجيدة في تحديد المشاكل بشكل استباقي في مسارات البيانات الخاصة بالتعلم الآلي والحد من التأثير المحتمل في الأنشطة التجارية. وعند حدوث مشاكل، ترسل التنبيهات إشعارات إلى أعضاء فريقك، وتسهّل السجلات الشاملة عملية تشخيص السبب الأساسي للمشكلة.

يجب تنفيذ عمليات التسجيل والمراقبة لرصد المشاكل التالية في مسارات تعلُّم الآلة:

مسار التعلّم مراقب
جارٍ العرض
  • الانحرافات أو التغيّرات في بيانات العرض مقارنةً ببيانات التدريب
  • انحرافات أو تغيّرات في التوقعات
  • مشاكل في أنواع البيانات، مثل القيم المفقودة أو التالفة
  • مقدار استخدام الحصة
  • مقاييس جودة النموذج
البيانات
  • الانحرافات والتغيّرات في قيم الميزات
  • الانحرافات والتغيّرات في قيم التصنيفات
  • مشاكل في أنواع البيانات، مثل القيم المفقودة أو التالفة
  • معدّل استخدام الحصة
  • أوشكت على بلوغ الحدّ الأقصى للحصة المخصّصة لك
التدريب
  • وقت التدريب
  • أخطاء التدريب
  • مقدار استخدام الحصة
التحقّق من الصحة
  • الانحراف أو التغيّر في مجموعات بيانات الاختبار

ستحتاج أيضًا إلى تسجيل البيانات ومراقبتها وإرسال تنبيهات بشأن ما يلي:

  • وقت الاستجابة: كم من الوقت يستغرق عرض التوقّعات؟
  • الانقطاعات هل توقّف النموذج عن تقديم التوقعات؟

التحقّق من فهمك

أيّ مما يلي هو السبب الرئيسي لتسجيل ومراقبة مسارات تعلُّم الآلة؟
رصد المشاكل بشكل استباقي قبل أن تؤثر في المستخدمين
تتبُّع الحصة واستخدام الموارد
تحديد المشاكل المحتملة المتعلّقة بالأمان
كل ما سبق
إجابة صحيحة. يساعد تسجيل مسارات تعلُّم الآلة ومراقبتها في منع المشاكل وتشخيصها قبل أن تصبح خطيرة.

نشر نموذج

عند نشر النماذج، عليك توثيق ما يلي:

  • الموافقات المطلوبة لبدء عملية النشر وزيادة عدد المستخدمين الذين سيتم طرح التطبيق لهم
  • كيفية نشر نموذج واستخدامه
  • مكان نشر النموذج، مثلاً، إذا كانت هناك بيئات تجريبية أو بيئات إصدار تجريبي.
  • الإجراءات التي يجب اتّخاذها في حال تعذُّر نشر التطبيق
  • كيفية التراجع عن نموذج تم نشره.

بعد إعداد عملية التدريب الآلي للنموذج، عليك إعداد عملية آلية للتحقّق من الصحة والنشر. تؤدي عملية نشر التطبيقات آليًا إلى توزيع المسؤولية وتقليل احتمال أن يؤدي شخص واحد إلى تأخير عملية النشر. كما يقلّل من الأخطاء المحتملة، ويزيد من الكفاءة والموثوقية، ويتيح تناوب المناوبات وتقديم الدعم من فريق هندسة موثوقية الموقع (SRE).

عادةً ما يتم نشر النماذج الجديدة لمجموعة فرعية من المستخدمين للتأكّد من أنّ النموذج يعمل على النحو المتوقّع. في حال توفُّرها، يمكنك مواصلة عملية النشر. إذا لم يكن الأمر كذلك، عليك التراجع عن عملية النشر والبدء في تشخيص المشاكل وتصحيح أخطائها.