يُعدّ ضمان جودة طلبك وموثوقيته أمرًا بالغ الأهمية عند تنفيذ Prompt API.
لتقييم جودة الطلب، عليك إعداد مجموعة شاملة من المدخلات والمخرجات المتوقّعة لحالة الاستخدام.
لتقييم ما إذا كان طلبك يستوفي معايير الجودة مع كل إصدار من نموذج Gemini Nano، ننصحك باتّباع سير العمل التالي:
- نفِّذ مجموعة بيانات التقييم وسجِّل النتائج.
- يمكنك تقييم النتائج يدويًا أو استخدام LLM-as-a-judge.
- إذا لم يستوفِ التقييم معايير الجودة، كرِّر طلبك. على سبيل المثال، يمكنك أن تطلب من نموذج لغوي كبير أكثر فعالية، مثل Gemini Pro، تحسين الطلب استنادًا إلى النتيجة المطلوبة مقارنةً بالنتيجة الفعلية.
تساعد هندسة الطلبات في تحسين أداء المهام، ويُعدّ تكرار الطلبات أمرًا أساسيًا. ننصحك بتكرار الخطوات المذكورة أعلاه 3 إلى 5 مرات على الأقل. يُرجى العِلم أنّ هذا الأسلوب له حدود، لأنّ التحسينات ستؤدي في النهاية إلى نتائج متناقصة.
بدلاً من ذلك، لتحسين الطلبات بسرعة وعلى نطاق واسع، يمكنك استخدام
أداة التحسين المستندة إلى البيانات، والتي يمكنها استهداف النماذج على الأجهزة، مثل
gemma-3n-e4b-it.
الأمان
لضمان أن يعرض Gemini Nano نتائج آمنة للمستخدمين، يتم تطبيق طبقات متعددة من الحماية للحدّ من النتائج الضارة أو غير المقصودة:
- أمان النموذج المضمّن: يتم تدريب جميع نماذج Gemini، بما في ذلك Gemini Nano، على مراعاة الأمان منذ البداية. وهذا يعني أنّ اعتبارات الأمان مضمّنة في صميم النموذج، وليس مجرد إضافة لاحقة.
- فلاتر الأمان للمدخلات والمخرجات: يتم تقييم كلّ من طلب الإدخال والنتائج التي ينشئها وقت تشغيل Gemini Nano وفقًا لفلاتر الأمان قبل تقديم النتائج إلى التطبيق، ما يساعد في منع تسريب المحتوى غير الآمن بدون أي انخفاض في الجودة.
ومع ذلك، بما أنّ كل تطبيق لديه معاييره الخاصة بشأن المحتوى الآمن للمستخدمين، عليك تقييم مخاطر الأمان لحالة الاستخدام المحدّدة لتطبيقك واختبارها وفقًا لذلك.
مراجع إضافية
- ما مدى جودة الذكاء الاصطناعي؟ تقييم الذكاء الاصطناعي التوليدي في كل مرحلة، شرح: مشاركة مدوّنة تشرح كيفية استخدام خدمة تقييم الذكاء الاصطناعي التوليدي.
- نظرة عامة على خدمة تقييم الذكاء الاصطناعي التوليدي: مستندات تشرح كيفية تقييم نماذج الذكاء الاصطناعي التوليدي لتنفيذ مهام مثل مقارنة النماذج وتحسين الطلبات وضبطها بدقة.
- تشغيل مسار تقييم مستند إلى العمليات الحسابية - مستندات حول كيفية تقييم أداء النموذج