تصميم الطلبات لنموذج Gemini Nano

عند استخدام Prompt API، يمكنك اتّباع استراتيجيات محدّدة لتخصيص الطلبات والحصول على أفضل النتائج. توضّح هذه الصفحة أفضل الممارسات المتعلّقة بتنسيق الطلبات الموجّهة إلى Gemini Nano.

للحصول على إرشادات عامة حول هندسة الطلبات، يمكنك الاطّلاع على المستند التقني حول هندسة الطلبات وهندسة الطلبات للذكاء الاصطناعي التوليدي واستراتيجيات تصميم الطلبات.

بدلاً من ذلك، لتحسين الطلبات وتحسينها تلقائيًا، يمكنك استخدام أداة التحسين بدون أمثلة التي يمكنها استهداف النماذج على الجهاز، مثل gemma-3n-e4b-it.

أفضل الممارسات المتعلقة بتصميم الطلبات

عند تصميم طلبات لواجهة Prompt API، استخدِم الأساليب التالية:

  • تقديم أمثلة للتعلم داخل السياق: أضِف أمثلة موزّعة بشكل جيد إلى طلبك لتوضّح لـ Gemini Nano نوع النتيجة التي تتوقّعها.

    ننصحك باستخدام ميزة التخزين المؤقت للبادئة عند استخدام التعلّم داخل السياق، لأنّ تقديم الأمثلة يؤدي إلى إطالة الطلب وزيادة وقت الاستنتاج.

  • الإيجاز: يمكن أن تؤدي المقدمات المطوّلة التي تتضمّن تعليمات مكرّرة إلى نتائج غير مثالية. اجعل طلبك مركّزًا ومباشرًا.

  • نظِّم الطلبات للحصول على ردود أكثر فعالية، مثل نموذج الطلب هذا الذي يحدّد بوضوح التعليمات والقيود والأمثلة.

  • إبقاء الناتج قصيرًا: تعتمد سرعات الاستدلال في النماذج اللغوية الكبيرة بشكل كبير على طول الناتج. يجب التفكير مليًا في كيفية إنشاء أقصر ناتج ممكن لحالة الاستخدام وإجراء معالجة لاحقة يدويًا لتنظيم الناتج بالتنسيق المطلوب.

  • إضافة عوامل تحديد استخدِم محدّدات مثل <background_information> و<instruction> و## للفصل بين الأجزاء المختلفة من طلبك. يُعد استخدام ## بين المكوّنات أمرًا بالغ الأهمية بالنسبة إلى Gemini Nano، لأنّه يقلّل بشكل كبير من فرص عدم تمكّن النموذج من تفسير كل مكوّن بشكل صحيح.

  • يُفضّل استخدام منطق بسيط ومهمة أكثر تركيزًا. إذا كنت تواجه صعوبة في الحصول على نتائج جيدة من خلال طلب يتطلّب استنتاجًا متعدد الخطوات (مثلاً، نفِّذ X أولاً، وإذا كانت نتيجة X هي A، نفِّذ M، وإلا نفِّذ N، ثم نفِّذ Y...)، ننصحك بتقسيم المهمة والسماح لكل طلب من Gemini Nano بمعالجة مهمة أكثر تركيزًا، مع استخدام الرمز البرمجي لربط الطلبات المتعددة معًا.

  • استخدِم قيم درجة حرارة منخفضة للمهام المحدّدة. بالنسبة إلى مهام مثل استخراج الكيانات أو الترجمة التي لا تعتمد على الإبداع، ننصحك بالبدء بقيمة temperature تبلغ 0.2، ثم تعديل هذه القيمة استنادًا إلى نتائج الاختبارات.