כשמשתמשים ב-Prompt API, יש אסטרטגיות ספציפיות שאפשר להשתמש בהן כדי להתאים אישית את ההנחיות ולקבל תוצאות אופטימליות. בדף הזה מפורטות שיטות מומלצות לעיצוב הנחיות ל-Gemini Nano.
להנחיות כלליות יותר בנושא הנדסת הנחיות, אפשר לעיין במאמרים Prompt Engineering whitepaper, Prompt Engineering for Generative AI ו-Prompt design strategies.
לחלופין, כדי לשפר את ההנחיות באופן אוטומטי, אפשר להשתמש באופטימיזציה ללא דוגמאות, שיכולה לטרגט מודלים במכשיר כמו gemma-3n-e4b-it.
שיטות מומלצות לעיצוב הנחיות
כשיוצרים הנחיות ל-Prompt API, כדאי להשתמש בטכניקות הבאות:
לספק דוגמאות ללמידה בהקשר. כדי להראות ל-Gemini Nano את סוג התוצאה שאתם מצפים לה, כדאי להוסיף להנחיה דוגמאות מגוונות.
כדאי להשתמש בתכונה prefix caching כשמשתמשים בלמידה בהקשר, כי מתן דוגמאות מאריך את ההנחיה ומגדיל את זמן ההסקה.
השם צריך להיות תמציתי. הקדמות ארוכות עם הוראות שחוזרות על עצמן עלולות להניב תוצאות לא אופטימליות. ההנחיה צריכה להיות ממוקדת ותמציתית.
הנחיות מובנות עוזרות ליצור תשובות יעילות יותר. למשל, תבנית ההנחיה לדוגמה הזו מגדירה בבירור את ההוראות, המגבלות והדוגמאות.
לשמור על פלט קצר. מהירויות ההיסק של מודלים גדולים של שפה (LLM) תלויות מאוד באורך הפלט. כדאי לחשוב היטב איך אפשר ליצור את הפלט הקצר ביותר האפשרי לתרחיש השימוש שלכם, ולבצע עיבוד ידני כדי לבנות את הפלט בפורמט הרצוי.
הוספת תווי הפרדה. כדי ליצור הפרדה בין חלקים שונים בהנחיה, אפשר להשתמש בתווים מפרידים כמו
<background_information>,<instruction>ו-##. השימוש ב-##בין רכיבים חשוב במיוחד ל-Gemini Nano, כי הוא מפחית באופן משמעותי את הסיכויים שהמודל לא יצליח לפרש נכון כל רכיב.העדפה של לוגיקה פשוטה ומשימה ממוקדת יותר. אם קשה לכם להשיג תוצאות טובות עם הנחיה שדורשת נימוק רב-שלבי (לדוגמה, קודם תבצע את פעולה X, אם התוצאה של X היא A, תבצע את פעולה M, אחרת תבצע את פעולה N, ואז תבצע את פעולה Y...), כדאי לחלק את המשימה ולתת לכל קריאה של Gemini Nano לטפל במשימה ממוקדת יותר, תוך שימוש בקוד כדי לשרשר כמה קריאות יחד.
שימוש בערכי טמפרטורה נמוכים יותר למשימות דטרמיניסטיות למשימות כמו חילוץ ישויות או תרגום שלא מסתמכות על יצירתיות, מומלץ להתחיל עם ערך
temperatureשל0.2, ולשנות את הערך הזה בהתאם לתוצאות הבדיקות.