דף זה תורגם על ידי Cloud Translation API.

מילון מונחים ללמידת מכונה: בינה מלאכותית גנרטיבית

הדף הזה מכיל מונחים ממילון בינה מלאכותית גנרטיבית. כאן מפורטות כל ההגדרות במילון.

A

הערכה אוטומטית

#language

#generativeAI

שימוש בתוכנה כדי לשפוט את איכות הפלט של מודל.

כשפלט המודל פשוט יחסית, אפשר להשתמש בסקריפט או בתוכנית כדי להשוות את הפלט של המודל לתשובה מושלמת. סוג ההערכה האוטומטי הזה נקרא לפעמים הערכה פרוגרמטית. מדדים כמו ROUGE או BLEU הם לרוב שימושיים להערכה פרוגרמטית.

כשפלט המודל מורכב או שאין לו תשובה נכונה אחת, לפעמים תוכנית למידת מכונה נפרדת שנקראת מעריך אוטומטי מבצעת את ההערכה האוטומטית.

בניגוד לבדיקה אנושית.

הערכה של המערכת האוטומטית

#language

#generativeAI

מנגנון היברידי לשיפוט האיכות של הפלט של מודל AI גנרטיבי, שמשלב הערכה אנושית עם הערכה אוטומטית. מערכת הערכה אוטומטית היא מודל למידת מכונה (ML) שמתאמן על נתונים שנוצרו על ידי הערכה אנושית. באופן אידיאלי, מערכת הסיווג האוטומטי לומדת לחקות את האופן שבו בודק אנושי עובד.

יש מודלים מוכנים מראש של מודלים אוטומטיים, אבל המודלים האוטומטיים הטובים ביותר מותאמים במיוחד למשימה שאתם מעריכים.

מודל אוטו-רגרסיבי

#language

#image

#generativeAI

מודל שמסיק חיזוי על סמך החיזויים הקודמים שלו. לדוגמה, מודלים של שפה חזרהית חוזים את האסימון הבא על סמך האסימונים שחזו קודם. כל מודלים גדולים של שפה שמבוססים על Transformer הם אוטו-רגרסיביים.

לעומת זאת, מודלים של תמונות שמבוססים על GAN הם בדרך כלל לא רגרסיביים אוטומטיים, כי הם יוצרים תמונה בפעולה קדימה אחת ולא באופן איטרטיבי בשלבים. עם זאת, מודלים מסוימים ליצירת תמונות הם מודלים רגרסיביים אוטומטיים כי הם יוצרים תמונה בשלבים.

C

הנחיות בטכניקת שרשרת מחשבה

#language

#generativeAI

טכניקה של הנדסת הנחיות שמעודדת מודל שפה גדול (LLM) להסביר את התהליך של המסקנות שלו, שלב אחרי שלב. לדוגמה, הנה הנחיה לדוגמה, שימו לב במיוחד למשפט השני:

כמה כוחות גרביטציה (G) יפעלו על נהג ברכב שנוסע מ-0 ל-96 קמ"ש תוך 7 שניות? בתשובה, צריך להציג את כל החישובים הרלוונטיים.

התשובה של ה-LLM תהיה ככל הנראה:

הצגת רצף של נוסחאות פיזיקה, עם הכנסת הערכים 0,‏ 60 ו-7 במקומות המתאימים.
הסבירו למה המערכת בחרה את הנוסחאות האלה ומה המשמעות של המשתנים השונים.

הנחיות לגבי רצף המחשבות מאלצות את ה-LLM לבצע את כל החישובים, ויכול להיות שהן יובילו לתשובה נכונה יותר. בנוסף, ההנחיות של שרשרת המחשבות מאפשרות למשתמש לבדוק את השלבים של ה-LLM כדי לקבוע אם התשובה הגיונית.

צ'אט, צ'ט, צאט, צט

#language

#generativeAI

התוכן של דיאלוג הדדי עם מערכת למידת מכונה, בדרך כלל מודל שפה גדול. האינטראקציה הקודמת בצ'אט (מה שהקלדתם ואיך מודל השפה הגדול הגיב) הופכת להקשר של החלקים הבאים בצ'אט.

צ'אט בוט הוא יישום של מודל שפה גדול.

הטמעת שפה בהקשר

#language

#generativeAI

הטמעה שמגיעה קרוב ל'הבנה' של מילים וביטויים בדרכים שדוברים אנושיים שוטפים יכולים. הטמעות של שפה בהקשר יכולות להבין סמנטיקה, התחביר והקשר מורכבים.

לדוגמה, ניקח את הטמעות המילים של המילה האנגלית cow. הטמעות ישנות יותר, כמו word2vec, יכולות לייצג מילים באנגלית כך שהמרחק במרחב ההטמעה מ-cow ל-bull דומה למרחק מ-ewe (כבשה) ל-ram (איל) או מ-female ל-male. הטמעת שפה בהקשר יכולה להתקדם צעד נוסף על ידי זיהוי שלפעמים דוברי אנגלית משתמשים במילה cow באופן לא רשמי כדי לציין פרה או שור.

חלון ההקשר

#language

#generativeAI

מספר האסימונים שהמודל יכול לעבד בהנחיה נתונה. ככל שחלון ההקשר גדול יותר, כך המודל יכול להשתמש במידע רב יותר כדי לספק תשובות עקביות ועומדות בקו אחד להנחיה.

D

הנחיה ישירה

#language

#generativeAI

מילה נרדפת להנחיה ישירה (Zero-shot).

זיקוק

#generativeAI

תהליך הפחתת הגודל של מודל אחד (שנקרא מורה) למודל קטן יותר (שנקרא תלמיד) שמחקה את התחזיות של המודל המקורי בצורה נאמנה ככל האפשר. התהליך הזה שימושי כי למודל הקטן יש שני יתרונות מרכזיים על פני המודל הגדול (המורה):

זמן הסקת מסקנות מהיר יותר
הפחתת השימוש בזיכרון ובאנרגיה

עם זאת, התחזיות של התלמידים בדרך כלל לא טובות כמו התחזיות של המורים.

בתהליך הזיקוק, מודל התלמיד מתאמן לצמצום פונקציית אובדן על סמך ההבדל בין הפלט של התחזיות של מודל התלמיד למודל המורה.

השוו בין זיקוק לבין המונחים הבאים:

שינוי קטן
למידה מבוססת-הנחיה

מידע נוסף זמין בקטע LLMs: Fine-tuning, distillation, and prompt engineering במאמר קורס מקוצר על למידת מכונה.

E

evals

#language

#generativeAI

#Metric

משמש בעיקר כקיצור של הערכות LLM. באופן כללי, evals הוא קיצור של כל סוג של בדיקה.

הערכה

#language

#generativeAI

#Metric

התהליך של מדידת האיכות של מודל או השוואה בין מודלים שונים.

כדי להעריך מודל של למידת מכונה מבוקרת, בדרך כלל משווים אותו לקבוצת אימות ולקבוצת בדיקה. הערכת LLM כוללת בדרך כלל הערכות איכות ובטיחות רחבות יותר.

F

עובדתיות

#generativeAI

בעולם למידת המכונה, מאפיין שמתאר מודל שהפלט שלו מבוסס על המציאות. העובדתיות היא מושג ולא מדד. לדוגמה, נניח ששולחים את הפרומפט הבא למודל שפה גדול:

מהי הנוסחה הכימית של מלח שולחן?

מודל שמבצע אופטימיזציה של עובדות יגיב:

NaCl

קל להניח שכל המודלים צריכים להתבסס על עובדות. עם זאת, הנחיות מסוימות, כמו ההנחיה הבאה, אמורות לגרום למודל AI גנרטיבי לבצע אופטימיזציה של היצירתיות ולא של העובדות.

אשמח לשמוע חרוז על אסטרונאוט ועל זחל.

סביר להניח שהשיר שייווצר לא יהיה מבוסס על המציאות.

בניגוד ליצירת קשר עם הקרקע.

הנחיה עם כמה דוגמאות (Few-shot)

#language

#generativeAI

הנחיה שמכילה יותר מדוגמה אחת ('כמה' דוגמאות) שממחישות איך מודל השפה הגדול צריך להשיב. לדוגמה, ההנחיה הארוכה הבאה מכילה שתי דוגמאות שמראות למודל שפה גדול איך לענות על שאילתה.

חלקים של הנחיה אחת	הערות
`מהו המטבע הרשמי של המדינה שצוינה?`	השאלה שעליה רוצים שה-LLM יענה.
`צרפת: EUR`	דוגמה אחת.
`בריטניה: GBP`	דוגמה נוספת.
`הודו:`	השאילתה בפועל.

בדרך כלל, תוצאות של פרומפטים ל-Few-shot טובות יותר מתוצאות של פרומפטים ל-Zero-shot ושל פרומפטים ל-One-shot. עם זאת, כדי להשתמש בהנחיות עם כמה דוגמאות צריך להגדיר הנחיה ארוכה יותר.

הנחיה עם כמה דוגמאות היא סוג של למידה עם כמה דוגמאות שמופעלת בלמידה מבוססת-הנחיה.

מידע נוסף זמין בקטע הנדסת הנחיות בקורס המקוצר על למידת מכונה.

כוונון עדין

#language

#image

#generativeAI

סבב אימון שני ספציפי למשימה, שמתבצע במודל שעבר אימון מראש כדי לשפר את הפרמטרים שלו לצורך תרחיש לדוגמה ספציפי. לדוגמה, רצף האימון המלא של חלק ממודלים גדולים של שפה הוא:

אימון מראש: אימון מודל גדול של שפה על מערך נתונים כללי עצום, כמו כל הדפים של ויקיפדיה באנגלית.
התאמה אישית: אימון המודל שעבר אימון מראש לביצוע משימה ספציפית, כמו מענה לשאילתות רפואיות. תהליך השיפור כולל בדרך כלל מאות או אלפי דוגמאות שמתמקדות במשימה הספציפית.

דוגמה נוספת: רצף האימון המלא של מודל תמונה גדול הוא:

אימון מראש: אימון מודל תמונות גדול על קבוצת נתונים כללית גדולה של תמונות, כמו כל התמונות ב-Wikimedia Commons.
התאמה אישית: אימון המודל שעבר אימון מראש לביצוע משימה ספציפית, כמו יצירת תמונות של אורקות.

השיפור יכול לכלול כל שילוב של השיטות הבאות:

שינוי כל הפרמטרים הקיימים של המודל שעבר אימון מראש. התהליך הזה נקרא לפעמים כוונון מדויק מלא.
שינוי של חלק מהפרמטרים הקיימים של המודל המאומן מראש (בדרך כלל השכבות הקרובות ביותר לשכבת הפלט), תוך שמירה על הפרמטרים הקיימים האחרים ללא שינוי (בדרך כלל השכבות הקרובות ביותר לשכבת הקלט). כוונון יעיל בפרמטרים
הוספת שכבות נוספות, בדרך כלל מעל השכבות הקיימות הקרובות ביותר לשכבת הפלט.

כוונון מדויק הוא סוג של למידה באמצעות העברה. לכן, יכול להיות שבתהליך השיפור המדויק נעשה שימוש בפונקציית אובדן או בסוג מודל שונים מאלה ששימשו לאימון המודל המאומן מראש. לדוגמה, אפשר לשפר מודל תמונה גדול שעבר אימון מראש כדי ליצור מודל רגרסיה שמחזיר את מספר הציפורים בתמונה קלט.

השוואה וניגוד בין כוונון מדויק לבין המונחים הבאים:

זיקוק
למידה מבוססת-הנחיה

מידע נוסף זמין בקטע התאמה אישית במאמר קורס מקוצר על למידת מכונה.

יחס ההצלחות

#generativeAI

#Metric

מדד להערכת הטקסט שנוצר של מודל למידת מכונה. החלק של ההצלחות הוא מספר הפלט של הטקסט שנוצר 'בהצלחה' חלקי המספר הכולל של הפלט של הטקסט שנוצר. לדוגמה, אם מודל שפה גדול יצר 10 בלוקים של קוד, מתוכם 5 בוצעו בהצלחה, החלק של ההצלחות יהיה 50%.

אמנם היחס בין מספר ההצלחות למספר הניסיונות שימושי באופן כללי בתחום הסטטיסטיקה, אבל ב-ML המדד הזה שימושי בעיקר למדידת משימות שניתן לאמת, כמו יצירת קוד או בעיות מתמטיות.

G

Gemini

#language

#image

#generativeAI

הסביבה העסקית שמכילה את ה-AI המתקדם ביותר של Google. רכיבים במערכת האקולוגית הזו כוללים:

מודלים שונים של Gemini.
ממשק השיחה האינטראקטיבי למודל Gemini. המשתמשים מקלידים הנחיות ו-Gemini משיב להנחיות האלה.
ממשקי Gemini API שונים.
מוצרים עסקיים שונים שמבוססים על מודלים של Gemini, למשל Gemini for Google Cloud.

מודלים של Gemini

#language

#image

#generativeAI

מודלים מולטימודאליים מבוססי Transformer מתקדמים של Google. המודלים של Gemini תוכננו במיוחד לשילוב עם סוכנים.

המשתמשים יכולים לקיים אינטראקציה עם המודלים של Gemini במגוון דרכים, כולל באמצעות ממשק אינטראקטיבי של תיבת דו-שיח ו-SDK.

טקסט שנוצר

#language

#generativeAI

באופן כללי, הטקסט שמופק על ידי מודל למידת מכונה. כשבודקים מודלים גדולים של שפה, חלק מהמדדים משווים בין הטקסט שנוצר לבין טקסט עזר. לדוגמה, נניח שאתם מנסים לקבוע את מידת היעילות של מודל למידת מכונה בתרגום מצרפתית להולנדית. במקרה זה:

הטקסט שנוצר הוא התרגום ההולנדי שמודל ה-ML מניב.
טקסט העזר הוא התרגום ההולנדי שנוצר על ידי מתרגם אנושי (או תוכנה).

חשוב לדעת: יש שיטות הערכה שלא כוללות טקסט עזר.

בינה מלאכותית גנרטיבית

#language

#image

#generativeAI

תחום מתפתח של טרנספורמציה ללא הגדרה רשמית. עם זאת, רוב המומחים מסכימים שמודלים של AI גנרטיבי יכולים ליצור ('לגנרטור') תוכן שעומד בכל הקריטריונים הבאים:

מורכבים
עקבי
מקורית

לדוגמה, מודל של AI גנרטיבי יכול ליצור תמונות או מאמרים מתוחכמים.

גם טכנולוגיות קודמות מסוימות, כולל LSTM ו-RNN, יכולות ליצור תוכן מקורי ועקבי. יש מומחים שמתייחסים לטכנולוגיות הקודמות האלה כאל AI גנרטיבי, ויש מומחים אחרים שחושבים ש-AI גנרטיבי אמיתי דורש תוצרים מורכבים יותר ממה שאפשר ליצור באמצעות הטכנולוגיות הקודמות האלה.

בניגוד ללמידת מכונה חזוי.

תגובה מוזהבת

#language

#generativeAI

תשובה ידועה כטובה. לדוגמה, בהתאם להנחיה הבאה:

2 + 2

התשובה המושלמת היא:

4

כאן אפשר לקרוא הערות על תגובה מושלמת וטקסט עזר.

מדדי הערכה מסוימים, כמו ROUGE, משווים בין טקסט העזר לבין טקסט שנוצר על ידי מודל. כשיש תשובה נכונה אחת להנחיה, התשובה המושלמת משמשת בדרך כלל כטקסט העזר.

להנחיות מסוימות אין תשובה נכונה אחת. לדוגמה, להנחיה Summarize this document (סיכום המסמך הזה) יהיו כנראה הרבה תשובות נכונות. בפרומפטים כאלה, לרוב לא מעשי להשתמש בטקסט עזר כי המודל יכול ליצור מגוון רחב מאוד של סיכומים אפשריים. עם זאת, תשובה מוכנה מראש עשויה לעזור במצב הזה. לדוגמה, תגובה מושלמת שמכילה סיכום טוב של מסמך יכולה לעזור לאמן מערכת למתן ציונים אוטומטי לזהות דפוסים של סיכומים טובים של מסמכים.

H

הערכה אנושית

#language

#generativeAI

תהליך שבו אנשים בודקים את איכות הפלט של מודל למידת מכונה. לדוגמה, אנשים דו-לשוניים בודקים את איכות מודל התרגום של למידת המכונה. הערכה אנושית שימושית במיוחד כשבודקים מודלים שאין להם תשובה נכונה אחת.

בניגוד להערכה אוטומטית ולהערכה על ידי מערכת למתן ציונים אוטומטית.

האדם שבתהליך (HITL)

#generativeAI

ביטוי שפירושו לא מוגדר במדויק, ויכול להיות אחד מהשניים:

מדיניות של קריאה ביקורתית או ספקנית של תוצרים של AI גנרטיבי. לדוגמה, בני האדם שכותבים את מילון המונחים של ה-ML מופתעים מהיכולות של מודלים גדולים של שפה, אבל הם מודעים גם לשגיאות שהם עושים.
אסטרטגיה או מערכת שמאפשרות לאנשים לעזור בעיצוב, בהערכה ובשיפור של התנהגות המודל. כשאדם נמצא בתהליך, ה-AI יכול ליהנות גם מאינטליגנציה של מכונה וגם מאינטליגנציה אנושית. לדוגמה, מערכת שבה AI יוצר קוד שמהנדסי תוכנה בודקים לאחר מכן היא מערכת עם מעורבות אנושית.

I

למידה בהקשר

#language

#generativeAI

מונח נרדף להנחיות עם כמה דוגמאות.

התאמת הוראות

#generativeAI

סוג של כוונון עדין שמשפר את היכולת של מודל AI גנרטיבי לפעול לפי הוראות. כוונון לפי הוראות כולל אימון של מודל על סדרה של הנחיות, שבדרך כלל מכסות מגוון רחב של משימות. המודל שמתקבל מההתאמה להוראות נוטה ליצור תשובות מועילות להנחיות ללא דוגמאות במגוון משימות.

השוואה וניגוד לבין:

כוונון יעיל בפרמטרים
התאמת ההנחיות

L

LLM

#language

#generativeAI

קיצור של מודל שפה גדול (LLM).

הערכות של LLM (evals)

#language

#generativeAI

#Metric

קבוצה של מדדים ואמות מידה להערכת הביצועים של מודלים גדולים של שפה (LLMs). ברמת העל, הערכות LLM:

לעזור לחוקרים לזהות תחומים שבהם LLMs צריכים שיפור.
שימושיים להשוואה בין מודלים שונים של LLM ולזיהוי המודל הטוב ביותר למשימות מסוימות.
עוזרים לוודא שהשימוש ב-LLMs בטוח ואתי.

למידע נוסף, אפשר לקרוא את המאמר מודלים גדולים של שפה (LLMs) בקורס המקוצר על למידת מכונה.

LoRA

#language

#generativeAI

קיצור של התאמה לעומס ברמה נמוכה.

התאמה לרמה נמוכה (LoRA)

#language

#generativeAI

טכניקה יעילה מבחינת פרמטרים לכוונון עדין, שבה "מקפיאים" את המשקולות שמוגדרים מראש במודל (כך שלא ניתן יותר לשנות אותם), ולאחר מכן מוסיפים למודל קבוצה קטנה של משקולות שניתן לאמן. קבוצת המשקלים הניתנים לאימון (שנקראת גם 'מטריצות עדכון') קטנה בהרבה מהמודל הבסיסי, ולכן אימון הקבוצה הזו מהיר הרבה יותר.

היתרונות של LoRA:

שיפור האיכות של התחזיות של מודל לדומיין שבו מתבצע השיפור.
התאמה אישית מתבצעת מהר יותר מאשר בשיטות שדורשות התאמה אישית של כל הפרמטרים של המודל.
הפחתת עלות החישוב של הסקת מסקנות על ידי הפעלת הצגה בו-זמנית של כמה מודלים מיוחדים שמשתמשים באותו מודל בסיס.

לוחצים על הסמל כדי לקבל מידע נוסף על מטריצות עדכון ב-LoRa.

מטריצות העדכון שמשמשות ב-LoRA מורכבות ממטריצות פירוק לפי דירוג, שמתקבלות מהמודל הבסיסי כדי לסנן את הרעשים ולהתמקד באימון על המאפיינים החשובים ביותר של המודל.

M

תרגום אוטומטי

#generativeAI

שימוש בתוכנה (בדרך כלל מודל למידת מכונה) כדי להמיר טקסט משפה אנושית אחת לשפה אנושית אחרת, למשל מאנגלית ליפנית.

דיוק ממוצע ממוצע ב-k (mAP@k)

#language

#generativeAI

#Metric

הממוצע הסטטיסטי של כל הציונים של הדיוק הממוצע ב-k במערך נתונים לצורך אימות. אחת מהשימושים של רמת הדיוק הממוצעת הממוצעת ב-k היא להעריך את איכות ההמלצות שנוצרות על ידי מערכת המלצות.

למרות שהביטוי 'ממוצע ממוצע' נשמע מיותר, השם של המדד מתאים. אחרי הכל, המדד הזה מחשב את הממוצע של כמה ערכים של רמת דיוק ממוצעת ב-k.

לוחצים על הסמל כדי לראות דוגמה.

נניח שאתם יוצרים מערכת המלצות שיוצרת רשימה מותאמת אישית של רומנים מומלצים לכל משתמש. על סמך משוב ממשתמשים נבחרים, מחשבים את חמש רמות הדיוק הממוצעות הבאות ב-k ציונים (ציון אחד לכל משתמש):

0.73
0.77
0.67
0.82
0.76

לכן, הדיוק הממוצע הממוצע ב-K הוא:

$$\text{mean } = \frac{\text{0.73 + 0.77 + 0.67 + 0.82 + 0.76}} {\text{5}} = \text{0.75}$$

תערובת של מומחים

#language

#generativeAI

תוכנית להגדלת היעילות של רשת עצבית באמצעות שימוש רק בקבוצת משנה של הפרמטרים שלה (שנקראת מומחה) כדי לעבד אסימון או דוגמה מסוימים של קלט. רשת גידור מפנה כל אסימון קלט או דוגמה למומחים המתאימים.

פרטים נוספים זמינים במאמרים הבאים:

MMIT

#language

#image

#generativeAI

קיצור של multimodal instruction-tuned.

שרשור מודלים

#generativeAI

מערכת שבוחרת את המודל האידיאלי לשאילתת היסק ספציפית.

נניח שיש קבוצה של מודלים, החל ממודלים גדולים מאוד (עם הרבה פרמטרים) ועד למודלים קטנים בהרבה (עם הרבה פחות פרמטרים). מודלים גדולים מאוד צורכים יותר משאבי מחשוב בזמן השקלול מאשר מודלים קטנים יותר. עם זאת, בדרך כלל מודלים גדולים מאוד יכולים להסיק בקשות מורכבות יותר מאשר מודלים קטנים יותר. היררכיית המודלים קובעת את המורכבות של שאילתה ההיקש, ואז בוחרת את המודל המתאים לביצוע ההיקש. המניע העיקרי לשימוש במודלים מדורגים הוא הפחתת עלויות ההסקה על ידי בחירה במודלים קטנים יותר באופן כללי, ובחירה במודל גדול יותר רק לשאילתות מורכבות יותר.

נניח שדגם קטן פועל בטלפון וגרסה גדולה יותר של אותו דגם פועלת בשרת מרוחק. שרשור יעיל של מודלים מפחית את העלות ואת זמן האחזור, כי הוא מאפשר למודל הקטן יותר לטפל בבקשות פשוטות, ורק לקרוא למודל המרוחק כדי לטפל בבקשות מורכבות.

אפשר לעיין גם במאמר בנושא נתב מודל.

נתב מודל

#generativeAI

האלגוריתם שקובע את המודל האידיאלי להסקת מסקנות בשרשור מודלים. בדרך כלל, ניתב מודלים הוא בעצמו מודל למידת מכונה, שלומדים בהדרגה איך לבחור את המודל הטוב ביותר לקלט נתון. עם זאת, לפעמים ניתוב מודלים יכול להיות אלגוריתם פשוט יותר, ללא למידת מכונה.

MOE

#language

#image

#generativeAI

קיצור של תערובת של מומחים.

MT

#generativeAI

קיצור של תרגום אוטומטי.

לא

אין תשובה נכונה אחת (NORA)

#language

#generativeAI

הנחיה עם כמה תשובות מתאימות. לדוגמה, להנחיה הבאה אין תשובה נכונה אחת:

Tell me a joke about elephants.‎

הערכה של הנחיות ללא תשובה נכונה יכולה להיות מאתגרת.

NORA

#language

#generativeAI

קיצור של אין תשובה נכונה אחת.

O

הנחיה חד-פעמית

#language

#generativeAI

הנחיה שמכילה דוגמה אחת שמראה איך מודל השפה הגדול צריך להגיב. לדוגמה, ההנחיה הבאה מכילה דוגמה אחת שמראה למודל שפה גדול איך לענות על שאילתה.

חלקים של הנחיה אחת	הערות
`מהו המטבע הרשמי של המדינה שצוינה?`	השאלה שעליה רוצים שה-LLM יענה.
`צרפת: EUR`	דוגמה אחת.
`הודו:`	השאילתה בפועל.

הנחיה חד-פעמית לעומת המונחים הבאים:

הנחיה ישירה (zero-shot)
הנחיות עם כמה דוגמאות

P

כוונון יעיל בפרמטרים

#language

#generativeAI

קבוצה של שיטות לביצוע התאמה אישית של מודל שפה גדול (PLM) שמתאמן מראש בצורה יעילה יותר מביצוע התאמה אישית מלאה. בכוונון יעיל בפרמטרים, בדרך כלל מתבצעת התאמה אישית של פחות פרמטרים בהשוואה להתאמה אישית מלאה, אבל בדרך כלל נוצר מודל שפה גדול שמניב ביצועים טובים (או כמעט טובים) כמו של מודל שפה גדול שנוצר כתוצאה מהתאמה אישית מלאה.

השוואה בין כוונון יעיל בפרמטרים לבין:

התאמת הוראות
התאמת ההנחיות

כוונון יעיל בפרמטרים נקרא גם כוונון יעיל בפרמטרים.

PLM

#language

#generativeAI

קיצור של מודל שפה שעבר אימון מראש.

מודל לאחר אימון

#language

#image

#generativeAI

מונח לא מוגדר במדויק שמתייחס בדרך כלל למודל שהודרן מראש שעבר עיבוד פוסט-טראיטמנט, כמו אחת או יותר מהפעולות הבאות:

תמצות
כוונון עדין
התאמת הוראות

מודל שעבר אימון מקדים

#language

#image

#generativeAI

בדרך כלל, מודל שכבר אומן. המונח יכול גם להתייחס לוקטור הטמעה שעבר אימון קודם.

המונח מודל שפה שהודרן מראש מתייחס בדרך כלל למודל שפה גדול שכבר אומן.

אימון מקדים

#language

#image

#generativeAI

האימון הראשוני של מודל על מערך נתונים גדול. חלק מהמודלים שהוכשרו מראש הם 'ענקים גמלוניים', ובדרך כלל צריך לשפר אותם באמצעות אימון נוסף. לדוגמה, מומחי למידת מכונה עשויים לאמן מראש מודל שפה גדול על מערך נתונים עצום של טקסט, כמו כל הדפים באנגלית בוויקיפדיה. אחרי האימון המקדים, אפשר לשפר את המודל שנוצר באמצעות אחת מהשיטות הבאות:

זיקוק
שינוי קטן
התאמת הוראות
כוונון יעיל בפרמטרים
prompt-tuning

הנחיה

#language

#generativeAI

כל טקסט שמוזן כקלט למודל שפה גדול כדי לכוונן את המודל להתנהגות מסוימת. ההנחיות יכולות להיות קצרות כמו ביטוי או ארוכות ככל הצורך (לדוגמה, כל הטקסט של רומן). ההנחיות מחולקות לכמה קטגוריות, כולל אלה שמפורטות בטבלה הבאה:

קטגוריית ההנחיה	דוגמה	הערות
שאלה	`מהי מהירות הטיסה של יונה?`
הוראות	`כתיבת שיר מצחיק על מיקסום רווחים.`	הנחיה שמבקשת ממודל השפה הגדול לבצע משהו.
דוגמה	`תרגום קוד Markdown ל-HTML. לדוגמה: Markdown: * פריט ברשימה HTML: <ul> <li>פריט ברשימה</li> </ul>`	המשפט הראשון בהנחיה הזו הוא הוראה. שאר ההנחיה היא הדוגמה.
תפקיד	`הסבר למה נעשה שימוש בירידת שיפוע (gradient descent) באימון של למידת מכונה לצורך קבלת דוקטורט בפיזיקה.`	החלק הראשון של המשפט הוא הוראה, והביטוי "לתואר דוקטור בפיזיקה" הוא החלק של התפקיד.
קלט חלקי למודל להשלמה	`ראש ממשלת בריטניה מתגורר בכתובת`	הנחיה חלקית להזנת קלט יכולה להסתיים באופן פתאומי (כמו בדוגמה הזו) או להסתיים בקו תחתון.

מודל של בינה מלאכותית גנרטיבית יכול להגיב להנחיה באמצעות טקסט, קוד, תמונות, מיקומים מוטמעים, סרטונים… כמעט כל דבר.

למידה מבוססת-הנחיה

#language

#generativeAI

יכולת של מודלים מסוימים שמאפשרת להם להתאים את ההתנהגות שלהם בתגובה לקלט טקסט שרירותי (הנחיות). בפרדיגמה רגילה של למידה מבוססת-הנחיה, מודל שפה גדול מגיב להנחיה על ידי יצירת טקסט. לדוגמה, נניח שמשתמש מזין את ההנחיה הבאה:

לסכם את חוק התנועה השלישי של ניוטון.

מודל שיכול ללמוד על סמך הנחיות לא עובר אימון ספציפי כדי לענות על ההנחיה הקודמת. במקום זאת, המודל 'יודע' הרבה עובדות על פיזיקה, הרבה על כללי שפה כלליים והרבה על מה שמהווה תשובות מועילות באופן כללי. הידע הזה מספיק כדי לספק תשובה (מקווה) שימושית. משוב אנושי נוסף ('התשובה הזו הייתה מורכבת מדי' או 'מהי תגובה?') מאפשר לחלק ממערכות הלמידה שמבוססות על הנחיות לשפר בהדרגה את התועלת של התשובות שלהן.

עיצוב הנחיות

#language

#generativeAI

מילה נרדפת ל-הנדסת הנחיות.

הנדסת הנחיות

#language

#generativeAI

האמנות של יצירת הנחיות שמניבות את התשובות הרצויות ממודל שפה גדול. בני אדם מבצעים את תהליך הנדסת ההנחיות. כתיבת הנחיות עם מבנה טוב היא חלק חיוני כדי לקבל תשובות מועילות ממודל שפה גדול. תכנון ההנחיות תלוי בגורמים רבים, כולל:

מערך הנתונים שמשמש לאימון מקדים ולפעמים גם לכוונון עדין של מודל השפה הגדול.
הטמפרטורה ופרמטרים אחרים של פענוח שבהם המודל משתמש כדי ליצור תשובות.

עיצוב הנחיות הוא מונח נרדף להנדסת הנחיות.

מבוא לתכנון הנחיות – מידע נוסף על כתיבת הנחיות מועילות.

כוונון של הנחיות

#language

#generativeAI

מנגנון כוונון יעיל בפרמטרים שמלמד 'תחילית' שהמערכת מצרפת להנחיה בפועל.

וריאציה אחת של התאמת ההנחיה – שנקראת לפעמים התאמת תחילית – היא הוספת התחילית לכל שכבה. לעומת זאת, רוב ההתאמות של ההנחיות מוסיפות רק קידומת לשכבת הקלט.

אפשר ללחוץ על הסמל כדי לקבל מידע נוסף על תחיליות.

לצורך כוונון של הנחיה, ה'קידומת' (שנקראת גם 'הנחיה רכה') היא קבוצה של וקטורים ספציפיים למשימה שנלמדו, שמתווספים ל-embeddings של אסימוני הטקסט מהנחיה בפועל. כדי ללמוד את ההנחיה הלא רשמית, המערכת מקפיאה את כל שאר הפרמטרים של המודל ומבצעת כוונון עדין למשימה ספציפית.

R

טקסט עזר

#language

#generativeAI

תשובה של מומחה להנחיה. לדוגמה, בהנחיה הבאה:

תרגום השאלה "What is your name?‎" מאנגלית לצרפתית.

התשובה של המומחה עשויה להיות:

Comment vous appelez-vous?

מדדים שונים (כמו ROUGE) מודדים את מידת ההתאמה בין טקסט העזר לבין הטקסט שנוצר על ידי מודל ה-ML.

למידת חיזוק ממשוב אנושי (RLHF)

#generativeAI

#rl

שימוש במשוב מדרגים אנושיים כדי לשפר את איכות התשובות של מודל. לדוגמה, מנגנון RLHF יכול לבקש מהמשתמשים לדרג את האיכות של התשובה של המודל באמצעות אמוג'י 👍 או 👎. לאחר מכן, המערכת תוכל לשנות את התשובות העתידיות שלה על סמך המשוב הזה.

הצגת הנחיות לגבי התפקיד

#language

#generativeAI

חלק אופציונלי בהנחיה שמזהה את קהל היעד לתשובה של מודל AI גנרטיבי. ללא הנחיה לגבי תפקיד, מודל שפה גדול מספק תשובה שעשויה להיות או לא להיות שימושית לאדם ששואל את השאלות. בעזרת הנחיה לגבי תפקיד, מודל שפה גדול יכול לתת תשובות שתואמות יותר לקהל יעד ספציפי ומועילות יותר עבורו. לדוגמה, החלק של הנחיות התפקיד בהנחיות הבאות מודגש:

לעבודת דוקטורט בכלכלה:
תארו את האופן שבו פועלות הגאות והשפל לילדים בני עשר.
הסבר על המשבר הפיננסי של 2008. דברו כמו שאתם מדברים עם ילד קטן או עם גולדן רטריבר.

S

כוונון של הנחיות רכות

#language

#generativeAI

טכניקה לכוונון מודל שפה גדול למשימה מסוימת, בלי כוונון עדין שמצריך הרבה משאבים. במקום לאמן מחדש את כל המשקלים במודל, התאמת ההנחיה הרכה משנה באופן אוטומטי את ההנחיה כדי להשיג את אותו יעד.

בהנחיית טקסט, בדרך כלל מתבצעת התאמה של ההנחיה באמצעות הטמעת טוקנים נוספים בהנחיה, ושימוש בהתפשטות לאחור (backpropagation) כדי לבצע אופטימיזציה של הקלט.

הנחיה 'קשה' מכילה טוקנים אמיתיים במקום הטמעות של טוקנים.

T

טמפרטורה

#language

#image

#generativeAI

פרמטר היפר שקובע את מידת הרנדומיזציה של הפלט של מודל. ככל שהטמפרטורה גבוהה יותר, התוצאה תהיה יותר אקראית, ואילו ככל שהטמפרטורה נמוכה יותר, התוצאה תהיה פחות אקראית.

בחירת הטמפרטורה הטובה ביותר תלויה באפליקציה הספציפית ובמאפיינים המועדפים של הפלט של המודל. לדוגמה, כדאי להגדיל את הטמפרטורה כשיוצרים אפליקציה שמפיקה נכסי קריאייטיב. לעומת זאת, כשיוצרים מודל לסיווג תמונות או טקסט, כדאי להוריד את הטמפרטורה כדי לשפר את הדיוק והעקביות של המודל.

טמפרטורה משמשת לרוב עם softmax.

Z

הנחיה ישירה (Zero-shot)

#language

#generativeAI

הנחיה שלא מספקת דוגמה לאופן שבו אתם רוצים שמודל השפה הגדול יגיב. לדוגמה:

חלקים של הנחיה אחת	הערות
`מהו המטבע הרשמי של המדינה שצוינה?`	השאלה שעליה רוצים שה-LLM יענה.
`הודו:`	השאילתה בפועל.

מודל השפה הגדול עשוי להשיב באחת מהאפשרויות הבאות:

רופיות
INR
₹
רופי הודי
הרופי
הרופי ההודי

כל התשובות נכונות, אבל יכול להיות שתעדיפו פורמט מסוים.

השוואה בין הנחיה ללא טירגוט לבין המונחים הבאים:

הנחיה עם דוגמה אחת (one-shot)
הנחיות עם כמה דוגמאות

מילון מונחים ללמידת מכונה: בינה מלאכותית גנרטיבית קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

A

הערכה אוטומטית

הערכה של המערכת האוטומטית

מודל אוטו-רגרסיבי

C

הנחיות בטכניקת שרשרת מחשבה

צ'אט, צ'ט, צאט, צט

הטמעת שפה בהקשר

חלון ההקשר

D

הנחיה ישירה

זיקוק

E

evals

הערכה

F

עובדתיות

הנחיה עם כמה דוגמאות (Few-shot)

כוונון עדין

יחס ההצלחות

G

Gemini

מודלים של Gemini

טקסט שנוצר

בינה מלאכותית גנרטיבית

תגובה מוזהבת

כאן אפשר לקרוא הערות על תגובה מושלמת וטקסט עזר.

H

הערכה אנושית

האדם שבתהליך (HITL)

I

למידה בהקשר

התאמת הוראות

L

LLM

הערכות של LLM (evals)

LoRA

התאמה לרמה נמוכה (LoRA)

לוחצים על הסמל כדי לקבל מידע נוסף על מטריצות עדכון ב-LoRa.

M

תרגום אוטומטי

דיוק ממוצע ממוצע ב-k (mAP@k)

לוחצים על הסמל כדי לראות דוגמה.

תערובת של מומחים

MMIT

שרשור מודלים

נתב מודל

MOE

MT

לא

אין תשובה נכונה אחת (NORA)

NORA

O

הנחיה חד-פעמית

P

כוונון יעיל בפרמטרים

PLM

מודל לאחר אימון

מודל שעבר אימון מקדים

אימון מקדים

הנחיה

למידה מבוססת-הנחיה

עיצוב הנחיות

הנדסת הנחיות

כוונון של הנחיות

אפשר ללחוץ על הסמל כדי לקבל מידע נוסף על תחיליות.

R

טקסט עזר

למידת חיזוק ממשוב אנושי (RLHF)

הצגת הנחיות לגבי התפקיד

S

כוונון של הנחיות רכות

T

טמפרטורה

Z

הנחיה ישירה (Zero-shot)

מילון מונחים ללמידת מכונה: בינה מלאכותית גנרטיבית