יישום המודל

כשמטמיעים מודל, כדאי להתחיל בפשוט. רוב העבודה ב-ML מתבצעת בצד הנתונים, ולכן קשה יותר להפעיל צינור נתונים מלא למודל מורכב מאשר לבצע איטרציות על המודל עצמו. אחרי שמגדירים את צינור עיבוד הנתונים ומטמיעים מודל פשוט שמשתמש בכמה תכונות, אפשר להמשיך בתהליך היצירה של מודל טוב יותר.

מודלים פשוטים מספקים בסיס טוב, גם אם בסופו של דבר לא תפעילו אותם. למעשה, השימוש במודל פשוט כנראה טוב יותר ממה שאתם חושבים. כשמתחילים עם מודל פשוט, קל יותר לקבוע אם מודל מורכב בכלל מוצדק.

אימון מודל משלכם לעומת שימוש במודל שכבר אומן

יש מודלים מאומנים למגוון תרחישים לדוגמה, והם מציעים יתרונות רבים. עם זאת, מודלים מאומנים פועלים בצורה טובה רק כשהתווית והמאפיינים תואמים בדיוק למערך הנתונים שלכם. לדוגמה, אם מודל מאומן משתמש ב-25 מאפיינים ומערך הנתונים כולל רק 24 מהם, סביר להניח שהמודל המאומן יספק תחזיות לא טובות.

בדרך כלל, מומחי למידת מכונה משתמשים בקטעים תואמים של קלט ממודל מאומן כדי לבצע שיפורים או העברה של למידת מכונה. אם אין מודל מאומן לתרחיש לדוגמה הספציפי שלכם, כדאי להשתמש בקטעים ממודל מאומן כשמאמנים מודל משלכם.

מידע על מודלים שהוכשרו זמין במאמר

מעקב

כשמגדירים את הבעיה, חשוב להביא בחשבון את התשתית למעקב ולקבלת התראות שדרושה לפתרון ה-ML.

פריסת מודלים

במקרים מסוימים, מודל חדש שהוכשר עשוי להיות גרוע יותר מהמודל שנמצא כרגע בסביבת הייצור. אם כן, תרצו למנוע את השקת הגרסה בסביבת הייצור ולקבל התראה על כך שהפריסה האוטומטית נכשלה.

הטיה של מודלים באימון למודלים שמוצגים

אם לחלק מהמאפיינים הנכנסים שמשמשים להסקה יש ערכים שנמצאים מחוץ לטווח ההתפלגות של הנתונים ששימשו לאימון, כדאי לקבל התראה כי סביר להניח שהמודל יספק תחזיות לא טובות. לדוגמה, אם המודל שלכם אומן לחזות טמפרטורות בערים בקו המשווה בגובה פני הים, מערכת ההצגה צריכה להתריע על נתונים נכנסים עם קווים לאורך ולרוחב ו/או גובהים מחוץ לטווח שבו המודל אומן. לעומת זאת, מערכת ההצגה אמורה להתריע אם המודל מניב תחזיות שמחוץ לטווח ההתפלגות שנצפה במהלך האימון.

שרת להסקה

אם אתם מספקים מסקנות באמצעות מערכת RPC, כדאי לעקוב אחרי שרת ה-RPC עצמו ולקבל התראה אם הוא יפסיק לספק מסקנות.