מסגור: בדיקת ההבנה שלכם

למידה בפיקוח

כדאי לעיין באפשרויות הבאות.

נניח שאתם רוצים לפתח מודל של למידה חישובית מבוקרת כדי לחזות אם כתובת אימייל מסוימת היא "ספאם" או &"לא ספאם." אילו מההצהרות הבאות נכונות?
אימיילים שאינם מסומנים כ-"ספאם" או &"לא ספאם" הם דוגמאות ללא תוויות.
מכיוון שהתווית מכילה את הערכים "ספאם" ו-"לא ספאם", כל כתובת אימייל שעדיין לא סומנה כספאם או לא ספאם היא דוגמה ללא תווית.
מילים בכותרת הנושא יהיו תוויות טובות.
מילים שמופיעות בכותרת של נושא עשויות להניב תכונות נהדרות, אבל הן לא ייצרו תוויות טובות.
נשתמש בדוגמאות ללא תווית כדי לאמן את המודל.
נשתמש בדוגמאות תוויות כדי לאמן את המודל. לאחר מכן נוכל להפעיל את המודל המיומן כנגד דוגמאות ללא תווית כדי להסיק אם הודעות האימייל שלא מסומנות בתווית הן ספאם או לא.
התוויות שהוחלו על דוגמאות מסוימות עשויות להיות לא אמינות.
בהחלט. חשוב לבדוק את מידת האמינות של הנתונים שלך. יכול להיות שהתוויות למערך הנתונים הזה מגיעות ממשתמשי אימייל שמסמנים הודעות אימייל מסוימות כספאם. מכיוון שרוב המשתמשים לא מסמנים כל הודעת אימייל חשודה כספאם, יכול להיות שנקשה לדעת אם הודעת אימייל היא ספאם. בנוסף, שולחי ספאם עלולים הרעה מכוונת את המודל שלנו על ידי ציון תוויות שגויות.

תכונות ותוויות

כדאי לעיין באפשרויות הבאות.

נניח שחנות נעליים מקוונת רוצה ליצור מודל למידת מכונה (ML) בפיקוח שיספק למשתמשים המלצות נעליים בהתאמה אישית. כלומר, במודל הזה יומלצו זוגות נעליים למרטי וזוגות נעליים שונים לג'נט. המערכת תשתמש בנתוני התנהגות משתמשים קודמים כדי ליצור נתוני הדרכה. אילו מההצהרות הבאות נכונות?
"Ssize size" היא תכונה שימושית.
"Ssize size" הוא אות כמותי שכנראה יש לו השפעה משמעותית על שביעות הרצון של המשתמש מהנעליים המומלצות. לדוגמה, אם Marty לובשת מידה 9, הדגם לא צריך להמליץ על נעליים במידה 7.
"Shoe טיפוח ויופי; היא תכונה שימושית.
התכונות הטובות הן בטון וניתן לכימות. יופי הוא מושג מעורפל מדי ולכן הוא משמש כתכונה מועילה. כנראה שיופי הוא שילוב של תכונות בטון מסוימות, כמו סגנון וצבע. סגנון וצבע יהיו תכונות טובות יותר מיופי.
"המשתמש לחץ על הנעל'התיאור.
סביר להניח שהמשתמשים ירצו לקרוא רק על הנעליים שהם אוהבים. המדד 'קליקים לפי משתמשים' הוא מדד שניתן למדידה וניתנות למדידה. הוא יכול לשמש כתווית הדרכה טובה. מכיוון שנתוני האימון נגזרים מהתנהגות המשתמשים בעבר, אנחנו צריכים להתבסס על התוויות שלנו על סמך התנהגויות אובייקטיביות, כמו קליקים שתואמים מאוד להעדפות משתמש.
" נעליים שמשתמש אוהב
הקצאה אינה מדד הניתן למדידה או לכימות. הדבר הטוב ביותר שאנחנו יכולים לעשות הוא לחפש מדדי שרת proxy גלויים להערכה.