טרנספורמציה של נתונים מספריים

ייתכן שתצטרכו להחיל שני סוגי טרנספורמציות על נתונים מספריים:

  • נרמול – טרנספורמציה של נתונים מספריים בקנה מידה זהה לזה של נתונים מספריים אחרים.
  • Bucket – המרת נתונים מספריים (בדרך כלל רציפים) לנתונים לקטגוריות.

למה לנרמל תכונות מספריות?

מומלץ מאוד לנרמל קבוצת נתונים עם מאפיינים מספריים שמכסה טווחים שונים (לדוגמה, גיל והכנסה). כשלתכונות שונות יש טווחים שונים, ירידה הדרגתית יכולה להאט ולהאט. כלי אופטימיזציה כמו Adadge ו-Adam מגנים על הבעיה על ידי יצירת שיעור למידה נפרד ונפרד לכל תכונה.

מומלץ גם לנרמל תכונה מספרית אחת שמכסה טווח רחב, כגון "citycity." אם לא תבצעו נורמליזציה של התכונה "עיר האוכלוסייה" אימון הדגם עלול לגרום לשגיאות NaN. לצערנו, כלי אופטימיזציה כמו Adagrad ו-AD3 לא יכולים למנוע שגיאות NaN כאשר יש מגוון רחב של ערכים בתכונה אחת.