נתונים מספריים אמיתיים
יכול להיות מוכפל בצורה משמעותית. לדוגמה, כדאי לקחת בחשבון
שמזהה את הערך של בית על סמך השטח שלו.
לתשומת ליבכם: מודל שימושי להערכת מחירי בית בדרך כלל מסתמך על
מאות תכונות. וגם כל השאר שווה, בית בגודל 200 ריבוע
מטרים צריכים להיות בעלי ערך כפול בערך של בית זהה בגודל 100 מטרים
מטרים.
לעיתים קרובות יש לייצג תכונות שמכילות ערכים של מספרים שלמים
נתונים קטגוריים במקום נתונים מספריים. לדוגמה, נניח שאתם יכולים להזין דואר
רכיב קוד שבו הערכים הם מספרים שלמים. אם אתם מייצגים
מבחינה מספרית ולא באופן קטגורי, צריך לשאול את המודל
כדי למצוא קשר מספרי
בין מספרי מיקוד שונים. כלומר, אתם אומרים למודל
להתייחס למיקוד 20004 כאל אות גדול פי שניים (או חצי) כמו של מיקוד
10002. ייצוג של מספרי מיקוד כנתונים קטגוריים מאפשר למודל
משקל לכל מיקוד בנפרד.
קידוד
קידוד הוא המרה של נתונים קטגוריים או נתונים אחרים לווקטורים מספריים
שלפיהם מודל יכול לאמן את המודל. ההמרה הזו נדרשת כי מודלים יכולים
לאמן רק לפי ערכי נקודה צפה (floating-point). מודלים לא יכולים לאמן מחרוזות כמו
"dog" או "maple". במודול הזה נסביר
שיטות קידוד לנתונים קטגוריים.
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"חסרים לי מידע או פרטים"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"התוכן מורכב מדי או עם יותר מדי שלבים"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"התוכן לא עדכני"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"בעיה בתרגום"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"בעיה בדוגמאות/בקוד"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"סיבה אחרת"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"התוכן קל להבנה"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"התוכן עזר לי לפתור בעיה"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"סיבה אחרת"
}]
{"lastModified": "\u05e2\u05d3\u05db\u05d5\u05df \u05d0\u05d7\u05e8\u05d5\u05df: 2024-08-13 (\u05e9\u05e2\u05d5\u05df UTC)."}
[[["התוכן קל להבנה","easyToUnderstand","thumb-up"],["התוכן עזר לי לפתור בעיה","solvedMyProblem","thumb-up"],["סיבה אחרת","otherUp","thumb-up"]],[["חסרים לי מידע או פרטים","missingTheInformationINeed","thumb-down"],["התוכן מורכב מדי או עם יותר מדי שלבים","tooComplicatedTooManySteps","thumb-down"],["התוכן לא עדכני","outOfDate","thumb-down"],["בעיה בתרגום","translationIssue","thumb-down"],["בעיה בדוגמאות/בקוד","samplesCodeIssue","thumb-down"],["סיבה אחרת","otherDown","thumb-down"]],["עדכון אחרון: 2024-08-13 (שעון UTC)."]]