חוצה תכונות: בדיקת ההבנה שלכם

כדאי לעיין באפשרויות הבאות.

לערים שונות בקליפורניה יש מחירים שונים לדיור. נניח שצריך ליצור מודל כדי לחזות מחירי דיור. אילו מהקבוצות הבאות של תכונות או צלבים של תכונות יכולות ללמוד על קשרים ספציפיים לעיר, בין roomsPerPerson למחיר הדיור?
שלוש תכונות נפרדות בינאריות: [Lineed width], [binified Length], [binified roomsPerPerson]
קישור הנתונים טוב כי הוא מאפשר למודל ללמוד קשרים לא לינאריים בתכונה אחת. עם זאת, עיר מסוימת מופיעה ביותר ממאפיין אחד, ולכן כדי ללמוד על קשרים ספציפיים לעיר צריך לחצות קווי רוחב ואורך.
תכונה אחת: [רוחב X קו האורך חדריםPerPerson]
בדוגמה הזו, חפיפה בין תכונות שיש להן ערך אמיתי לא מומלצת. חציית הערך האמיתי של, קו הרוחב, עם roomPerPerson מאפשרת שינוי של 10% בתכונה אחת (למשל, קו רוחב) כשווה לשינוי של 10% בתכונה השנייה (למשל, WindowsPerPerson).
פיצ'ר אחד: [Line line X binden Length X binden Length roomsperPerson]
קו רוחב מפוקח עם קו אורך מקושת מאפשר למודל ללמוד השפעות ספציפיות על חדרים לכל אדם. Binting מונע שינוי בקו הרוחב שיוצר את אותה תוצאה כמו שינוי בקו האורך. בהתאם לרמת הפירוט של הסלים, הצלב של התכונה הזו יכול ללמוד השפעות ספציפיות לעיר או ספציפית לשכונה או אפילו לחסימות ספציפיות.
שני צלבים של פיצ'רים: [Binden width X binden roomsPerPerson] ו-[Binden Length X binified roomsPerPerson]
שילוב הוא רעיון טוב. עם זאת, עיר היא שילוב של קו רוחב וקו אורך, לכן תכונות שונות חוסכות את המודל כדי ללמוד מחירים ספציפיים לעיר.