สำรวจตัวเลือกด้านล่าง

เมืองต่างๆ ในแคลิฟอร์เนียมีความแตกต่างกันอย่างชัดเจน ราคาที่พักอาศัย สมมติว่าคุณต้องสร้างโมเดลเพื่อคาดการณ์ราคาที่อยู่อาศัย ข้อใดต่อไปนี้คือ ชุดคุณลักษณะหรือข้ามฟีเจอร์ต่อไปนี้สามารถเรียนรู้ ความสัมพันธ์เฉพาะเมืองระหว่าง roomsPerPerson กับ ราคาที่อยู่อาศัยมีอะไรบ้าง
คุณลักษณะแบบ Binned 3 แบบแยกกัน: [ละติจูดแบบยึดหลักการ], [ลองจิจูดแบบ Binned] และ [binned roomPerPerson]
Binning มีประโยชน์ดีเพราะช่วยให้โมเดลเรียนรู้แบบไม่ใช่เชิงเส้น ความสัมพันธ์ภายในฟีเจอร์เดียว อย่างไรก็ตาม มีเมืองอยู่ใน มากกว่าหนึ่งมิติข้อมูล ดังนั้นการเรียนรู้ความสัมพันธ์เฉพาะเมือง ต้องข้ามละติจูดและลองจิจูด
ข้ามจุดสนใจหนึ่ง: [ละติจูด X ลองจิจูด X roomsPerPerson]
ในตัวอย่างนี้ การข้ามฟีเจอร์ที่มีค่าจริงไม่ใช่แนวคิดที่ดี ข้ามค่าจริง เช่น ละติจูดกับ RoomPerPerson เปิดใช้การเปลี่ยนแปลง 10% ในฟีเจอร์เดียว (เช่น ละติจูด) จะเทียบเท่ากับการเปลี่ยนแปลง 10% ในอีกฟีเจอร์หนึ่ง (เช่น ห้องต่อคน)
ข้ามจุดสนใจหนึ่ง: [พิกัดละติจูด X binned ลองจิจูด X binned roomsPerPerson]
การข้ามเส้นละติจูดและลองจิจูด โมเดลเพื่อเรียนรู้ผลกระทบในแต่ละเมืองของ roomPerPerson การเชื่อมโยงป้องกันการเปลี่ยนแปลงในละติจูดซึ่งทำให้เกิดผลลัพธ์เดียวกัน เป็นการเปลี่ยนแปลงลองจิจูด ขึ้นอยู่กับรายละเอียดของ ถัง ไม้กางเขน ลักษณะนี้สามารถเรียนรู้เจาะจงเมือง หรือ เอฟเฟกต์เฉพาะย่านหรือแม้แต่แบบบล็อก
เครื่องหมายกากบาทสองคุณลักษณะ: [binned latitude X binned roomPerPerson] และ [binned longitude X binned roomPerPerson]
Binning เป็นความคิดที่ดี แต่เมืองเป็นองค์ประกอบ ละติจูดและลองจิจูด ดังนั้นการข้ามจุดสนใจที่แยกกันจึงป้องกัน จากการเรียนรู้ราคาเฉพาะเมือง