สำรวจตัวเลือกด้านล่าง
เมืองต่างๆ ในแคลิฟอร์เนียมีความแตกต่างกันอย่างชัดเจน
ราคาที่พักอาศัย
สมมติว่าคุณต้องสร้างโมเดลเพื่อคาดการณ์ราคาที่อยู่อาศัย ข้อใดต่อไปนี้คือ
ชุดคุณลักษณะหรือข้ามฟีเจอร์ต่อไปนี้สามารถเรียนรู้
ความสัมพันธ์เฉพาะเมืองระหว่าง
roomsPerPerson กับ
ราคาที่อยู่อาศัยมีอะไรบ้าง
คุณลักษณะแบบ Binned 3 แบบแยกกัน: [ละติจูดแบบยึดหลักการ],
[ลองจิจูดแบบ Binned] และ [binned roomPerPerson]
Binning มีประโยชน์ดีเพราะช่วยให้โมเดลเรียนรู้แบบไม่ใช่เชิงเส้น
ความสัมพันธ์ภายในฟีเจอร์เดียว อย่างไรก็ตาม มีเมืองอยู่ใน
มากกว่าหนึ่งมิติข้อมูล ดังนั้นการเรียนรู้ความสัมพันธ์เฉพาะเมือง
ต้องข้ามละติจูดและลองจิจูด
ข้ามจุดสนใจหนึ่ง: [ละติจูด X ลองจิจูด X
roomsPerPerson]
ในตัวอย่างนี้ การข้ามฟีเจอร์ที่มีค่าจริงไม่ใช่แนวคิดที่ดี
ข้ามค่าจริง เช่น ละติจูดกับ
RoomPerPerson เปิดใช้การเปลี่ยนแปลง 10% ในฟีเจอร์เดียว (เช่น ละติจูด)
จะเทียบเท่ากับการเปลี่ยนแปลง 10% ในอีกฟีเจอร์หนึ่ง (เช่น
ห้องต่อคน)
ข้ามจุดสนใจหนึ่ง: [พิกัดละติจูด X binned ลองจิจูด X binned
roomsPerPerson]
การข้ามเส้นละติจูดและลองจิจูด
โมเดลเพื่อเรียนรู้ผลกระทบในแต่ละเมืองของ roomPerPerson
การเชื่อมโยงป้องกันการเปลี่ยนแปลงในละติจูดซึ่งทำให้เกิดผลลัพธ์เดียวกัน
เป็นการเปลี่ยนแปลงลองจิจูด ขึ้นอยู่กับรายละเอียดของ
ถัง ไม้กางเขน ลักษณะนี้สามารถเรียนรู้เจาะจงเมือง หรือ
เอฟเฟกต์เฉพาะย่านหรือแม้แต่แบบบล็อก
เครื่องหมายกากบาทสองคุณลักษณะ: [binned latitude X binned roomPerPerson]
และ [binned longitude X binned roomPerPerson]
Binning เป็นความคิดที่ดี แต่เมืองเป็นองค์ประกอบ
ละติจูดและลองจิจูด ดังนั้นการข้ามจุดสนใจที่แยกกันจึงป้องกัน
จากการเรียนรู้ราคาเฉพาะเมือง