Sự khác biệt về tính năng: Kiểm tra mức độ hiểu biết của bạn

Hãy khám phá các lựa chọn bên dưới.

Các thành phố khác nhau ở California đã có giá nhà khác nhau đáng kể. Giả sử bạn phải tạo một mô hình để dự đoán giá nhà ở. Bộ tính năng hoặc nhóm tính năng nào sau đây có thể tìm hiểu mối quan hệ theo thành phố cụ thể giữa roomsPerPerson và giá nhà ở?
Ba tính năng liên kết riêng biệt: [vĩ độ vĩ độ], [kinh độ nhị phân], [phòng liên kết theo người]
Kết hợp tốt vì mô hình này cho phép mô hình học các mối quan hệ phi tuyến tính trong một tính năng duy nhất. Tuy nhiên, một thành phố tồn tại trong nhiều phương diện. Vì vậy, việc tìm hiểu mối quan hệ với một thành phố cụ thể sẽ đòi hỏi phải vượt qua vĩ độ và kinh độ.
Một đặc điểm chéo: [vĩ độ X kinh độ X phòng mỗi người]
Trong ví dụ này, bạn không nên sử dụng nhiều tính năng thực có giá trị. Theo đó, việc vượt qua giá trị thực của vĩ độ với roomPerPerson sẽ cho phép 10% thay đổi về một tính năng (ví dụ: vĩ độ) tương đương với sự thay đổi 10% đối với tính năng còn lại (chẳng hạn như roomPerPerson).
Một đặc điểm chéo: [vĩ độ hai chiều X kinh độ bị trùng lặp X nhị phân phòng mỗi người]
Kết hợp vĩ độ nhị phân với kinh độ nhị phân cho phép mô hình này tìm hiểu tác động của các phòng perPerson đối với từng thành phố. Kết hợp sẽ ngăn sự thay đổi về vĩ độ tạo ra cùng một kết quả với sự thay đổi về kinh độ. Tuỳ thuộc vào độ chi tiết của thùng rác, tính năng này có thể tìm hiểu hiệu ứng theo từng thành phố hoặc khu vực cụ thể hoặc thậm chí là theo các khối cụ thể.
Hai tính năng được phân chia: [vĩ độ theo vĩ độ X của phòng hai chiều theo người] [kinh độ nhị phân có liên kết X phòng mỗi người]
Tốt nhất là bạn nên kết hợp các thành phố với nhau; tuy nhiên, một thành phố là sự kết hợp giữa vĩ độ và kinh độ, vì vậy, các tính năng riêng biệt sẽ ngăn mô hình tìm hiểu giá của từng thành phố.