Aşağıdaki seçenekleri inceleyin.
.
Kaliforniya'daki farklı şehirlerde belirgin farklar vardır.
konut fiyatları.
Konut fiyatlarını tahmin etmek için bir model oluşturmanız gerektiğini varsayalım. Aşağıdakilerden hangisi
veya özellik setlerini takip ederek
roomsPerPerson ile arasındaki şehre özgü ilişkiler
konut fiyatı nedir?
Üç ayrı gruplanmış özellik: [binned latitude],
[bined longitude], [binned odalarPerPerson]
Bağlama iyidir çünkü modelin doğrusal olmayan,
ilişkilerini ölçtüğünüz aşamadır. Ancak bir şehir
birden fazla boyuttan daha fazlasıdır. Böylece, şehre özgü ilişkileri
enlem ve boylamın geçmesini gerektirir.
Tek özellik çapraz: [enlem X boylam X
roomsPerPerson]
Bu örnekte, gerçek değerli özellikleri geçmek iyi bir fikir değildir.
Örneğin enlemin gerçek değerini
RoomPerPerson, bir özellikte (örneğin, enlem) %10 değişiklik yapılmasını sağlıyor
diğer özellikteki% 10'luk bir değişikliğe eşdeğer olacaktır (örneğin,
kişi Başı Oda).
Bir özellik arası: [bined latitude X binned longitude X binned (binli enlem X)
roomsPerPerson]
Bağlanmış enlemi, bağlı boylamla geçmek
modelini kullanır.
Gruplama, aynı sonucu üreten enlemde bir değişikliği önler
boylam değişikliği olarak gösterir. Projenin ayrıntı düzeyine bağlı olarak,
bu özellik çarpışmasıyla şehre özgü
mahalleye, hatta bloka özgü efektler bile kullanabilirsiniz.
İki özellik geçişi: [binned latitude X binnedRoomPerPerson]
ve [binned longitude X binnedRoomPerPerson]
Bölme iyi bir fikirdir Ancak şehir aynı zamanda
bir enlem ve boylama sahip olduğundan, ayrı özellik kesişimleri
şehirlere özgü fiyatları öğrenerek model oluşturabilirsiniz.