Bu örnekte, gözetim altındaki benzerlik önlemlerinde kullanılan yerleştirmelerin nasıl oluşturulacağı gösterilmektedir.
Manuel benzerlik ölçüsü oluştururken kullandığınız konut veri kümesine sahip olduğunuzu varsayalım:
Özellik | Tür |
---|---|
Fiyat | Pozitif tam sayı |
Boyut | Metrekare cinsinden pozitif kayan nokta değeri |
Posta kodu | Tamsayı |
Yatak odası sayısı | Tamsayı |
Ev türü | "tek_aile", "çok aileli", "daire", "parti"den bir metin değeri |
Garaj | Hayır/evet için 0/1 |
Renkler | Çok değerli kategorik: "beyaz", "sarı", "yeşil" standart renklerden bir veya daha fazla değer |
Ön İşleme Verileri
Özellik verilerini giriş olarak kullanmadan önce verileri önceden işlemeniz gerekir. Ön işleme adımları, manuel benzerlik ölçüsü oluştururken uyguladığınız adımları temel alır. Yeniliklerin özetini aşağıda bulabilirsiniz.
Özellik | Tür veya Dağıtım | İşlem |
---|---|---|
Fiyat | Poisson dağılımı | Ölçün ve [0,1] olarak ölçeklendirin. |
Boyut | Poisson dağılımı | Ölçün ve [0,1] olarak ölçeklendirin. |
Posta kodu | Kategorik | Boylamları ve enlemi dönüştürün, nicelik olarak ayarlayın ve [0,1] olarak ölçeklendirin. |
Yatak odası sayısı | Tamsayı | Aykırı değerleri kırpın ve [0,1] olarak ölçeklendirin. |
Ev türü | Kategorik | Tek sıcak kodlamaya dönüştürün. |
Garaj | 0 veya 1 | Olduğu gibi kalsın. |
Renkler | Kategorik | RGB değerlerini dönüştür ve sayısal veri olarak işleyin. |
Tek seferlik kodlama hakkında daha fazla bilgi için Yerleştirmeler: Kategorik Giriş Verileri bölümüne bakın.
Tahmin Aracı veya Otomatik Kodlayıcıyı Seçin
Yerleştirme oluşturmak için bir otomatik kodlayıcı veya tahmin edici seçebilirsiniz. Varsayılan tercihinizin otomatik kodlayıcı olduğunu unutmayın. Benzerliği veri kümenizdeki belirli özellikler belirliyorsa bunun yerine bir tahminci seçersiniz. Bütünlüğü sağlamak için her iki duruma da bakalım.
Tahmini Eğiten
Örneklerinizin benzerliğini belirlemede önemli olan bu özellikleri, DNN'niz için eğitim etiketleri olarak seçmeniz gerekir. Evler arasındaki benzerliğin belirlenmesinde fiyatın en önemli olduğunu varsayalım.
Eğitim etiketi olarak fiyatı seçin ve giriş özelliği verilerinden DNN'ye kaldırın. Giriş verisi olarak diğer tüm özellikleri kullanarak DNN'yi eğitin. Eğitim için kayıp işlevi, tahmini ve gerçek fiyat arasındaki MSE'dir. DNN'yi nasıl eğiteceğinizi öğrenmek için Nöral Ağları Eğitim bölümüne bakın.
Otomatik Kodlayıcı Eğitme
Aşağıdaki adımları uygulayarak veri kümemizde bir otomatik kodlayıcıyı eğitin:
- Otomatik kodlayıcının gizli katmanlarının giriş ve çıkış katmanlarından küçük olduğundan emin olun.
- Her bir çıkışın kaybını Gözetimli Benzerlik Ölçümü'nde açıklandığı şekilde hesaplayın.
- Her çıkışın kayıplarını toplayarak kayıp işlevini oluşturun. Zayıflamanın her özellik için eşit şekilde yapıldığından emin olun. Örneğin, renk verileri RGB olarak işlendiği için RGB çıkışlarının her birini 1/3 oranında ağırlıklandırın.
- DNN'yi eğitin.
DNN'den yerleştirmeleri çıkarma
DNN'nizi eğittikten sonra (tahmini veya otomatik kodlayıcı) DNN'den bir örnek için yerleştirmeyi çıkarın. Örneğin özellik verilerini giriş olarak kullanarak yerleştirmeyi çıkarın ve son gizli katmanın çıkışlarını okuyun. Bu çıkışlar yerleştirme vektörünü oluşturur. Benzer evlerin vektörlerinin, benzer evlerin vektörlerinden daha yakın olması gerektiğini unutmayın.
Şimdi, yerleştirilmiş vektörleri kullanarak örnek çiftlerindeki benzerliğin nasıl ölçüleceğini göreceksiniz.