Yerleştirme Oluşturma Örneği

Bu örnekte, gözetim altındaki benzerlik önlemlerinde kullanılan yerleştirmelerin nasıl oluşturulacağı gösterilmektedir.

Manuel benzerlik ölçüsü oluştururken kullandığınız konut veri kümesine sahip olduğunuzu varsayalım:

ÖzellikTür
FiyatPozitif tam sayı
Boyut Metrekare cinsinden pozitif kayan nokta değeri
Posta koduTamsayı
Yatak odası sayısıTamsayı
Ev türü"tek_aile", "çok aileli", "daire", "parti"den bir metin değeri
GarajHayır/evet için 0/1
RenklerÇok değerli kategorik: "beyaz", "sarı", "yeşil" standart renklerden bir veya daha fazla değer

Ön İşleme Verileri

Özellik verilerini giriş olarak kullanmadan önce verileri önceden işlemeniz gerekir. Ön işleme adımları, manuel benzerlik ölçüsü oluştururken uyguladığınız adımları temel alır. Yeniliklerin özetini aşağıda bulabilirsiniz.

ÖzellikTür veya Dağıtımİşlem
FiyatPoisson dağılımı Ölçün ve [0,1] olarak ölçeklendirin.
BoyutPoisson dağılımı Ölçün ve [0,1] olarak ölçeklendirin.
Posta koduKategorik Boylamları ve enlemi dönüştürün, nicelik olarak ayarlayın ve [0,1] olarak ölçeklendirin.
Yatak odası sayısıTamsayı Aykırı değerleri kırpın ve [0,1] olarak ölçeklendirin.
Ev türüKategorik Tek sıcak kodlamaya dönüştürün.
Garaj0 veya 1 Olduğu gibi kalsın.
RenklerKategorik RGB değerlerini dönüştür ve sayısal veri olarak işleyin.

Tek seferlik kodlama hakkında daha fazla bilgi için Yerleştirmeler: Kategorik Giriş Verileri bölümüne bakın.

Tahmin Aracı veya Otomatik Kodlayıcıyı Seçin

Yerleştirme oluşturmak için bir otomatik kodlayıcı veya tahmin edici seçebilirsiniz. Varsayılan tercihinizin otomatik kodlayıcı olduğunu unutmayın. Benzerliği veri kümenizdeki belirli özellikler belirliyorsa bunun yerine bir tahminci seçersiniz. Bütünlüğü sağlamak için her iki duruma da bakalım.

Tahmini Eğiten

Örneklerinizin benzerliğini belirlemede önemli olan bu özellikleri, DNN'niz için eğitim etiketleri olarak seçmeniz gerekir. Evler arasındaki benzerliğin belirlenmesinde fiyatın en önemli olduğunu varsayalım.

Eğitim etiketi olarak fiyatı seçin ve giriş özelliği verilerinden DNN'ye kaldırın. Giriş verisi olarak diğer tüm özellikleri kullanarak DNN'yi eğitin. Eğitim için kayıp işlevi, tahmini ve gerçek fiyat arasındaki MSE'dir. DNN'yi nasıl eğiteceğinizi öğrenmek için Nöral Ağları Eğitim bölümüne bakın.

Otomatik Kodlayıcı Eğitme

Aşağıdaki adımları uygulayarak veri kümemizde bir otomatik kodlayıcıyı eğitin:

  1. Otomatik kodlayıcının gizli katmanlarının giriş ve çıkış katmanlarından küçük olduğundan emin olun.
  2. Her bir çıkışın kaybını Gözetimli Benzerlik Ölçümü'nde açıklandığı şekilde hesaplayın.
  3. Her çıkışın kayıplarını toplayarak kayıp işlevini oluşturun. Zayıflamanın her özellik için eşit şekilde yapıldığından emin olun. Örneğin, renk verileri RGB olarak işlendiği için RGB çıkışlarının her birini 1/3 oranında ağırlıklandırın.
  4. DNN'yi eğitin.

DNN'den yerleştirmeleri çıkarma

DNN'nizi eğittikten sonra (tahmini veya otomatik kodlayıcı) DNN'den bir örnek için yerleştirmeyi çıkarın. Örneğin özellik verilerini giriş olarak kullanarak yerleştirmeyi çıkarın ve son gizli katmanın çıkışlarını okuyun. Bu çıkışlar yerleştirme vektörünü oluşturur. Benzer evlerin vektörlerinin, benzer evlerin vektörlerinden daha yakın olması gerektiğini unutmayın.

Şimdi, yerleştirilmiş vektörleri kullanarak örnek çiftlerindeki benzerliğin nasıl ölçüleceğini göreceksiniz.