Sayısal Verileri Dönüştürme

Sayısal verilere iki tür dönüşüm uygulamanız gerekebilir:

  • Normalleştirme: Sayısal verileri, diğer sayısal verilerle aynı ölçekte dönüştürür.
  • Paketleme: Sayısal (genellikle sürekli) verileri kategorik verilere dönüştürür.

Sayısal Özellikleri Neden Normalleştirme?

Farklı aralıklar (ör. yaş ve gelir) kapsayan sayısal özelliklere sahip bir veri kümesinin normalleştirilmesini önemle tavsiye ederiz. Farklı özelliklerin farklı aralıkları olduğunda, gradyan inişi "geri dönen" olabilir ve birleşmeyi yavaşlatabilir. Adagrad ve Adam gibi optimize ediciler her özellik için ayrı bir etkili öğrenme hızı oluşturarak bu soruna karşı koruma sağlar.

Ayrıca, "şehir nüfusu" gibi geniş bir aralığı kapsayan tek bir sayısal özelliği normalleştirmenizi öneririz. "Şehir nüfusu" özelliğini normalleştirmezseniz modelin eğitilmesi NaN hataları oluşturabilir. Maalesef Adagrad ve Adam gibi optimize ediciler, tek bir özellik içinde çok sayıda değer olduğunda NaN hatalarını önleyemez.