Doğru sayısal veriler
katlanabilirsiniz. Örneğin,
bulunduğu alana göre evin değerini tahmin eden bir model.
Ev fiyatlarını değerlendirmek için yararlı bir modelin genellikle
yüzlerce özellik. Bununla birlikte, diğer her şey eşit olduğunda, 200 karelik bir ev
metreler, 100 karelik özdeş bir evin yaklaşık iki katı daha değerli olmalıdır
metre.
Çoğu zaman tamsayı değerleri içeren özellikleri
kategorik verileri kullanır. Örneğin, bir posta adresi
değerlerin tam sayı olduğu kod özelliği. Bunu temsil ediyorsanız
özellik sayısını kategorik olarak değil sayısal olarak sorarsanız, modele
sayısal bir ilişki bulmak için
ekleyebilirsiniz. Yani modele, müşterilerinizin
20004 posta kodu, posta kodunun iki katı (veya yarısı) büyük bir sinyal olarak ele alınır
10002. Posta kodlarını kategorik veri olarak göstermek,
her posta kodunun ağırlığını ayrı ayrı alın.
Kodlama
Kodlama kategorik verilerin veya diğer verilerin sayısal vektörlere dönüştürülmesi anlamına gelir
tek bir fonksiyona değineceğiz. Bu dönüşüm gereklidir çünkü modeller
yalnızca kayan nokta değerleriyle eğitilir; tarafından çalıştırılamaz.
"dog" veya "maple". Bu modülde, farklı türde
kategorik verilerde kodlama yöntemlerini
kullanmayı öğreteceğim.
[[["Anlaması kolay","easyToUnderstand","thumb-up"],["Sorunumu çözdü","solvedMyProblem","thumb-up"],["Diğer","otherUp","thumb-up"]],[["İhtiyacım olan bilgiler yok","missingTheInformationINeed","thumb-down"],["Çok karmaşık / çok fazla adım var","tooComplicatedTooManySteps","thumb-down"],["Güncel değil","outOfDate","thumb-down"],["Çeviri sorunu","translationIssue","thumb-down"],["Örnek veya kod sorunu","samplesCodeIssue","thumb-down"],["Diğer","otherDown","thumb-down"]],["Son güncelleme tarihi: 2024-08-13 UTC."],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]