Kümeleme İş Akışı

Verilerinizi kümelemek için aşağıdaki adımları uygulayın:

  1. Verileri hazırlayın.
  2. Benzerlik metriği oluşturun.
  3. Kümeleme algoritmasını çalıştırın.
  4. Sonuçları yorumlayın ve kümelemenizi ayarlayın.

Bu sayfada kısaca adımlar açıklanmaktadır. Gelecek bölümlerde ayrıntılı bilgi vereceğiz.

Kümeleme iş akışının dört adımı

Veri Hazırlama

Diğer makine öğrenimi sorunlarında olduğu gibi, özellik verilerini normalleştirmeniz, ölçeklendirmeniz ve dönüştürmeniz gerekir. Kümeleme yaparken hazır verilerin, örnekler arasındaki benzerliği doğru bir şekilde hesaplamasını sağladığından da emin olmalısınız. Sonraki bölümlerde, bu üzerinde

Benzerlik Metriği Oluştur

Bir kümeleme algoritmasının verileri gruplandırabilmesi için öncelikle örnek örneklerinin benzerliklerini bilmesi gerekir. Benzerlik metriği oluşturarak örnekler arasındaki benzerliği ölçersiniz. Benzerlik metriği oluşturmak, verilerinizi ve özelliklerinizden benzerliği nasıl elde edeceğinizi dikkatlice anlamanızı gerektirir.

Kümeleme Algoritmasını Çalıştır

Kümeleme algoritması, verileri kümelemek için benzerlik metriğini kullanır. Bu kurs, k ortalamalarına odaklanır.

Sonuçları Yorumlayın ve Ayarla

Kümeleme çıkışının kalitesini kontrol etmek yineleyici ve keşifseldir. Bunun nedeni, kümelemede çıkışı doğrulayabilecek "doğru" değerinin bulunmamasıdır. Sonucu, küme düzeyindeki ve örnek düzeyindeki beklentilere göre doğrularsınız. Sonucu iyileştirmenin, kümelemeyi nasıl etkilediğini görmek için önceki adımları tekrar tekrar deneyecek olması.