ee.Clusterer.wekaKMeans

K-ortalama algoritmasını kullanarak verileri kümeleyin. Öklid uzaklığı (varsayılan) veya Manhattan uzaklığı kullanılabilir. Manhattan uzaklığı kullanılıyorsa merkezoidler, ortalama yerine bileşen bazında medyan olarak hesaplanır. Daha fazla bilgi için:

D. Arthur, S. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.

Kullanımİadeler
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed)Kümeleyici
Bağımsız DeğişkenTürAyrıntılar
nClustersTamsayıKüme sayısı.
initTamsayı, varsayılan: 0Kullanılacak başlatma yöntemi. 0 = rastgele, 1 = k-means++, 2 = canopy, 3 = en uzak ilk.
canopiesBoole değeri, varsayılan: falseMesafe hesaplamalarının sayısını azaltmak için kanopiler kullanın.
maxCandidatesTam sayı, varsayılan: 100Kanopi kümeleme kullanılırken aynı anda bellekte tutulacak maksimum aday kanopi sayısı. T2 mesafesi ve veri özellikleri, periyodik ve nihai budama işlemleri yapılmadan önce kaç tane aday kanopi oluşturulacağını belirler. Bu durum, aşırı bellek tüketimine neden olabilir. Bu ayar, çok sayıda aday kanopinin belleği tüketmesini önler.
periodicPruningTam sayı, varsayılan: 10000Kanopi kümeleme kullanılırken düşük yoğunluklu kanopilerin ne sıklıkta budanacağı.
minDensityTamsayı, varsayılan: 2Kanopi kümeleme kullanılırken minimum kanopi yoğunluğu. Bu yoğunluğun altında, kanopi periyodik budama sırasında budanır.
t1Kayan nokta, varsayılan: -1,5Çardak kümeleme kullanılırken kullanılacak T1 mesafesi. 0'dan küçük bir değer, T2 için pozitif bir çarpan olarak kabul edilir.
t2Ondalık sayı, varsayılan: -1Çadır kümeleme kullanılırken kullanılacak T2 mesafesi. 0'dan küçük değerler, özelliğin standart sapmasına dayalı bir sezgisel yöntemin kullanılmasına neden olur.
distanceFunctionDize, varsayılan: "Euclidean"Kullanılacak mesafe işlevi. Seçenekler: Öklid ve Manhattan.
maxIterationsTam sayı, varsayılan: nullMaksimum yineleme sayısı.
preserveOrderBoole değeri, varsayılan: falseÖrneklerin sırasını koruyun.
fastBoole değeri, varsayılan: falseKesme değerlerini kullanarak daha hızlı mesafe hesaplamaları yapmanızı sağlar. Kare hataların/mesafelerin hesaplanmasını/çıkışını devre dışı bırakır.
seedTamsayı, varsayılan: 10Rastgele hale getirme başlangıç noktası.