ee.Clusterer.wekaKMeans

Agrupe os dados usando o algoritmo k-means. Pode usar a distância euclidiana (padrão) ou a distância de Manhattan. Se a distância de Manhattan for usada, os centroides serão calculados como a mediana por componente, em vez da média. Para mais informações, acesse:

D. Arthur, S. Vassilvitskii: k-means++: as vantagens de uma inicialização cuidadosa. Em: Anais do 18º simpósio anual da ACM-SIAM sobre algoritmos discretos, 1027-1035, 2007.

UsoRetorna
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed)Clusterer
ArgumentoTipoDetalhes
nClustersNúmero inteiroNúmero de clusters.
initNúmero inteiro, padrão: 0Método de inicialização a ser usado. 0 = aleatório, 1 = k-means++, 2 = canopy, 3 = farthest first.
canopiesBooleano, padrão: falsoUse coberturas para reduzir o número de cálculos de distância.
maxCandidatesNúmero inteiro. Padrão: 100Número máximo de coberturas candidatas a serem mantidas na memória a qualquer momento ao usar o clustering de cobertura. A distância T2 mais as características dos dados determinam quantas coberturas candidatas são formadas antes da poda periódica e final, o que pode resultar em consumo excessivo de memória. Essa configuração evita que um grande número de coberturas candidatas consuma memória.
periodicPruningNúmero inteiro, padrão: 10000Com que frequência podar copas de baixa densidade ao usar o clustering de copas.
minDensityNúmero inteiro, padrão: 2Densidade mínima de cobertura, ao usar o clustering de cobertura, abaixo da qual uma cobertura será cortada durante a poda periódica.
t1Ponto flutuante, padrão: -1,5A distância T1 a ser usada com o clustering de cobertura. Um valor < 0 é considerado um multiplicador positivo para T2.
t2Ponto flutuante, padrão: -1A distância T2 a ser usada com o clustering de cobertura. Valores < 0 fazem com que uma heurística baseada no desvio padrão do atributo seja usada.
distanceFunctionString, padrão: "Euclidean"Função de distância a ser usada. As opções são: euclidiana e de Manhattan.
maxIterationsNúmero inteiro, padrão: nuloNúmero máximo de iterações.
preserveOrderBooleano, padrão: falsoPreservar a ordem das instâncias.
fastBooleano, padrão: falsoPermite cálculos de distância mais rápidos usando valores de corte. Desativa o cálculo/saída de erros/distâncias quadradas.
seedNúmero inteiro, padrão: 10A semente de aleatorização.