Ankündigung: Alle nicht kommerziellen Projekte, die vor dem 15. April 2025 für die Nutzung von Earth Engine registriert wurden, müssen die Berechtigung zur nicht kommerziellen Nutzung bestätigen, um den Zugriff aufrechtzuerhalten. Wenn Sie Ihren Status nicht bis zum 26. September 2025 bestätigen, wird Ihr Zugriff möglicherweise eingeschränkt.
Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Daten mit dem k-Means-Algorithmus in Clustern gruppieren. Sie können entweder die euklidische Distanz (Standard) oder die Manhattan-Distanz verwenden. Wenn die Manhattan-Distanz verwendet wird, werden die Schwerpunkte als komponentenweiser Median und nicht als Mittelwert berechnet. Weitere Informationen erhalten Sie hier:
D. Arthur, S. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.
Verwenden Sie Canopies, um die Anzahl der Distanzberechnungen zu reduzieren.
maxCandidates
Ganzzahl, Standard: 100
Maximale Anzahl von Kandidaten-Canopies, die bei der Verwendung von Canopy-Clustering gleichzeitig im Arbeitsspeicher behalten werden sollen. Der T2-Abstand plus die Datenmerkmale bestimmen, wie viele Kandidaten-Canopies gebildet werden, bevor das regelmäßige und das endgültige Bereinigen durchgeführt werden. Dies kann zu einem übermäßigen Speicherverbrauch führen. Diese Einstellung verhindert, dass eine große Anzahl von Kandidaten-Canopies Speicherplatz belegt.
periodicPruning
Ganzzahl, Standard: 10.000
Wie oft sollten dünne Baumkronen bei Verwendung von Canopy-Clustering beschnitten werden?
minDensity
Ganzzahl, Standard: 2
Die Mindestdichte des Baldachs, unter der ein Baldach beim regelmäßigen Bereinigen entfernt wird, wenn das Baldach-Clustering verwendet wird.
t1
Gleitkommazahl, Standardwert: -1,5
Der T1-Abstand, der beim Canopy-Clustering verwendet werden soll. Ein Wert < 0 wird als positiver Multiplikator für T2 verwendet.
t2
Gleitkommazahl, Standardwert: -1
Der T2-Abstand, der beim Canopy-Clustering verwendet werden soll. Bei Werten < 0 wird eine Heuristik basierend auf der Standardabweichung des Attributs verwendet.
distanceFunction
String, Standard: „Euclidean“
Zu verwendende Distanzfunktion. Folgende Optionen sind verfügbar: „Euklidisch“ und „Manhattan“.
maxIterations
Ganzzahl, Standard: null
Maximale Anzahl an Iterationen.
preserveOrder
Boolescher Wert, Standard: „false“
Reihenfolge der Instanzen beibehalten.
fast
Boolescher Wert, Standard: „false“
Ermöglicht schnellere Distanzberechnungen mithilfe von Grenzwerten. Deaktiviert die Berechnung/Ausgabe von quadratischen Fehlern/Distanzen.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Benötigte Informationen nicht gefunden","missingTheInformationINeed","thumb-down"],["Zu umständlich/zu viele Schritte","tooComplicatedTooManySteps","thumb-down"],["Nicht mehr aktuell","outOfDate","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Problem mit Beispielen/Code","samplesCodeIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-07-26 (UTC)."],[],["The k-means algorithm clusters data using either Euclidean or Manhattan distance. Manhattan distance uses component-wise median for centroids, while Euclidean uses the mean. Initialization methods include random, k-means++, canopy, and farthest first. Canopies can be used to optimize distance calculations. Parameters control the number of clusters, pruning frequency, density thresholds, and distance settings. Additional options include limiting iterations, preserving data order, and using a fast distance calculation mode.\n"]]