Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Pour regrouper vos données, procédez comme suit:
Vous allez ensuite préparer les données.
Créez une métrique de similarité.
Exécutez l'algorithme de clustering.
Interprétez les résultats et ajustez votre clustering.
Cette page présente brièvement les étapes. Nous y reviendrons plus en détail dans les sections suivantes.
Préparer les données
Comme pour tout problème de ML, vous devez normaliser, mettre à l'échelle et transformer les données de fonctionnalités avant d'entraîner ou d'ajuster un modèle sur ces données. En outre, avant le clustering, vérifiez que les données préparées vous permettent de calculer précisément la similarité entre les exemples.
Créer une métrique de similarité
Avant qu'un algorithme de clustering puisse regrouper des données, il doit savoir dans quelle mesure les paires d'exemples sont similaires. Vous pouvez quantifier la similarité entre les exemples en créant une métrique de similarité, ce qui nécessite une compréhension approfondie de vos données.
Exécuter l'algorithme de clustering
Un algorithme de clustering utilise la métrique de similarité pour regrouper les données.
Ce cours utilise k-moyennes.
Interpréter les résultats et les ajuster
Étant donné que le clustering ne produit ni n'inclut de "vérité" de référence contre laquelle vous pouvez vérifier la sortie, il est important de comparer le résultat à vos attentes au niveau du cluster et de l'exemple. Si le résultat semble étrange ou de mauvaise qualité, testez les trois étapes précédentes. Continuez à itérer jusqu'à ce que la qualité de la sortie réponde à vos besoins.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/02/25 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/02/25 (UTC)."],[[["Data needs to be prepared through normalization, scaling, and transformation before using it for clustering."],["A similarity metric is crucial for clustering algorithms as it quantifies how similar data points are to each other."],["The k-means algorithm is employed in this course to group data based on the defined similarity metric."],["Evaluating and adjusting clustering outcomes is an iterative process involving reviewing cluster quality and individual data point assignments."]]],[]]