Clustering : définition

Définition du mot Clustering

Le clustering est un outil statistique utilisé pour obtenir facilement et rapidement une analyse de données. En français, on emploie couramment le terme de regroupement ou l'expression partitionnement de données.

Le clustering consiste en effet à séparer des données, en constituant différents groupes (ou paquets) homogènes. Toutes les données placées dans un même paquet doivent alors partager des caractéristiques communes.

Le clustering est principalement appliqué pour segmenter une base de données, classifier des données (trier des données clients type âge, profession exercée, lieu de résidence, etc., pour optimiser la gestion de la relation client) ou extraire des connaissances pour tenter de relever des sous-ensembles de données difficiles à identifier à l’œil nu.

Pour être appliqué, le clustering s'appuie sur des algorithmes plus ou moins complexes, tels que les algorithmes des k-moyennes ou k-medoids, ou les algorithmes de maximisation de l'espérance.

Outils

Annonces Google