Clustering flou K-Means dans Mahout

Ce blog donne une introduction au clustering Fuzzy K-Means dans Apache Mahout.



Fuzzy K-Means est exactement le même algorithme que K-means, qui est une technique de clustering simple populaire. La seule différence est qu'au lieu d'attribuer un point exclusivement à un seul cluster, il peut avoir une sorte de flou ou de chevauchement entre deux ou plusieurs clusters. Voici les points clés, décrivant les K-Means floues:



  • Contrairement à K-Means, qui recherche un cluster dur, dans lequel chacun des points appartient à un cluster, Fuzzy K-Means recherche les clusters les plus souples pour le chevauchement.
  • Un point unique dans un cluster logiciel peut appartenir à plus d'un cluster avec une certaine valeur d'affinité vers chacun des points.
  • L'affinité est proportionnelle à la distance entre ce point et le centre de gravité du cluster.
  • Semblable à K-Means, Fuzzy K-Means fonctionne sur les objets qui ont la mesure de distance définie et peuvent être représentés dans le n- espace vectoriel dimensionnel.

Carte floue des K-Means

Il n'y a pas beaucoup de différence entre le flux MapReduce de K-Means et Fuzzy K-Means. La mise en œuvre des deux à Mahout est similaire.

si condition dans la requête SQL

Voici les paramètres essentiels pour l'implémentation de K-Means floues:



  • Vous avez besoin d'un jeu de données vectorielles pour l'entrée.
  • Il doit y avoir le RandomSeedGenerator pour amorcer les k clusters initiaux.
  • Pour la mesure de distance SquaredEuclideanDistanceMeasure est requis.
  • Une grande valeur de seuil de convergence, telle que –cd 1.0, si la valeur au carré de la mesure de distance a été utilisée
  • Une valeur pour maxIterations la valeur par défaut est -x 10.
  • Le coefficient de normalisation ou le facteur de flou, avec une valeur supérieure à -m 1,0

Vous avez une question pour nous? Mentionnez-les dans la section commentaires et nous vous recontacterons.

convertir la date de la chaîne en date en java

Articles Similaires



instructions if dans les requêtes SQL

Apprentissage supervisé dans Apache Mahout