CLUSTERING FLOU K-MEANS DANS MAHOUT

Ce blog donne une introduction au clustering Fuzzy K-Means dans Apache Mahout.

Fuzzy K-Means est exactement le même algorithme que K-means, qui est une technique de clustering simple populaire. La seule différence est qu'au lieu d'attribuer un point exclusivement à un seul cluster, il peut avoir une sorte de flou ou de chevauchement entre deux ou plusieurs clusters. Voici les points clés, décrivant les K-Means floues:

Contrairement à K-Means, qui recherche un cluster dur, dans lequel chacun des points appartient à un cluster, Fuzzy K-Means recherche les clusters les plus souples pour le chevauchement.
Un point unique dans un cluster logiciel peut appartenir à plus d'un cluster avec une certaine valeur d'affinité vers chacun des points.
L'affinité est proportionnelle à la distance entre ce point et le centre de gravité du cluster.
Semblable à K-Means, Fuzzy K-Means fonctionne sur les objets qui ont la mesure de distance définie et peuvent être représentés dans le n- espace vectoriel dimensionnel.

Carte floue des K-Means

Il n'y a pas beaucoup de différence entre le flux MapReduce de K-Means et Fuzzy K-Means. La mise en œuvre des deux à Mahout est similaire.

si condition dans la requête SQL

Voici les paramètres essentiels pour l'implémentation de K-Means floues:

Vous avez besoin d'un jeu de données vectorielles pour l'entrée.
Il doit y avoir le RandomSeedGenerator pour amorcer les k clusters initiaux.
Pour la mesure de distance SquaredEuclideanDistanceMeasure est requis.
Une grande valeur de seuil de convergence, telle que –cd 1.0, si la valeur au carré de la mesure de distance a été utilisée
Une valeur pour maxIterations la valeur par défaut est -x 10.
Le coefficient de normalisation ou le facteur de flou, avec une valeur supérieure à -m 1,0

Vous avez une question pour nous? Mentionnez-les dans la section commentaires et nous vous recontacterons.

convertir la date de la chaîne en date en java

Articles Similaires

instructions if dans les requêtes SQL

Apprentissage supervisé dans Apache Mahout

Ce blog donne une introduction au clustering Fuzzy K-Means dans Apache Mahout.

Carte floue des K-Means

Catégories

Popular Articles

Questions d'entrevue Google Data Science: tout ce que vous devez savoir pour le résoudre

Tout ce que vous devez savoir sur les chaînes en C ++

SQL Union - Un guide complet sur l'opérateur UNION

Didacticiel AWS S3: Plongez-vous dans Amazon Simple Storage Service

Qu'est-ce que la fonction membre statique en C ++?

Comment implémenter DateFilter dans AngularJS avec des exemples

Qu'est-ce qu'un réseau neuronal? Introduction aux réseaux de neurones artificiels

Quelles sont les conditions préalables à l'apprentissage automatique?

Comment implémenter la file d'attente prioritaire en Java?

Les meilleurs outils de microservices que vous devez connaître en 2019

Tout ce que vous devez savoir sur les opérateurs bit à bit en Java

Comment travailler avec l'allocation de mémoire dynamique C ++?