Le regroupement des données est un défi majeur dans le traitement des big data, et la parallélisation des opérations de regroupement améliore considérablement l'efficacité des applications impliquant des recherches fréquentes. Diverses techniques de clustering sont disponibles pour le regroupement des données, CBAR étant largement utilisé dans différentes applications. La parallélisation de CBAR est essentielle pour les données volumineuses, et la plateforme Hadoop MapReduce offre un cadre approprié pour améliorer l'efficacité en tirant parti de techniques de segmentation efficaces. Cet ouvrage porte sur la conception et la mise en oeuvre d'algorithmes pour CBAR à l'aide de l'approche MapReduce, avec des tests effectués sur des grappes allant jusqu'à 4 noeuds. Les résultats démontrent des gains de performance substantiels, qui sont analysés et discutés à l'aide d'exemples illustratifs.