Il raggruppamento dei dati è una sfida prevalente nell'elaborazione dei big data e la parallelizzazione delle operazioni di raggruppamento aumenta significativamente l'efficienza nelle applicazioni che prevedono ricerche frequenti. Per il raggruppamento dei dati sono disponibili diverse tecniche di clustering, tra cui CBAR, ampiamente utilizzato in diverse applicazioni. La parallelizzazione di CBAR è essenziale per i big data e la piattaforma Hadoop MapReduce offre un quadro adatto per migliorare l'efficienza sfruttando tecniche di segmentazione efficaci. Questo libro prevede la progettazione e l'implementazione di algoritmi per CBAR utilizzando l'approccio MapReduce, con test condotti su cluster fino a 4 nodi. I risultati dimostrano un sostanziale aumento delle prestazioni, che vengono analizzate e discusse con esempi illustrativi.