Grazie ai progressi digitali, le moderne applicazioni generano grandi volumi di dati. Per classificare accuratamente i dati in questi grandi insiemi di dati, vengono utilizzati algoritmi di clustering. Questo libro presenta una rassegna della letteratura sui vari algoritmi di clustering tradizionali e il loro confronto da una prospettiva teorica. Il libro fornisce anche un'analisi delle applicazioni delle tecniche di clustering su I) dati di log web, II) dati di immagini e III) dati biologici. Uno dei principali svantaggi degli algoritmi di clustering tradizionali è che sono computazionalmente costosi quando i dati in ingresso sono troppo grandi. Per superare questo problema, forniamo anche uno studio completo dei recenti algoritmi di clustering basati su MapReduce, che estendono la controparte tradizionale con il paradigma di programmazione Map-Reduce. Questo libro è adatto soprattutto ai ricercatori interessati al campo della scoperta di pattern da grandi insiemi di dati utilizzando il clustering MapReduce. Li aiuterà a realizzare il clustering dei dati in ambiente distribuito. Inoltre, le questioni e le aree aperte discusse in questo libro aiuteranno i ricercatori a individuare le loro direzioni future.