Gli outlier, considerati come dati rumorosi in statistica, si sono rivelati un problema importante che viene studiato in diversi campi di ricerca e applicazioni. Sono state sviluppate molte tecniche di rilevamento degli outlier specifiche per determinati domini applicativi, mentre alcune tecniche sono più generiche. Alcuni domini applicativi sono oggetto di ricerca in stretta riservatezza, come la ricerca sulla criminalità e sulle attività terroristiche. L'analisi dei big data è diventata molto popolare nello scenario attuale e la manipolazione dei big data ha guadagnato l'attenzione dei ricercatori nel campo dell'analisi dei dati. Il cloud computing mette a disposizione degli utenti risorse infrastrutturali potenti ed economiche per la gestione di Big Data in costante aumento, grazie a framework di elaborazione dati come MapReduce.Questo lavoro considera due algoritmi di clustering noti come DBScan e K-Means e li implementa con il dataset Sensed di Intel Corporation.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.