Os outliers são considerados como dados ruidosos nas estatísticas, revelou-se um problema importante que está a ser investigado em diversos campos de investigação e domínios de aplicação. Muitas técnicas de detecção de outliers foram desenvolvidas especificamente para certos domínios de aplicação, enquanto que algumas técnicas são mais genéricas. Alguns domínios de aplicação estão a ser pesquisados em estrita confidencialidade, como a investigação sobre crime e actividades terroristas. As técnicas e os resultados de tais técnicas não são prontamente divulgados. As grandes análises de dados tornaram-se muito populares no cenário actual e a manipulação de grandes dados ganhou a grande atenção dos investigadores no campo da análise de dados. A computação em nuvem fornece recursos infra-estruturais poderosos e económicos para os utilizadores da nuvem lidarem com grandes dados cada vez maiores com estruturas de processamento de dados tais como MapReduce. Este trabalho considera dois algoritmos de clustering conhecidos como DBScan e K-Means e implementados com o conjunto de dados Sensed da Intel Corporation.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.