L'exploration de données est un processus qui consiste à extraire des informations cachées et utiles des données. La détection des valeurs aberrantes est une partie fondamentale de l'exploration de données et a récemment fait l'objet d'une attention considérable de la part de la communauté des chercheurs. Une valeur aberrante est un objet de données qui s'écarte des autres observations. La détection des valeurs aberrantes a des applications importantes dans le nettoyage des données ainsi que dans l'extraction de points anormaux pour la détection de la fraude, l'analyse du marché boursier, la détection des intrusions, le marketing, les capteurs de réseau. La plupart des efforts de recherche existants se concentrent sur les ensembles de données numériques qui ne sont pas directement applicables aux ensembles de données catégorielles où l'ordre des données et le calcul des distances entre les points de données ont peu de sens. En outre, un certain nombre de méthodes actuelles de détection des valeurs aberrantes nécessitent un temps quadratique par rapport à la taille de l'ensemble de données et nécessitent généralement des analyses multiples des données ; ces caractéristiques ne sont pas souhaitables lorsque les ensembles de données sont volumineux. Cette thèse se concentre et évalue, expérimentalement, une approche de détection des aberrations qui est orientée vers les ensembles catégoriels. En outre, il s'agit d'un algorithme de détection de valeurs aberrantes simple, évolutif et efficace qui a l'avantage de découvrir les valeurs aberrantes dans des ensembles de données catégoriques ou numériques en per
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.