Dans les ensembles de données du monde réel, il existe de nombreuses données redondantes et contradictoires. Les performances d'un algorithme de classification dans l'exploration de données sont fortement affectées par les informations bruyantes (c'est-à-dire redondantes et contradictoires). Ces paramètres augmentent non seulement le coût du processus d'extraction, mais dégradent également les performances de détection des classificateurs. Ils doivent être éliminés pour accroître l'efficacité et la précision des classificateurs. L'exploration de données est un processus d'analyse de données qui est effectué pour un grand volume de données. La méthodologie d'évaluation des risques et des questions de sécurité des accidents d'avion est proposée dans ce travail. Ce travail se concentre sur les différentes techniques de sélection des caractéristiques appliquées à l'ensemble de données d'une base de données d'une compagnie aérienne afin de comprendre et de nettoyer l'ensemble de données. Les évaluateurs suivants sont utilisés dans cette étude : CFS, CS, GR, Information Gain, OneR Attribute, PCA Transformer, ReliefF Attribute et SU Attribute afin de réduire le nombre d'attributs initiaux. Les algorithmes de classification tels que Decision Tree (DT), Naive Bayes (NB), Artificial Neural Network (ANN), K-Nearest Neighbour (KNN) et Support Vector Machines (SVM) sont utilisés pour prédire le niveau d'alerte du composant en tant qu'attribut de classe.