Negli insiemi di dati del mondo reale esistono molti dati ridondanti e contrastanti. Le prestazioni di un algoritmo di classificazione nel data mining sono fortemente influenzate dalle informazioni rumorose (cioè ridondanti e contrastanti). Questi parametri non solo aumentano il costo del processo di estrazione, ma degradano anche le prestazioni di rilevamento dei classificatori. È necessario eliminarli per aumentare l'efficienza e l'accuratezza dei classificatori. Il data mining è un processo di analisi dei dati che viene eseguito su grandi volumi di dati. In questo lavoro viene proposta una metodologia per la valutazione del rischio e della sicurezza degli incidenti aerei. Questo lavoro si concentra su diverse tecniche di selezione delle caratteristiche applicate al dataset di un database di compagnie aeree per comprendere e pulire il dataset. In questo studio vengono utilizzati i seguenti valutatori: CFS, CS, GR, Information Gain, OneR Attribute, PCA Transformer, ReliefF Attribute e SU Attribute per ridurre il numero di attributi iniziali. Gli algoritmi di classificazione come Decision Tree (DT), Naive Bayes (NB), Artificial Neural Network (ANN), K-Nearest Neighbour (KNN) e Support Vector Machines (SVM) sono utilizzati per prevedere il livello di allarme del componente come attributo della classe.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.