In realen Datensätzen gibt es viele redundante und widersprüchliche Daten. Die Leistung eines Klassifizierungsalgorithmus beim Data Mining wird durch verrauschte Informationen (d. h. redundante und widersprüchliche Daten) stark beeinträchtigt. Diese Parameter erhöhen nicht nur die Kosten des Mining-Prozesses, sondern verschlechtern auch die Erkennungsleistung der Klassifikatoren. Sie müssen beseitigt werden, um die Effizienz und die Genauigkeit der Klassifikatoren zu erhöhen. Data Mining ist ein Datenanalyseprozess, der für große Datenmengen durchgeführt wird. In dieser Arbeit wird eine Methodik zur Bewertung des Risikos und der Sicherheitsaspekte von Flugzeugunfällen vorgeschlagen. Diese Arbeit konzentriert sich auf verschiedene Techniken zur Auswahl von Merkmalen, die auf den Datensatz einer Fluggesellschaftsdatenbank angewendet werden, um den Datensatz zu verstehen und zu bereinigen. Die folgenden Evaluatoren wie CFS, CS, GR, Informationsgewinn, OneR-Attribut, PCA-Transformator, ReliefF-Attribut und SU-Attribut werden in dieser Studie verwendet, um die Anzahl der ursprünglichen Attribute zu reduzieren. Die Klassifizierungsalgorithmen wie Entscheidungsbaum (DT), Naive Bayes (NB), Artificial Neural Network (ANN), K-Nearest Neighbour (KNN) und Support Vector Machines (SVM) werden verwendet, um die Warnstufe der Komponente als Klassenattribut vorherzusagen.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.