En los conjuntos de datos del mundo real hay muchos datos redundantes y contradictorios. El rendimiento de un algoritmo de clasificación en la minería de datos se ve muy afectado por la información ruidosa (es decir, redundante y conflictiva). Estos parámetros no sólo aumentan el coste del proceso de minería, sino que también degradan el rendimiento de detección de los clasificadores. Hay que eliminarlos para aumentar la eficacia y la precisión de los clasificadores. La minería de datos es un proceso de análisis de datos que se realiza para grandes volúmenes de datos. En este trabajo se propone una metodología para evaluar el riesgo y la seguridad de los accidentes aéreos. Este trabajo se centra en diferentes técnicas de selección de características aplicadas en el conjunto de datos de una base de datos de aerolíneas para comprender y limpiar el conjunto de datos. En este estudio se utilizan evaluadores como CFS,CS,GR, Information Gain, OneR Attribute, PCA Transformer, ReliefF Attribute y SU Attribute para reducir el número de atributos iniciales. Los algoritmos de clasificación como Árbol de Decisión (DT), Naive Bayes (NB), Red Neuronal Artificial (ANN), K-Nearest Neighbour (KNN) y Support Vector Machines (SVM) se utilizan para predecir el nivel de alerta del componente como atributo de clase.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.