En este trabajo, proponemos una nueva estrategia de comprobación de hechos (búsqueda de la verdad), basada en la agrupación de datos de aprendizaje automático con el método k-means combinado con el índice de silueta para determinar el valor óptimo de k, con el fin de detectar la partición óptima del conjunto de atributos. Esta partición óptima maximiza la precisión del proceso de búsqueda de la verdad sin tener que explorar todas las particiones posibles. Los resultados de nuestros experimentos intensivos con datos sintéticos y reales muestran que nuestro enfoque supera a los de (Lamine Ba et al., 2015), con un coste de tiempo computacional más razonable. Por último, esbozamos una forma de paralelizar un determinado proceso de búsqueda de la verdad utilizando el paradigma MapReduce para evitar la explosión del tiempo de ejecución cuando el tamaño de los datos de entrada aumenta.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.