La agrupación de datos es un reto prevalente en el procesamiento de big data, y la paralelización de las operaciones de agrupación mejora significativamente la eficiencia en aplicaciones que implican búsquedas frecuentes. Existen varias técnicas de clustering para la agrupación de datos, siendo CBAR ampliamente utilizada en diferentes aplicaciones. Paralelizar CBAR es esencial para big data, y la plataforma Hadoop MapReduce ofrece un marco adecuado para mejorar la eficiencia aprovechando técnicas de segmentación eficaces. En este libro se diseñan e implementan algoritmos para CBAR utilizando el enfoque MapReduce, con pruebas realizadas en clusters de hasta 4 nodos. Los resultados demuestran ganancias sustanciales de rendimiento, que se analizan y discuten con ejemplos ilustrativos.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.