En este libro se presenta una nueva técnica de clustering para datos categóricos. Esencialmente, la efectividad de una técnica de clustering está determinada significativamente por dos aspectos, el método de búsqueda y el criterio de proximidad. El algoritmo propuesto utiliza un algoritmo genético para el clustering que se muestra en los experimentos como un método eficiente de clustering para datos categóricos. Los criterios de proximidad adoptan una medida teórica de información basada en reglas llamada peso de la evidencia. Encuentra los patrones interesantes y mide el peso de estos patrones que apoyan la presencia de un par objetivo-valor para ser relevante para una etiqueta de cluster. Al sumar el peso total que adquieren los registros en los patrones debido a la presencia tanto del valor objetivo como de la etiqueta de clúster correspondiente, se mide la aptitud en el cromosoma y, por tanto, se ve cómo se agrupan mejor los registros.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.