L'esplorazione e l'utilizzo di un'enorme quantità di documenti di testo è una delle questioni principali nell'ambito del reperimento di informazioni e del text mining. Tutti i metodi che mirano a trovare gruppi di entità utilizzano misure di similarità o dissimilarità. È necessario analizzare il comportamento delle misure di similarità sui documenti di testo prima di sviluppare o modificare una buona misura di similarità per il clustering dei documenti, per capire l'efficacia della tecnica. Una funzione di similarità incorporata in una funzione di criterio è in gran parte responsabile dell'analisi della struttura intrinseca dei dati. Se si utilizzano misure di similarità appropriate con una specifica tecnica di clustering, è possibile migliorare l'efficienza e l'accuratezza dell'attività di scoperta delle informazioni. L'uso di misure appropriate non solo migliora la provenienza e la credibilità delle informazioni recuperate, ma aiuta anche a superare la complessità del processo in termini di tempo e di costi. Questo libro si concentra sull'identificazione delle varie misure di similarità per il clustering. Viene illustrato un metodo imperativo per misurare la somiglianza tra i documenti di testo per raggruppare i documenti utilizzando il clustering gerarchico e il metodo di selezione delle caratteristiche con Matlab.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.