Il World Wide Web è un'enorme raccolta di dati multi-variante. Per una migliore gestione della conoscenza è importante recuperare dati accurati e completi. Il Web nascosto, noto anche come Web invisibile o Deep Web, ha dato origine a un nuovo problema di ricerca sul Web mining. La maggior parte dei documenti nel Web nascosto, comprese le pagine nascoste dietro moduli di ricerca, database specializzati e pagine Web generate dinamicamente, non sono accessibili dall'applicazione di Web mining generale. In questo documento viene progettato un sistema che ha una solida capacità di accedere a queste pagine Web nascoste utilizzando tecniche di estrazione della struttura Web per una migliore gestione della conoscenza. Poiché la generazione di contenuto dinamico viene utilizzata nelle pagine Web moderne e i moduli utente vengono utilizzati per ottenere informazioni da un particolare utente e memorizzate in un database. La struttura di collegamento che si trova in queste forme non è accessibile durante le procedure minerarie convenzionali. Il rapporto di accuratezza delle strutture gerarchiche delle pagine web può essere migliorato includendo queste pagine web nascoste nel processo di estrazione della struttura web. Il sistema progettato è sufficientemente robusto per elaborare le pagine Web dinamiche insieme a quelle statiche.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.