Das World Wide Web ist eine enorme Zusammenstellung von Daten mit mehreren Varianten. Für ein besseres Wissensmanagement ist es wichtig, genaue und vollständige Daten abzurufen. Das versteckte Web, auch als unsichtbares Web oder Deep Web bekannt, hat zu einer neuen Ausgabe der Web-Mining-Forschung geführt. Die meisten Dokumente im versteckten Web, einschließlich Seiten, die hinter Suchformularen, speziellen Datenbanken und dynamisch generierten Webseiten versteckt sind, sind für allgemeine Web Mining-Anwendungen nicht zugänglich. In diesem Artikel wird ein System entwickelt, das mithilfe von Web Structure Mining-Techniken für ein besseres Wissensmanagement robust auf diese verborgenen Webseiten zugreifen kann. Da die dynamische Generierung von Inhalten in modernen Webseiten verwendet wird und Benutzerformulare verwendet werden, um Informationen von einem bestimmten Benutzer abzurufen und in einer Datenbank zu speichern. Auf die in diesen Formen liegende Verbindungsstruktur kann während herkömmlicher Miningverfahren nicht zugegriffen werden. Das Genauigkeitsverhältnis von hierarchischen Webseitenstrukturen kann verbessert werden, indem diese versteckten Webseiten in den Prozess des Webstruktur-Mining einbezogen werden. Das entworfene System ist ausreichend stark, um die dynamischen Webseiten zusammen mit den statischen zu verarbeiten.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.