A World Wide Web é uma enorme compilação de dados de múltiplas variantes. Para uma melhor gestão do conhecimento, é importante recuperar dados precisos e completos. A web oculta, também conhecida como web invisível ou deep web, deu origem a um novo problema de pesquisa de mineração na web. A maioria dos documentos na Web oculta, incluindo páginas ocultas atrás de formulários de pesquisa, bancos de dados especializados e páginas da Web geradas dinamicamente, não são acessíveis pelo aplicativo de mineração da Web geral. Neste artigo, um sistema é projetado com uma capacidade robusta de acessar essas páginas da web ocultas usando técnicas de mineração de estrutura da web para uma melhor gestão do conhecimento. Como a geração de conteúdo dinâmico é usada em páginas da web modernas e formulários de usuário são usados ¿¿para obter informações de um determinado usuário e armazenadas em um banco de dados. A estrutura do link nessas formas não pode ser acessada durante os procedimentos convencionais de mineração. A proporção de precisão das estruturas hierárquicas da página da web pode ser melhorada incluindo essas páginas da web ocultas no processo de mineração da estrutura da web. O sistema projetado é suficientemente forte para processar as páginas da Web dinâmicas junto com as estáticas.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.