23,99 €
inkl. MwSt.

Versandfertig in 6-10 Tagen
payback
12 °P sammeln
  • Broschiertes Buch

Os dados tabulares são uma fonte de informação disponível na Web. Começámos a trabalhar na recolha de tabelas HTML retiradas da Web. Em primeiro lugar, serão identificadas tabelas de boa qualidade e, em seguida, será efectuada a correspondência de esquemas. A correspondência de esquemas identifica o número de correspondências que determinam os elementos semelhantes de dois esquemas diferentes. As colunas e os valores dos dados são comparados um após o outro para fazer corresponder o esquema. Durante a pesquisa de dados tabulares na Web, o motor de pesquisa pode devolver o URL em vez de…mehr

Produktbeschreibung
Os dados tabulares são uma fonte de informação disponível na Web. Começámos a trabalhar na recolha de tabelas HTML retiradas da Web. Em primeiro lugar, serão identificadas tabelas de boa qualidade e, em seguida, será efectuada a correspondência de esquemas. A correspondência de esquemas identifica o número de correspondências que determinam os elementos semelhantes de dois esquemas diferentes. As colunas e os valores dos dados são comparados um após o outro para fazer corresponder o esquema. Durante a pesquisa de dados tabulares na Web, o motor de pesquisa pode devolver o URL em vez de devolver os dados tabulares, o que constitui o principal problema. Por isso, estamos a trabalhar nesta questão: extraímos dados de páginas Web tabulares e extraímos o seu esquema e depois fizemos a correspondência do esquema identificando a correspondência de elementos semelhantes através de uma técnica baseada em corpus. Após a correspondência do esquema, preenchemos os dados das páginas HTML juntando as tabelas relacionadas numa tabela HTML, o que é mais adequado e útil para os utilizadores.
Autorenporträt
Kamran Shaukat arbeitet als Dozent für Informationstechnologie an der University of the Punjab, Jhelum Campus. Jhelum. Er hat einen MS-Abschluss in Informatik mit Goldmedaille der Mohammad Ali Jinnah University, Islamabad, und einen BS-Abschluss in Informatik des Punjab University College of Information Technology, University of the Punjab, Lahore.