Los datos tabulares son una fuente de información disponible en la web. Hemos empezado a trabajar en la recopilación de tablas HTML extraídas de la web. En primer lugar, se identificarán las tablas de buena calidad y, a continuación, se procederá a la correspondencia de esquemas. La correspondencia de esquemas identifica el número de correspondencias que determinan los elementos similares de dos esquemas diferentes. Las columnas y los valores de los datos se comparan uno tras otro para hacer coincidir los esquemas. Cuando se buscan datos tabulares en la web, el motor de búsqueda puede devolver una URL en lugar de devolver datos tabulares, lo cual es el principal problema. Para resolver este problema, hemos extraído datos de páginas web tabulares y su esquema y, a continuación, los hemos comparado identificando la correspondencia de elementos similares mediante una técnica basada en corpus. Tras la correspondencia de esquemas, hemos rellenado los datos de las páginas HTML uniendo las tablas relacionadas en una tabla HTML, lo que resulta más apropiado y útil para los usuarios.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.