Kamran Shaukat, Nayyer Masood, Sundas Mehreen Fatima Haider

Popolazione di dati nello schema delle tabelle web estratte

Fotogalerie

Kamran Shaukat, Nayyer Masood, Sundas Mehreen Fatima Haider

Popolazione di dati nello schema delle tabelle web estratte

Broschiertes Buch

Jetzt bewerten Jetzt bewerten

Autorenporträt

Andere Kunden interessierten sich auch für

Produktbeschreibung

I dati tabellari sono una fonte esistente di informazioni disponibili sul web. Abbiamo iniziato a lavorare sulla raccolta di tabelle HTML prese dal web. In primo luogo verranno identificate le tabelle di buona qualità e poi si procederà alla corrispondenza degli schemi. Lo Schema Matching identifica il numero di corrispondenze che determina gli elementi simili di due schemi diversi. Le colonne e i valori dei dati vengono confrontati uno dopo l'altro per farli corrispondere allo schema. Durante la ricerca di dati tabellari sul web, i motori di ricerca possono restituire URL invece di dati tabellari, il che rappresenta il problema principale. Per questo motivo, abbiamo estratto i dati delle pagine web tabellari, abbiamo estratto i loro schemi e poi abbiamo fatto il matching degli schemi identificando la corrispondenza di elementi simili attraverso una tecnica basata sul corpus. Dopo la corrispondenza dello schema, abbiamo popolato i dati delle pagine HTML unendo le tabelle correlate in un'unica tabella HTML, che è più appropriata e utile per gli utenti.

Produktdetails

Produktdetails
Verlag: Edizioni Sapienza
Seitenzahl: 56
Erscheinungstermin: 16. Juni 2024
Italienisch
Abmessung: 220mm x 150mm x 4mm
Gewicht: 102g
ISBN-13: 9786207667574
ISBN-10: 6207667573
Artikelnr.: 70971629

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511

Produktdetails

Verlag: Edizioni Sapienza
Seitenzahl: 56
Erscheinungstermin: 16. Juni 2024
Italienisch
Abmessung: 220mm x 150mm x 4mm
Gewicht: 102g
ISBN-13: 9786207667574
ISBN-10: 6207667573
Artikelnr.: 70971629

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511

Autorenporträt

Kamran Shaukat arbeitet als Dozent für Informationstechnologie an der University of the Punjab, Jhelum Campus. Jhelum. Er hat einen MS-Abschluss in Informatik mit Goldmedaille der Mohammad Ali Jinnah University, Islamabad, und einen BS-Abschluss in Informatik des Punjab University College of Information Technology, University of the Punjab, Lahore.