Ein Handbuch zur Migration von parallelen Webcrawlern

Fotogalerie

Md. Faizan Farooqui, Mohd. Muqeem

Ein Handbuch zur Migration von parallelen Webcrawlern

Broschiertes Buch

Jetzt bewerten Jetzt bewerten

Autorenporträt

Andere Kunden interessierten sich auch für

Produktbeschreibung

Die Größe des Internets ist groß und es ist enorm gewachsen, Suchmaschinen sind die Werkzeuge für die Navigation und Suche auf Webseiten. Suchmaschinen führen Indizes für Webdokumente und bieten Suchmöglichkeiten durch kontinuierliches Herunterladen von Webseiten zur Verarbeitung. Dieser Prozess des Herunterladens von Webseiten wird als Web-Crawling bezeichnet. In diesem Buch wird eine Architektur für einen effektiven migrierenden parallelen Web-Crawling-Ansatz mit domänenspezifischer und inkrementeller Crawling-Strategie vorgeschlagen. Die Hauptvorteile des parallelen Web-Crawlers bestehen darin, dass der Analyseteil des Crawling-Prozesses lokal am Aufenthaltsort der Daten und nicht im Repository der Web-Suchmaschine durchgeführt wird. Dies reduziert die Netzwerklast und den Datenverkehr erheblich, was wiederum die Leistung, Effektivität und Effizienz des Crawling-Prozesses verbessert. Ein weiterer Vorteil der Migration eines parallelen Crawlers ist, dass mit zunehmender Größe des Webs die Parallelisierung eines Crawling-Prozesses notwendig wird, um das Herunterladen von Webseiten in vergleichsweise kürzerer Zeit zu beenden. Domänenspezifisches Crawling wird qualitativ hochwertige Seiten liefern.

Produktdetails

Produktdetails
Verlag: Verlag Unser Wissen
Seitenzahl: 260
Erscheinungstermin: 7. August 2022
Deutsch
Abmessung: 220mm x 150mm x 16mm
Gewicht: 405g
ISBN-13: 9786205058633
ISBN-10: 6205058634
Artikelnr.: 64971818

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511

Produktdetails

Verlag: Verlag Unser Wissen
Seitenzahl: 260
Erscheinungstermin: 7. August 2022
Deutsch
Abmessung: 220mm x 150mm x 16mm
Gewicht: 405g
ISBN-13: 9786205058633
ISBN-10: 6205058634
Artikelnr.: 64971818

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511

Autorenporträt

O Dr. Md. Faizan Farooqui fez MCA,M.Tech, Ph.D., trabalhando como Professor Associado no Departamento de Aplicações Informáticas, Universidade Integral, Lucknow, Índia. Ele tem mais de 18 anos de experiência no campo académico. Está activamente envolvido na investigação e publicou artigos em revistas de renome e também membro de vários organismos profissionais.