Pawel Broda

Informationsextraktion von Webseiten via RoadRunner (eBook, ePUB)

Leseprobe

Fotogalerie

Als Download kaufen

13,99 €

Statt 17,95 €**

13,99 €

inkl. MwSt.

**Preis der gedruckten Ausgabe (Broschiertes Buch)

Sofort per Download lieferbar

0 °P sammeln

Jetzt verschenken

13,99 €

Statt 17,95 €**

13,99 €

inkl. MwSt.

**Preis der gedruckten Ausgabe (Broschiertes Buch)

Sofort per Download lieferbar

Alle Infos zum eBook verschenken

0 °P sammeln

Als Download kaufen

Geschenk

Pawel Broda

Informationsextraktion von Webseiten via RoadRunner (eBook, ePUB)

Format: ePub

Jetzt bewerten Jetzt bewerten

Geräte: eReader
ohne Kopierschutz
eBook Hilfe
Größe: 2.04MB

Leseprobe

Andere Kunden interessierten sich auch für

Produktbeschreibung

Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik, Note: 1, Ludwig-Maximilians-Universität München (Centrum für Informations- und Sprachverarbeitung), Veranstaltung: Web Data Mining, Sprache: Deutsch, Abstract: Das Web hat sich in den letzten Jahren zum größten existierenden und frei verfügbaren Daten- und Informationsbestand entwickelt. Im Netz, wo es ein absoluter Datenüberfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach benötigten Informationen wird durch unzählige Dokumente gestöbert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. Während die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert können, bleibt ein sehr großer Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zurückgeführt. Die gesuchten Informationen sind nicht mehr statisch verfügbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt. In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden können. Im nächsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.

Dieser Download kann aus rechtlichen Gründen nur mit Rechnungsadresse in A, B, BG, CY, CZ, D, DK, EW, E, FIN, F, GR, HR, H, IRL, I, LT, L, LR, M, NL, PL, P, R, S, SLO, SK ausgeliefert werden.

Produktdetails

Produktdetails
Verlag: GRIN Verlag
Seitenzahl: 22
Erscheinungstermin: 26. Januar 2010
Deutsch
ISBN-13: 9783640518449
Artikelnr.: 51440349

Produktdetails

Verlag: GRIN Verlag
Seitenzahl: 22
Erscheinungstermin: 26. Januar 2010
Deutsch
ISBN-13: 9783640518449
Artikelnr.: 51440349

Herstellerkennzeichnung

Informationsextraktion von Webseiten via RoadRunner (eBook, ePUB)

Informationsextraktion von Webseiten via RoadRunner (eBook, ePUB)

1. Login

2. tolino select Abo