Mit dem exponentiellen Wachstum der zur Verfügungstehenden Daten im Internet, wächst auch das daringespeicherte Wissen. Ziel dieser Arbeit ist, verschiedene statistischeVerfahren zur Extraktion von semantischen undsyntaktischen Beziehungen zwischen Wörtern zuvergleichen. Dabei werden neben klassischenKookurrenzen auch die distanzabhängigen Kookkurrenzeneingeführt.Diese Aufgaben setzen große Datenmengen voraus. Umdies auch auf mehrere Millionen Sätze anwenden zukönnen, werden performante Datenstrukturen benötigt.Weiterhin werden einige Heuristiken für dasperformante Speichern von mehreren MilliardenKookkurrenz-Datensätzen vorgestellt und derenAuswirkungen gemessen.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno