35,90 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in über 4 Wochen
  • Broschiertes Buch

Im Rahmen der Arbeit soll ein existierendes Projekt, namens Dedoop, um zusätzliche Features erweitert werden. Mit Dedoop lassen sich Ähnlichkeiten zwischen den Paaren von Entitäten aus großen Datenmengen feststellen. Die Verarbeitung der Daten erfolgt auf der Grundlage von MapReduce-basierten Verfahren. Das Finden von Ähnlichkeiten ist eine Berechnung, die sehr viel Rechenzeit in Anspruch nimmt. Falls eine Änderung von einer oder mehreren Entitäten in der ursprünglichen Menge erfolgte, muss die Berechnung neu gestartet werden. Die Aufgabe der Arbeit ist, auf die vollständige Wiederholung der…mehr

Produktbeschreibung
Im Rahmen der Arbeit soll ein existierendes Projekt, namens Dedoop, um zusätzliche Features erweitert werden. Mit Dedoop lassen sich Ähnlichkeiten zwischen den Paaren von Entitäten aus großen Datenmengen feststellen. Die Verarbeitung der Daten erfolgt auf der Grundlage von MapReduce-basierten Verfahren. Das Finden von Ähnlichkeiten ist eine Berechnung, die sehr viel Rechenzeit in Anspruch nimmt. Falls eine Änderung von einer oder mehreren Entitäten in der ursprünglichen Menge erfolgte, muss die Berechnung neu gestartet werden. Die Aufgabe der Arbeit ist, auf die vollständige Wiederholung der Vergleiche zu verzichten und einen Weg zu finden, unter der Verwendung von bereits berechneter Matchergebnisse sich nur auf bestimmte Teilmengen zu beschränken, die die Neuberechnung benötigen.
Autorenporträt
Sergej Sintschilin. Ich wurde am 8. Dezember 1987 in Tomsk geboren. Im Jahr 2001 bin ich nach Deutschland umgezogen. Ich interessiere mich für Informatik und generell für Daten-Management. Im Jahr 2016 habe ich mein Master of Science an der Universität Leipzig abgeschlossen. Zurzeit arbeite ich in der Firma sofistiq.