49,00 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in über 4 Wochen
  • Broschiertes Buch

In größeren Datensammlungen, die sich mit den gleichen oder ähnlichen Themengebieten befassen, tritt mit hoher Wahrscheinlichkeit die Situation auf, dass sich mehrere Einträge auf dasselbe Objekt in der Realität beziehen. Beispielsweise könnten Einträge zum gleichen Buchtitel in zwei unterschiedlichen Datenbanken vorhanden sein. In einem solchen Fall wäre es wünschenswert, die beiden vorhandenen Einträge durch Record Linkage zu identifizieren, um beispielsweise Duplikate bei einer Zusammenführung der Datenbestände zu vermeiden oder die Informationen einer Quelle mithilfe der zweiten zu…mehr

Produktbeschreibung
In größeren Datensammlungen, die sich mit den gleichen oder ähnlichen Themengebieten befassen, tritt mit hoher Wahrscheinlichkeit die Situation auf, dass sich mehrere Einträge auf dasselbe Objekt in der Realität beziehen. Beispielsweise könnten Einträge zum gleichen Buchtitel in zwei unterschiedlichen Datenbanken vorhanden sein. In einem solchen Fall wäre es wünschenswert, die beiden vorhandenen Einträge durch Record Linkage zu identifizieren, um beispielsweise Duplikate bei einer Zusammenführung der Datenbestände zu vermeiden oder die Informationen einer Quelle mithilfe der zweiten zu vervollständigen.Die vorliegende Arbeit präsentiert einen graphbasierten Ansatz für das Record-Linkage-Problem. Neben einer ausführlichen Einführung in die zugrunde liegenden Techniken und Verfahrensweisen steht vor allem die praktische Erprobung des vorgestellten Algorithmus an repräsentativen Datensammlungen aus dem Bereich bibliographischer Datenbanken im Vordergrund. Der Band richtet sich damitvor allem an Fachleute in der Informatikforschung sowie an betroffene Experten in (Software-)Unternehmen.
Autorenporträt
Schreiber, Martin§Martin Schreiber, Dipl.-Kulturwiss. B.Sc. studierte Kulturwissenschaften und Informatik an der Universität des Saarlandes, Saarbrücken. Er ist derzeit am dortigen Lehrstuhl für Kultur- und Mediengeschichte tätig. Arbeitsschwerpunkte: Geschichte der Digitalisierung und der Wissensorganisation, Angewandte Informatik in den Kulturwissenschaften.