Graphbasiertes Record Linkage

In größeren Datensammlungen, die sich mit den gleichen oder ähnlichen Themengebieten befassen, tritt mit hoher Wahrscheinlichkeit die Situation auf, dass sich mehrere Einträge auf dasselbe Objekt in der Realität beziehen. Beispielsweise könnten Einträge zum gleichen Buchtitel in zwei unterschiedlichen Datenbanken vorhanden sein. In einem solchen Fall wäre es wünschenswert, die beiden vorhandenen Einträge durch Record Linkage zu identifizieren, um beispielsweise Duplikate bei einer Zusammenführung der Datenbestände zu vermeiden oder die Informationen einer Quelle mithilfe der zweiten zu vervollständigen. Die vorliegende Arbeit präsentiert einen graphbasierten Ansatz für das Record-Linkage-Problem. Neben einer ausführlichen Einführung in die zugrunde liegenden Techniken und Verfahrensweisen steht vor allem die praktische Erprobung des vorgestellten Algorithmus an repräsentativen Datensammlungen aus dem Bereich bibliographischer Datenbanken im Vordergrund. Der Band richtet sich damit vor allem an Fachleute in der Informatikforschung sowie an betroffene Experten in (Software-)Unternehmen.

Martin Schreiber, Dipl.-Kulturwiss. B.Sc. studierte Kulturwissenschaften und Informatik an der Universität des Saarlandes, Saarbrücken. Er ist derzeit am dortigen Lehrstuhl für Kultur- und Mediengeschichte tätig. Arbeitsschwerpunkte: Geschichte der Digitalisierung und der Wissensorganisation, Angewandte Informatik in den Kulturwissenschaften.

Verwandte Artikel

Download
PDF
Graphbasiertes Record Linkage Martin Schreiber

49,00 €*

Weitere Produkte vom selben Autor

Der Norden Kanadas mit Alaska Arnold, Michaela, Bergold, Holger, Pundt, Martin, Schreiber, Karin

18,95 €*
Download
PDF
Die Informationsvermittlungsstelle. Planung - Einrichtung - Betrieb Rainer Pörzgen, Martin Schreiber

109,95 €*
Download
PDF
Kompakt-Training Controlling Martin Schreiber, Klaus Schulte

20,99 €*