Ein ähnlichkeitsbasiertes Matching-Verfahren für die Integration räumlicher Datenbanken

Author/s:
Michael Schäfers
Amount:
331
EAN/ISBN/ISSN:
978-3-89838-509-1
Publication Date:
Montag, 11. Januar 2016
Volume:
109
Type:
Softcover
Book Series:
Dissertationen zu Datenbanken und Informationssystemen
Kategorien:
Buch
Dissertationen zu Datenbanken und Informationssytemen
Verfügbarkeit: deliverable
Price:
inkl. 7% Tax
50,00 €

Bei der Integration von Geodatenbanken ergeben sich besonders hohe Anforderungen an Matching-Verfahren: Zur Identifizierung verschiedener Repräsentationen des gleichen Realweltobjekts müssen sehr große Datenbestände berücksichtigt werden. Sie stammen meist aus heterogenen Quellen und beinhalten komplexe Objekte.
Das in dieser Dissertation entwickelte SimMatching-Verfahren basiert auf Ähnlichkeiten zwischen räumlichen Objekten und lässt sich durch flexible Kombinationen geometrischer, semantischer und topologischer Ähnlichkeitsmaße an vielfältige Eingabedaten anpassen. Der Greedy-Algorithmus basiert auf abgegrenzten Bausteinen und einer klaren algorithmischen Struktur. Zusammen mit dem Einsatz von Blocking-Techniken zur Reduzierung der Match-Kandidaten wird so eine hohe Effizienz erreicht. Der wohldosierte Einsatz graphbasierter Kriterien und die Bildung von Aggregationen zum Ausgleich unterschiedlicher Modellierungsregeln steigern die Ergebnisqualität. Eine lineare Laufzeitkomplexität ermöglicht die Verarbeitung sehr großer Datenbestände. Die Skalierbarkeit wird durch ein Partitionierungsverfahren und die parallele Bearbeitung disjunkter Partitionen unterstützt.
Im Vergleich mit existierenden Verfahren zur räumlichen Datenintegration kann das SimMatching-Verfahren durch sehr niedrige Laufzeiten und eine konstant hohe Ergebnisqualität überzeugen.