Diplomarbeit Susanne Schmidt
Verfahren zur Integration heterogener Adressdatenbestände am Beispiel der Schweizer und OASIS Adressmodelle als Teilaspekt von Geodateninfrastrukturen.
eingereicht von: | Susanne Schmidt |
Tag der Verteidigung: | 02.Mai 2008 |
Prof. Dr. rer. nat. Lars Bernard Dipl.-Ing. Ullrich Olunczek |
Kurzfassung
Geoinformation ist in den letzten Jahren immer wichtiger geworden. Sie dient als Grundlage für Planungen, Entscheidungen und Projekte im politischen, ökonomischen, wissenschaftlichen sowie auch privaten Bereich. Seit über zwei Jahrzehnten wurden an den unterschiedlichsten Stellen (Wirtschaft, Private, Behörden, Ämter, Planungs- und Ingenieurbüros usw.) Daten mit Raumbezug erhoben. Aufgrund zahlreicher Verbesserungen im technischen Bereich (Internet, Aufnahmetechniken, Datenspeicherung, etc.) ist das Interesse an Geodaten weiter gestiegen. So werden neue Anwendungsfelder erschlossen und auch geoferne Branchen kommen vermehrt damit in Kontakt. Das weltweite wirtschaftliche Potential im Fernerkundungs- und Geoinformationswesen wurde von der Zeitschrift Geomatica im Januar 2000 bereits auf 2,8 Milliarden Euro geschätzt. Was läge näher als auf bereits vorhandene Daten zurückzugreifen und deren Austausch weiter voranzutreiben?
Diese Idee soll mit Hilfe von Geodateninfrastrukturen maßgeblich unterstützt werden. In nunmehr über einer Dekade haben bereits über 120 von 192 Ländern weltweit eine nationale Geodateninfrastruktur entwickelt oder sind dabei diese zu realisieren.
Einer der wichtigsten Aspekte für den erleichterten Geodatenaustausch in GDIs ist natürlich die Interoperabilität der Daten (und Dienste). Bei der Kombination von Daten, die isoliert voneinander aufgenommen und erfasst wurden, kann es hierbei zu einer Vielzahl von Problemen kommen, z.B. wenn unterschiedliche Datenmodelle zugrunde liegen. Interoperabilität ist hier letztenendes nur gewährleistet, wenn einheitliche Standards gefunden und eingehalten werden, die eine Harmonisierung der Geodaten ermöglicht. Anderenfalls müssen Methoden vorhanden sein, die die Transformation der Datenmodelle ohne Informationsverlust erlauben. Die Abbildung der Modelle aufeinander wird Schema Mapping bzw. Matching genannt. Um dies zu bewerkstelligen müssen Abbildungsregeln gefunden werden, die Objekte und ihre Attribute richtig aufeinander abbilden.
Diese Diplomarbeit beschäftigt sich mit Schema Mapping exemplarisch anhand zweier Adressmodelle. Dafür wurde der internationale Adressstandard von OASIS und der Schweizer Postadressstandard eCH-0010 gewählt. Adressmodelle wurden bereits in vielen Ländern definiert und stetig weiter entwickelt. Sie werden nicht nur für Post- und Warenzustellungen benötigt, sondern vermehrt auch in anderen Bereichen, z.B. bei der Verwaltung von Land, Versorgungseinrichtungen, Katastrophenmanagement etc.
Im allgemeinen Trend des Aufbaus von GDIs und des steigenden Bedarfes an Geodaten- und Diensteaustausch werden Adressmodelle auch in diesem Zusammenhang wichtiger. Sie dienen vor allem als Referenz damit Daten eingeordnet und verknüpft werden können.
Um diese Modelle beidseitig aufeinander abzubilden wurde die Methode XSLT gewählt- die eXtensible Stylesheet Language Transformation- die XML-Dokumente mittels selbst zu definierender Abbildungsregeln ineinander umwandeln kann. Diese Methode bot sich aus vielerlei Gründen an: Zum einen lagen beide Modelle (wie die meisten Adressmodelle) bereits in XML-Beschreibung vor, zum anderen wird XSLT in den letzten Jahren schon vermehrt eingesetzt und nichtzuletzt ist es eine kostenlose Methode. Außerdem ist es ein weltweit anerkannter Standard.
Um die automatische Transformation der Modelle zu ermöglichen wurde ein Java-Programm erstellt, welches die Quelldatei einliest und sie mittels der in XSLT formulierten Regeln in das Schema des Zielmodells umwandelt. Für die Überprüfung des Ergebnisses kann die Ausgabedatei gegen das Zielschema validiert werden.
Die Abbildung der Modelle aufeinander gelang, wobei sich jedoch gewisse Probleme beim Finden der Abbildungsregeln zeigten, die in Diplomarbeit und Verteidigung näher erörtert werden.
Generell kann festgehalten werden, daß das Mappen großer und stark verschachtelter XML-Dokumente (wie der OASIS- Standard) mit XSLT schnell kompliziert bzw. unübersichtlich werden kann und dafür wahrscheinlich nicht die optimalste Lösung ist. Zusätzlich ist es in solchen Fällen schwierig immer eine exakte Abbildungsregel zu finden. Mitunter gelingt nur eine Umwandlung mit semantischem Informationsverlust. Für weniger verschachtelte Modellbeschreibungen hingegen ist es eine zuverlässige und einfache Methode.