Kurzbeschreibung
Inhalt
[Erlernen semantischer Cluster aus Dokumentenbeständen]
[Kontextwissen in Produkt-/Produktdatenmodellen]
[Modellierung von Unsicherheiten]
[Vorarbeiten und Erfahrungen am CIB]
[Literatur]
Erlernen semantischer Cluster aus Dokumentenbeständen
Ansätze für das Auswerten von Dokumenten lassen sich nach dem Grad der angenommen Strukturierung der Dokumente einteilen. Wir betrachten hier einerseits die Auswertung nicht explizit strukturierter Dokumente und SGML-basierter Dokumenttypen als standardisierten Ansatz. Unser Forschungsansatz hat die Auswertung formfreier Dokumente unter dynamischer Einbringung von Hintergrundwissen zum Ziel, da diese heute noch den größten Teil der Dokumente darstellen.
Das Projekt wurde von einem Ansatz zum Lernen von Ontologien aus Dokumenten von Dong und Agogino [Dong und Agogino 1997] motiviert. Diese nutzen ein zweistufiges Verfahren, das in der ersten Stufe einen gegebenen Text wortweise analysiert und darauf aufbauend in der zweiten Stufe zugehörige semantische Cluster erzeugt. Die so generierten Strukturen erlauben, das Generieren von Hypothesen über Zusammenhänge und Inhalte der betrachteten Dokumente. Der Ansatz sieht sich als Vermittlung zwischen der rein unstrukturierten Text-Analyse und rein struktur-basierten Ansätzen. Durch das Clustering nach der Textanalyse wird eine Art hierarchische Struktur aufgebaut, die man als das aus dem Text �gelernte� Produktdatenmodell interpretieren kann. Hier liegt die Analogie zu unserem Forschungsansatz, indem wir das aus Dokumenten gelernte und damit vage Produktmodell durch das tatsächliche Produktmodell wesentlich konkretisieren. Für das Clustering wird von Dong et al. ein unüberwachtes Verfahren maschinellen Lernens verwendet, d.h. in das Verfahren geht a priori kein Wissen über mögliche Zusammenhänge und Beziehungen ein. Dies erlaubt grundsätzlich die Anwendung des Systems für beliebige Domänen und kann damit von uns auch als Start der Analyse herangezogen werden, führt aber zu Kompromissen hinsichtlich der Qualität der Hypothesen.
Durch die Verbindung mit dem tatsächlichen Kontextwissen soll in diesem Forschungsvorhaben die Qualität der hierarchischen Struktur daruf hin wesentlich verbessert werden.
Kontextwissen in Produkt-/Produktdatenmodellen
Die Quelle für gesichertes Hintergrund- bzw. Kontextwissen sind einerseits das in Produktdatenmodellen formalisierte projekt-invariante Wissen und die im Projektverlauf in Produktmodellen instantiierten Objekte und Relationen, das projekt-spezifische Wissen. Wesentlich für das hier beantragte Vorhaben ist damit auch der Stand der Forschung im Bereich der Produktmodellierung.
Speziell im Bauwesen sind sowohl auf internationaler Ebene sowie auf europäischer und deutscher Ebene Ansätze für die Repräsentation von Produktdaten verfolgt worden, die den Austausch funktioneller und technischer Beschreibungen ermöglichen. Die wesentlichen Ziele der im Bereich der Produktmodellierung entwickelten Konzepte lassen sich in den folgenden Punkten kurz zusammenfassen:
Entwicklung von Datenstrukturdefinitionen als Building Blocks für anwendungsspezifische Datenmodelle. Es werden logische Modelle definiert, aus denen für Applikationen bzw. Gruppen von Applikationen spezifische Sichten abgeleitet werden.
Integration heterogener Softwarewerkzeuge über standardisierte Schnittstellen.
Abbildung und Übergang zwischen verschiedenen Modellsichten.
Interoperabilität für die Kohärenz der verteilten Bauwerkmodelle.
Modellierung von Unsicherheiten
Es gibt eine Reihe von Ansätzen und Modelle für die Behandlung von Unsicherheit innerhalb der Forschungsrichtung Künstliche Intelligenz wie certainty factors, Dempster-Shafer theory [Barnett, 1991] und Belief Networks neben der klassischen Wahrscheinlichkeitstheorie und der Fuzzy-Theorie in der Mathematik.
Ein für die gegebene Zielrichtung vielversprechender Ansatz sind Belief Networks [Oliver und Smith, 1990; Russel und Norvig, 1995]. Ein Belief Network ist eine Datenstruktur, die Abhängigkeiten zwischen verschiedenen Variablen repräsentiert. Jeder Knoten in dem das Netzwerk definierenden gerichteten Graphen hat eine zugeordnete Tabelle von bedingten Wahrscheinlichkeiten, die den Einfluss von vorgeordneten Knoten auf den aktuellen Knoten quantifizieren. Im Kontext dieses Forschungsvorhabens erlauben Belief-Netzwerke das Schlussfolgern auf der Basis von mit Unsicherheiten behafteten Zusammenhänge zwischen Begriffen und den durch sie repräsentierten Sachverhalten.
Vorarbeiten und Erfahrungen am CIB
Auswertung und Management von Dokumenten
In dem ESPRIT Projekt ToCEE (Towards a Concurrent Engineering Environment), bei dem der Lehrstuhl federführend ist, werden seit 1.1.96 im Work-Package G: Document Modelling von einem englischen Partner Methoden zur Integration von Dokumentinformation untersucht. Die hier gewonnenen Erfahrungen bezüglich der Anforderung an die Strukturierung von Dokumenten und den in der Praxis in Bauvorhaben tatsächlich vorliegenden Dokumenttypen können direkt in das hier beantragte Forschungsvorhaben einfließen. Im Work-Package E: Information Logistics werden vom Lehrstuhl Konzepte untersucht, die den Umgang mit Information in verschiedenster Strukturierung, fokussiert auf Dokument-Metadateien, integrieren. Das hier angesammelte Wissen über mögliche Strukturierungen von Information in Dokumenten und typische Kommunikationskontexte ist sehr wertvoll für dieses Vorhaben.Die Schlüsselwörter, die mittels Textanalyseverfahren aus den Dokumenten abgeleitet werden, sind zu klassifizieren, um höherwertige Zusammenhänge zu erstellen. Hierzu soll die objekt-zentrierte Methode eingesetzt werden, die im DFG-Projekt Sche 223/19-1 �Ähnlichkeitsbasierte Suche von Lösungsvarianten aus einer objekt-orientierten Produktinformationsdatenbank� für CAD-Planung erfolgreich angewendet wurde.
Produktmodellierung
Für das beantragte Forschungsvorhaben kann die im Rahmen des ESPRIT III Projekts 6609(COMBI) [Scherer, 1995] geleistete Forschungsarbeit genutzt werden. Im Work-Package A: Product Modelling dieses Projekts wurde ein allgemeines Produktmodell auf der Basis von STEP (ISO 10303) zur Integration unterschiedlicher Agenten des Gebäudeentwurfs entwickelt. Insbesondere eine umfangreiche, vorbereitende Wissensakquisition und die Entwicklung eines objekt-orientierten Modellierers für Tragstrukturen in Massivbauweise sind eine wichtige Basis für das beantragte Forschungsvorhaben. In den Modellierungsrahmen des aktuellen ToCEE-Projekts fließt das IFC-Modell als Grundlage ein und wird wesentlich durch den Antragsteller erweitert. Ein Arbeitspunkt ist die Interoperabilität mittels Mapping- und Matching-Methoden mit anderen Produktmodellen. Damit ist aus der Perspektive der Produktmodellierung ein Ausgangspunkt für die Extraktion von Wissen über Beziehungen aus zugehörigen Produktdatenmodellen und instantiierten Produktmodellen gegeben.Repräsentation von Unsicherheit
Am Lehrstuhl wird parallel neben der Informatik Grundlagenforschung im Bereich der Zuverlässigkeit im Bauwesen erbracht. Der Antragsteller arbeitet seit 1979 durchgehend auf dem Gebiet der Zuverlässigkeitstheorie. Im DFG-Projekt Sche 223/14-1 wurden z. B. Markovketten, die den hier vorgeschlagenen Belief-Netzwerken sehr ähnlich sind, auf Rissfortschrittsprobleme angewandt.Mit dem Thema der Belief-Netzwerke und den Algorithmen zur Wissensakquisition mit Hilfe dieser Methode steht weiterhin die Forschung des Lehrstuhl im Bereich Maschinelles Lernen im Zusammenhang. Im DFG-Projekt Sche 223/13-1 wurden grundsätzlich Verfahren des Maschinellen Lernens auf ihre Eignung für das Bauwesen und Möglichkeiten der Adaption dieser Verfahren untersucht. Die erzielten Ergebnisse und die gesammelten Erfahrungen erlauben eine fundierte Abschätzung der Eignung der Belief-Netzwerk-Methode und der für den Baubereich nötigen Anpassungen.
Für die Erarbeitung einer Wissensbank zur Repräsentation von Erfahrungswissen kann auf die Methoden, die in den DFG-Projekten Sche 223/3 und Sche 223/18 erforscht wurden, aufgebaut werden.
Literatur
Dong A., Agogino A. M. (1997): Text Analysis for Constucting Design Representations. In: Artificial Intelligence in Engineering, Band 11 (2)
Barnett, J. A. (1991): Calculating Dempster-Shafer Plausibility. In: IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-13(6), S. 599-602
Oliver R. M., Smith J. Q. (Hrsg.) (1990): Influence Diagrams, Beliefe Nets and Decision Analysis. Wiley
Russel, S., Norvig P. (1995): Artificial Intelligence - A Modern Approach. Prentice Hall, New Jersey
Scherer R. J.(1995): COMBI: Overview and Objectives. In: Scherer R.J. (Hrsg.): Proceedings of the First European Conference on Product and Process Modelling in the Building Industry, Balkema, Rotterdam