Wissensnetzwerke im Grid
In der Wissenschaft werden in immer mehr Forschungsgebieten Daten und Informationen mit Hilfe von Informationstechnik verwaltet und verarbeitet. Die derzeitige D-Grid-Infrastruktur erlaubt zwar die effiziente Speicherung und Verwaltung dieser Daten, beschränkt sich aber auf die technischen Ressourcen wie Rechenkapazitäten, Datentransportnetze, Speicher und Software. Die eigentlichen Inhalte (wie Forschungs- und Produktionsdaten, Dokumente, Bilder etc.) und das Wissen darüber werden jedoch innerhalb der einzelnen Communities verwaltet. Fachbereichs- oder gar disziplinübergreifende Nutzung sind meist nicht vorgesehen. Effizientes Arbeiten in Wissenschaft und Wirtschaft ist jedoch ohne die Nutzung von bestehendem Wissen und Erfahrungen auch aus anderen Fachdisziplinen kaum noch möglich.
In den meisten Fachgebieten wird dabei Wissen als vernetzte Information verstanden. War es lange Zeit nur dem Menschen vorbehalten durch Erfahrungs- und Denkprozesse aus Daten und Informationen weitergehende Schlüsse zu ziehen und damit Wissen zu generieren, so kann mittlerweile auch mit Hilfe von intelligenten Algorithmen Wissen abgeleitet werden.
Diese beiden Punkte – das Verknüpfen verschiedener fachübergreifender Informationsquellen und die Verwaltung und Ableitung von Wissen – sind die Hauptthemen des Projektes WisNetGrid.
WisNetGrid entwickelt deshalb Dienste, um einen gemeinsamen Wissensraum in der D-Grid-Infrastruktur zu schaffen, der auf der technischen Schicht gemeinsamer Hardware-Ressourcen des D-Grid aufbaut . Dies beinhaltet unter anderem Dienste
- für den Zugriff auf heterogene Datenquellen wie z.B. Grid-Speichersysteme, Datenbanken oder webbasierte Datenquellen
- zur Verwaltung von Metadaten
- zur Verwaltung von Ontologien, deren Vermittlung (Erkennung und Verknüpfung von Überlappungen verschiedener Ontologien) und zur Ontologieschlussfolgerung (Bildung von Inferenzen aus erkannten Zusammenhängen verschiedener Ontologien)
- zur Wissensextraktion aus existierenden Informationen, z.B. Musteranalyse, Synonymerkennung und Faktenextraktion
- zur Verwaltung von Diensten, deren Komposition und Ausführung im Grid
- zur Suche in Daten, Metadaten, Ontologien und Diensten, die die Möglichkeiten der Wissenstechnologien ausnutzen (z.B. mit semantischer Anfrage-Erweiterung)
Anhand der zwei Communities TextGrid und Landschaftsarchitektur, die beispielhaft die Geistes- sowie die Ingenieurwissenschaften repräsentieren, werden konkrete Anforderungen an die Komponenten formuliert und umgesetzt. Die WisNetGrid-Komponenten sind dabei generischer Natur, sodass sie in verschiedene Grid-Infrastrukturen eingebunden und damit von vielen Communities genutzt werden können. Damit wird ein wichtiger Beitrag für die Entwicklung eines Semantic Grid geleistet.
Aufgaben des ZIH
Das ZIH leitet das Projekt. Schwerpunkte der Forschungs- und Entwicklungsarbeiten sind der Informationszugriff (die Schnittstelle zu Daten/Metadaten/Systemen) sowie das Management von Metadaten und Metadatenschemata.
Partner
- Chemnitzer Innovationsgesellschaft UG;
- Technische Universität Dresden – Institut für Landschaftsarchitektur, Zentrum für Informationsdienste und Hochleistungsrechnen;
- Niedersächsische Staats- und Universitätsbibliothek Göttingen;
- T-Systems Solutions for Research GmbH;
- Forschungszentrum Jülich - Jülich Supercomputing Centre;
- Karlsruhe Institut für Technologie - Institut für Angewandte Informatik und Formale Beschreibungsverfahren, Karlsruhe Service Research Institute;
- Max-Planck-Institut für Informatik, Saarbrücken;
- Universität Würzburg - Institut für deutsche Philologie
Laufzeit
07/2009 - 06/2012
Förderung
WisNetGrid-Software
Publikationen
2013
- "Heterogeneous Resource Federation with a Centralized Security Model for Information Extraction", Milad Daivandy, Denis Hünich, René Jäkel, Steffen Metzger, Ralph Müller-Pfefferkorn, Bernd Schuller, Einreichung akzeptiert in Journal of Internet Services and Applications – Special Issue: Data Intensive Computing, 2013
- "Distributed Accounting in Scope of Privacy Preserving", Marcus Hilbrich, René Jäkel, The 8th International Conference on Grid and Pervasive Computing (GPC 2013), Korea
2012
- "Behavior Classes for Specification and Search of Complex Services and Processes", Martin Junghans, Sudhir Agarwal, und Rudi Studer, In Proceedings of the 2012 IEEE 19th International Conference on Web Services (ICWS '12), IEEE Computer Society, Washington, DC, USA, 343-350
- „Interactive Information Extraction based on Distributed Data Management for D-Grid Projects“, René Jäkel, Steffen Metzger, Jason Daivandy, Katja Hose, Denis Hünich, Ralf Schenkel, Bernd Schuller, Proceedings of Science PoS(EGICF12-EMITC2)031
- "Colledge - A Vision of Collaborative Knowledge Networks", S. Metzger, K. Hose, R. Schenkel, 2nd International Workshop on Semantic Search over the Web (SSW)
2011
- "Semantic Modeling of Services and Workflows for German Grid Projects", Sudhir Agarwal, Martin Junghans, René Jäkel, In CEUR Workshop Proceedings, Grid Workflow Workshop 2011, Springer, Köln, März, 2011
- "Meaningful Service Classifications for Flexible Service Descriptions", Sudhir Agarwal, Martin Junghans, Proceedings of The 7th IEEE 2011 World Congress on Services (SERVICES 2011), IEEE, Washington DC, Juli, 2011
- "iBookmarks: Synthesis and Execution of Solution Templates for efficient usage of recurring Web-Process Combinations", Sudhir Agarwal, Fifth IEEE International Conference on Semantic Computing, IEEE, Stanford, USA, September, 2011
- "Generalisierter Informationszugriff zu verteilten Datenquellen im D-Grid", René Jäkel, Milad Jason Daivandy, Patrick Harms, Marcus Hilbrich, Denis Hünich, Bernd Schuller; 4. Workshop Grid- und Cloud-Technologie für den Entwurf technischer Systeme, September 2011, Dresden
- "A Security Approach for Credential-Management in Distributed Heterogeneous Systems", Marcus Hilbrich, Denis Hünich, René Jäkel; Proceedings of the 5th International Symposium on Intelligent Distributed Computing - IDC 2011, Delft, The Netherlands, Oktober 2011
- "S3K: Seeking Statement-Supporting top-K Witnesses", S. Metzger, S. Elbassuoni, K. Hose, R. Schenkel, Proceedings of the 20th ACM International Conference on Information and Knowledge Management (CIKM 2011), pp. 37-46
- "Interaktive Wissensextraktion und Wissenssuche", M. Stoll, K. Hose, S. Metzger, R. Schenkel, Workshop Information Retrieval, LWA 2011, Demo
- "Advances Towards Semantic Plagiarism Detection", H. Issa, K. Hose, S. Metzger, R. Schenkel, Workshop Information Retrieval, LWA 2011
- "Sharing Knowledge between Independent Grid Communities", K. Hose, S. Metzger, R. Schenkel, Workshop on Applications of Semantic Technologies; (AST) 2011
- "Usability of Generic Software in e-Research Infrastructures", Patrick Harms, Colloquium on Digital Humanities and Computer Science, Chicago, 2011
2010
- "Managing large datasets with iRODS—a performance analyses", Denis Hünich, Ralph Müller-Pfefferkorn; 6th Workshop on Large Scale Computations on Grids and 1st Workshop on Scalable Computing in Distributed Systems, p. 647 – 654, Oktober 2010
- "Swapping out Coordination of Web Processes to the Web Browser", Sudhir Agarwal, Martin Junghans; Proceedings of the 9th IEEE European Conference on Web Services (EOCWS), Dezember 2010
-
"ROXXI: Reviving witness dOcuments to eXplore eXtracted Information", S. Elbassuoni, K. Hose, S. Metzger, R. Schenkel; Proceedings of the 36th International Conference on Very Large Data Bases (VLDB 2010), Singapore, 2010, pp. 1589-1592
- "Elicitation of Preferences for Web Service Compositions", Carolin Michels, Sudhir Agarwal, GI Jahrestagung (2) 2010, p103-108
-
"The Quality in Quantity - Enhancing Text-based Research", Patrick Harms, Veröffentlichung für das International Symposium on Grid Computing, März 2010