Forschungsdatanmanagement (FDM) – Eine Praktikable Lösung zur Erfassung, Integration und Analyse von Forschungsdaten in Ingenieursverbundprojekten
Motivation
In ingenieurwissenschaftlichen Verbundprojekten werden heutzutage zunehmend datengetriebene Methoden eingesetzt, um Wissen über Wechselwirkungen zwischen Materialeigenschaften, Prozesseinflüssen, Strukturparametern und Produkteigenschaften aufzubauen. Die erforderlichen Datensätze stammen in der Regel aus verschiedenen Datenquellen (Prozesse, Systeme, Geräte, Software usw.) und müssen mittels Digitalisierung erschlossen werden. Aufgrund der vielfältigen Einflüsse bspw. auf das Materialverhalten oder aufgrund der wirkenden Wechselwirkungen in den Fertigungsprozessen sind meist Kooperationen zwischen den relevanten Fachdisziplinen der Ingenieurwissenschaften erforderlich. Das hat typischerweise zur Folge, dass im Verbundprojekt mehrere Partner an der Datenerfassung beteiligt sind. Unterschiedliche Partner haben unterschiedliche Arbeitskulturen, unterschiedliche Fachsprachen, unterschiedliche technische Infrastrukturen.
Das Forschungsdatanmanagement (FDM) ist eine zwingende Voraussetzung für die eigentliche Aufgabe, mittels Datenanalyse Wissen zu generieren und zu modellieren. Die Arbeitsgruppe „Maschinendatenverwertung“ besitzt Expertise zur Datenanalytik und wird deshalb häufig in Verbundvorhaben involviert. Dort sind jedoch in der Regel zunächst analysefähige Datensätze aus den Einzeldaten der Partner herzustellen, was ein fundiertes Konzept zum FDM inklusive Umsetzung erfordert. Bild 1 fasst die Anforderungen zusammen, die wir in der für ein praktikables FDM für wichtig erachten.
Bild 1: Sichtweise der Arbeitsgruppe „Maschinendatenverwertung“ auf die Herausforderungen an ein praktikables FDM [1]
Ziel der Forschung und Entwicklung
Das Ziel unserer Arbeit ist die Entwicklung eines geeigneten Konzepts zum FDM für Verbundprojekte insbesondere in den Ingenieurwissenschaften. Schwerpunkte sind die nachhaltige Dokumentation der Forschungsdaten unter Einhaltung der FAIR-Prinzipien sowie die Verknüpfung der Daten entlang der Prozesskette und schließlich die Herstellung der Analysefähigkeit von Daten. Da ein erfolgreiches FDM von der Akzeptanz des FDM-Systems bei den Nutzern lebt, sind uns ebenso alle unterstützenden Funktionen wichtig, die die Arbeit der Anwender mit FDM und darüber hinaus verbessern.
Herausforderungen an ein praktikables FDM [2]
Für die Realisierung der erforderlichen Datenflüsse und für die Befähigung von Konsortien zur Kollaboration ist ein leistungsfähiges FDM notwendig. Dabei sind sowohl klassische Anforderungen wie die FAIR-Prinzipien (F: Findable: A: Accessible, I: Interoperable: R: Reusable) bzgl. der Forschungsdaten als auch projektspezifische Anforderungen zu berücksichtigen. In der Summe sehen die Anforderungen an das FDM und die Forschungsdaten-Infrastruktur (FDI) meist wie folgt aus (Bild 1):
FAIR-Prinzipien
- Gute Zugänglichkeit der Daten (interne und externe Erreichbarkeit der Daten) wird benötigt, damit von unterschiedlichen Standorten gearbeitet werden kann.
- Hoher Datenschutz wird benötigt, um die Forschungsdaten vor unerlaubtem Zugriff zu schützen. Dies erfordert insbesondere ein feingranulares Rollen-Rechte-Management und verschlüsselte Verbindungen in der FDI.
- Leichte Auffindbarkeit bzw. gute Recherchefähigkeit der Daten wird für ein effizientes Arbeiten im Verbundprojekt benötigt.
- Gute Interoperabilität der Daten ist für die Verknüpfung von Datensätzen verschiedener Prozesse (Beteiligung verschiedener Labore und verschiedener Projektpartner) nötig.
- Nachhaltigkeit der Daten ist für die Nutzung der Daten während und nach Ende des Projekts durch Archivierung der Daten notwendig.
- Zitierfähigkeit der Daten wird für eine Referenzierung publizierter Forschungsdaten, z.B. über persistente Identifier wie Digital Object Identifier (DOI) benötigt.
Dokumentation der Daten
- Nachvollziehbare Dokumentation und gute Erklärbarkeit der Daten wird benötigt, damit projektbeteiligte Fachexperten und Dritte verstehen, was die Daten bedeuten und unter welchen Zielstellungen und Bedingungen diese generiert wurden. Für eine nachvollziehbare Dokumentation von Versuchen ist es notwendig, dass verwendete Verfahren, Maschinen, Werkzeuge und Materialen detailliert beschrieben sind, um Zusammenhänge herstellen zu können. Die Beschreibungen sollten dabei auf einer gemeinsamen Fachsprache basieren, damit alle Forschenden im Verbundprojekt, die oft aus verschiedenen Fachdisziplinen kommen, unter den verwendeten Begriffen dasselbe verstehen.
- Eindeutige Bezeichnung von Proben ist für die Zusammenführung der Daten aus verschiedenen Prozessen und für die Rückverfolgung der Proben entlang von Prozessketten erforderlich.
- Verknüpfung der Daten entlang der Prozesskette wird für die Erforschung prozessübergreifender Wechselwirkungen benötigt
Praktikabilität
- Hohe Nachhaltigkeit und Flexibilität des FDM-Konzepts sind für die Übertragung und Weiterentwicklung des FDM-Konzepts auf andere Verbundprojekte unerlässlich. Insbesondere sollten aktuelle Entwicklungen aus der Forschungsdaten-Initiative NFDI eingebaut werden können.
- Geringer Aufwand für Aufbau und Wartung der FDI sind für eine schnelle Umsetzung des FDM-Konzepts und die Arbeitsfähigkeit des Konsortiums entscheidend.
- Hohe Benutzerfreundlichkeit der FDI ist für eine hohe Akzeptanz des Systems nötig, um Forschende zu einer motivierten Verwendung des FDM zu bringen.
- Beibehaltung bzw. Integration von Arbeitskulturen der beteiligten Labore ist notwendig, damit das FDM-Konzept akzeptiert wird und keine Parallelwelten bzw. Labor-eigene Lösungen entstehen.
Nachhaltige Nutzung
- Das Umsetzen der FAIR-Prinzipien in einem praktikablen FDM muss in der Regel mit geringer Kapazität erfolgen. Deshalb sollte die FDM Lösung nachhaltig (wiederverwendbar und anpassbar) für Folgeprojekte sein.
Unser Lösungsansatz, unsere Architektur des FDM [2]
FDM-Konzept und Basisfunktionalität
- Trennung Datenablage (über Filesystem) und Datenmanagement (über Web-Frontend) für unabhängigen Zugriff
- Sicherer Datenaustausch durch verschlüsselte Verbindungen (SSH, HTTPS)
- Feingranulare Rechteverwaltung im Web-Frontend und in Datenablage durch ID-Management
- Zugriff auf Forschungsdaten für externe Projektpartner (Institute, Firmen) über VPN
- Dokumentation der Forschungsdaten über Metadatenschemata
- Fachspezifische Taxonomie zur Verschlagwortung und zur Verwendung in Metadatenschemata
Funktionen für Praktikabilität
- Datenmanagement über bekannte und gewohnte Weboberfläche (MS SharePoint-Website)
- Agile Verwaltung der Proben-ID
- Abbildung des Proben-Flusses / Rückverfolgbarkeit von Proben über Verknüpfung der Proben-IDs
- Anpassung der Verschlagwortung an gemeinsame Fachsprache durch Anbindung an Ontologie für Angewandte Wissenschaften (hier: EMMO: European Materials Modeling Ontology)
- Daten- und rechenintensive Analysen & Simulationen durch Nutzung von HPC-Ressourcen
- Durchgängiger Workflow von Datenerfassung bis zur Datenpublikation (über DOI)
Effiziente und nachhaltige FDM-Lösung
- Nutzung von IT-Infrastruktur und Serviceangeboten des Rechenzentrums (hier: ZIH der TU Dresden)
- Nutzung der Basisfunktionen in MS SharePoint
- Einfache Übertragbarkeit auf neue Ingenieurprojekte
Bild 2. Architektur für das praktikable FDM-System [2]
Aktuelle Forschungsarbeiten
- Verallgemeinerung und Review der prototypischen Funktionen für ein einfaches Deployment in andere Projekte und zu anderen Partnern
- Automatisierte Verschlagwortung
- Navigation in den Daten über grafische Prozessansichten, die den Abläufen im Projekt entsprechen.
Call to Action
Wir sind an spannenden Forschungsfragen interessiert, die wir datengetrieben beantworten können. Wir bringen die Expertise zu einem praktikablen FDM mit und dienen als Schnittstelle zu den IT-Abteilungen.
Wir sind interessiert an einer Nachnutzung unserer FDM-Lösung und daran, dass wir diese entsprechend ihrer Anforderungen weiterentwickeln können.
Wir führen gern Workshops zum Thema FDM durch, insbesondere für Ingenieurprojekte.
Publikationen
5 |
Zinner, M.; Conrad, F.; Feldhoff, K.; Wiemer, H.; Weller, J.; Ihlenfeldt, S.: A Metadata Model for Harmonising Engineering Research Data Across Process and Laboratory Boundaries. in COGNTIVE 2024: The Sixteenth International Conference on Advanced Cognitive Technologies and Applications, 2024, pp. 30-39. [Online]. Available: https://www.thinkmind.org/articles/cognitive_2024_1_50_40019.pdf |
4 | Raßloff, Alexander; Feldhoff, Kim; Wiemer, Hajo; Zimmermann, Martina; Kästner, Markus: AMTwin - Datengetriebene Prozess-, Werkstoff- und Strukturanalyse für die additive Fertigung. Konferenzbeitrag „Mobilität der Zukunft – Bauteilzuverlässigkeit im digitalen Zeitalter - DVM-Tag 2023“, Berlin, 2023, http://doi.org/10.48447/DVM-TAG-2023-150 |
3 | Wiemer, Hajo; Feldhoff, Kim; Ihlenfeldt, Steffen: Praktikable IT-Infrastruktur zur Erfassung, Integration und Analyse von Forschungsdaten in Ingenieursverbundprojekten. Poster „SaxFDM-Tagung“, 2022, Zenodo. http://doi.org/10.5281/ZENODO.7155861 |
2 | Feldhoff, K. ; Wiemer, H. : Praktikables, Ontologie-basiertes Forschungsdatenmanagement in der Additiven Fertigung. In: Brockmann, S. ; Krupp, U. (Hrsg.): 39. Vortrags- und Diskussionstagung Werkstoffprüfung „Werkstoffe und Bauteile auf dem Prüfstand: Prüftechnik – Kennwertermittlung – Schadensvermeidung“. Düsseldorf: Stahlinstitut VDEh, 2021, ISBN 978-3-941269-98-9 |
1 | Feldhoff, K. ; Wiemer, H. ; Ihlenfeldt, S. : FDM als Service für ein typisches Verbundprojekt in den Ingenieurwissenschaften auf Basis einer ontologie-basierten Verschlagwortung. In: Digital Kitchen von SaxFDM, online, 18.11.2021 DOI: 10.5281/zenodo.5718660 |