16.07.2021
Finden ist das neue Suchen
Forschungsdaten in der NFDI: Intelligent und FAIR*
FAIRmat, Text+, NFDI4earth und NFDI4DataScience sind aktuelle Projekte, die am 2. Juli von der Gemeinsamen Wissenschaftskonferenz (GWK) in einem mehrstufigen Wettbewerb der Nationalen Forschungsdateninfrastruktur (NFDI) zur Förderung ausgewählt wurden. Die vier Projekte, an denen das ZIH und die Kontaktstelle Forschungsdaten der TU Dresden sich beteiligen, haben sich dem Thema Forschungsdaten und deren nationaler und globaler Nutzung verschrieben – intelligent, langfristig und strukturiert. Es geht um grundlegenden Infrastrukturen: Das Speichern und damit die Sicherstellung des (auch fachübergreifenden) Teilens und Findens sind in den jeweils unterschiedlichen Wissenschaftsbereichen und deren Kulturen zentrale Anliegen.
In der Nationalen Forschungsdateninfrastruktur (NFDI) sollen Daten aus der Forschung in Deutschland fachübergreifend und systematisch erschlossen, vernetzt und nachnutzbar zur Verfügung gestellt werden. Bund und Länder fördern den NFDI-Aufbau über die nächsten 10 Jahre mit fast einer Milliarde Euro. Anfang Juli hat die Gemeinsame Wissenschaftskonferenz (GWK) die Bewilligung für zehn Projekte aus der mittlerweile zweiten Ausschreibungsrunde bekannt gegeben. Das Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) der TU Dresden bringt sein Know-how in vier dieser neuen Vorhaben ein.
"Dass das ZIH an vier weiteren NFDI-Konsortien beteiligt ist, zeigt, dass unsere Expertise beim Management und der Analyse von Daten deutschlandweit und fachübergreifend geschätzt wird", freut sich Dr. Ralph Müller-Pfefferkorn, Leiter der ZIH-Abteilung Verteiltes und Datenintensives Rechnen und aktives Mitglied der Kontaktstelle Forschungsdaten der TU Dresden.
*FAIR steht im Forschungsdatenmanagement als Akronym für: auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable) und wiederverwendbar (Re-purposable).
NFDI4Earth
Unter der Leitung der TU Dresden adressiert das NFDI4Earth-Konsortium die digitalen Bedürfnisse der Forscher:innen in den Erdsystemwissenschaften. Sensor- und Simulationsdaten in sehr hoher räumlicher, zeitlicher und thematischer Auflösung führen zu rasant steigenden Datenmengen. Die Beschreibung und Bewertung von Erdsystemprozessen, ihren Abhängigkeiten und Veränderungen erfordert daher dringend ein effizientes Forschungsdatenmanagement sowie leistungsfähige Kollaborationsumgebungen für die gemeinsame, disziplinübergreifende Datenanalyse. Das ZIH beteiligt sich hier u.a. am Aufbau der zentralen, webbasierten Plattform die den Zugriff auf Daten und Wissen sowie die virtuellen Forschungsumgebungen ermöglichen soll.
NFDI4Earth: https://www.nfdi4earth.de/
FAIRmat
Neue Erzeugnisse in den Bereichen Energie, Umwelt, Gesundheit, Mobilität und IT sind auf verbesserte oder gar neuartige Materialien angewiesen. Täglich werden in diesem Kontext enorme Mengen an Forschungsdaten produziert. Dieser Schatz ist jedoch wenig wert, wenn die Daten nicht umfassend beschrieben und verfügbar gemacht werden. Hier setzt FAIRmat (FAIR Data Infrastructure for Condensed-Matter Physics and the Chemical Physics of Solids) an. Mit dem Aufbau einer FAIRen Forschungsdateninfrastruktur für die genannten Gebiete will das Konsortium den Materialdatenschatz bergen und damit auch grundlegend zu einem Wandel in Wissenschaft und Forschung beitragen. Als Datenzentrum beteiligt sich das ZIH an der Konzeptionierung, Umsetzung und dem Betrieb des Datenmanagements und der Archivierung vor allem großer Datenmengen.
FAIRmat: https://www.fair-di.eu/fairmat/fairmat_/consortium
Text+
Text- und sprachbasierte Forschungsdaten langfristig zu erhalten und ihre breite Nutzung in der Wissenschaft zu ermöglichen – mit diesem Anliegen beschäftigt sich das Text+-Konsortium bereits seit mehreren Jahren. Das NFDI-Projekt zielt nun auf den Aufbau einer auf Sprach-, Schrift- und Textdaten ausgerichtete Forschungsdateninfrastruktur für die Geisteswissenschaften wie Sprach-, Literatur- und Kulturwissenschaften. Der Verbund konzentriert sich zunächst auf digitale Sammlungen, lexikalische Ressourcen und wissenschaftliche Text-Editionen. Da Text und Sprache in der Kommunikation in den Wissenschaften nach wie vor eine zentrale Rolle spielen, können alle weiteren Disziplinen von Text+ profitieren, insbesondere die Sozial-, Wirtschafts-, Politik- und Geschichtswissenschaften. Für die automatische Verarbeitung der Daten entwickelt das ZIH im Projekt Datenverarbeitung-Pipelines und andere Software-basierte Dienste.
Text+: https://www.text-plus.org/
NFDI4DataScience
NFDI4DataScience baut eine Dateninfrastruktur für das interdisziplinäre Feld der Datenwissenschaft (Data Science) und Künstlicher Intelligenz auf, das vom technischen Fortschritt auf dem Gebiet der Informatik angetrieben wird und gleichzeitig von großer Relevanz für viele weitere wissenschaftliche Disziplinen ist. Transparenz, Reproduzierbarkeit und FAIRness sind aufgrund der Komplexität moderner Data-Science-Methoden, die oft auf einer Kombination aus Software, Modellen und Daten für das Training basieren, zu entscheidenden Herausforderungen geworden. Deshalb konzentriert sich NFDI4DataScience auf verschiedene Arten von Daten und Artefakten wie Veröffentlichungen, Daten, Modelle und Software-Code. Für die enormen Datenmengen entwickelt das ZIH gemeinsam mit anderen Partnern Dienste zur Speicherung und Verwaltung sowie zur Ausführung von KI-Methoden auf seinen modernen Hochleistungsrechnern.
Weitere Informationen
Pressemitteilung der GWK vom 2.7.2021 (2. Förderrunde):
https://www.gwk-bonn.de/fileadmin/Redaktion/Dokumente/Pressemitteilungen/pm2021-04.pdf
Pressemitteilung der GWK vom 2.7.2021 (1. Förderrunde):
https://www.gwk-bonn.de/fileadmin/Redaktion/Dokumente/Pressemitteilungen/pm2020-04.pdf
Informationen zur 3. Förderrunde:
https://www.nfdi.de/neuigkeiten