Datenintensives Rechnen und Data Life Cycle
Neben Empirie, Theorie und Simulation ist auch die Analyse von Daten ein wichtiges Standbein der wissenschaftlichen Forschung. Die immer größer werdenden Datenmengen aus Experimenten, Simulationen, Sensoren oder Dokumenten – oft als „Big Data“ bezeichnet – erfordern zum einen Methoden, um sie zu verwalten, wiederzufinden und schnell auf sie zuzugreifen. Zum anderen werden für ihre Auswertung Speicher- und Rechnerarchitekturen sowie Algorithmen benötigt, mit denen das Wissen effizient aus diesen Daten extrahiert werden kann. Bereits im Jahr 2004 hat das ZIH im HBFG-Antrag zur Beschaffung eines Hochleistungsrechners auf der Titelseite den Begriff „Zentrum für datenintensives Rechnen“ geprägt und damit einen Fokus seiner methodenwissenschaftlichen Forschung gelegt.
Forschungsthemen
Forschungsdaten fallen in nahezu allen Wissenschaftsdisziplinen an. Sie werden erzeugt, müssen gespeichert und verarbeitet werden, werden verändert, von anderen genutzt oder dauerhaft archiviert. Dazu bedarf es Strategien, Methoden und Werkzeugen wie mit den Daten über deren gesamten Lebenszyklus umzugehen ist - das sogenannte Data Life Cycle Management. Das ZIH bietet hierzu nicht nur Dienste an, sondern entwickelt auch neue Konzepte, Strategien und Werkzeuge, u.a. in den folgenden Gebieten:
- Analyse von Daten- und Computing-Workflows
- Entwicklung von Strategien und Methoden zum Umgang mit Daten über deren gesamten Lebenszyklus
- Metadaten zur Verwaltung und zum Wiederfinden von Daten
- Werkzeuge und Dienste für das Data Life Cycle Management
Forschung bedeutet heutzutage Zusammenarbeit von Wissenschaftlern über institutionelle, politisch-geographische und Disziplingrenzen hinweg. Dazu bedarf es IT-Infrastrukturen, die eine kollaborative und verteilte Verwaltung und Verwertung der Daten, aber auch des aus den Daten generierten Wissens, ermöglichen. Das ZIH entwickelt dazu Methoden und Werkzeuge auf den folgenden Gebieten:
- Mangement von Daten, Metadaten und Wissen
- Verteilte Infrastrukturen für die (Meta)Datenspeicherung
- Daten-Workflows
- Integration von Dateninfrastrukturen in Forschungsumgebungen der Anwender
- Science Gateways
Die Verarbeitung großer Datenmengen erfordert leistungsfähige Speicherinfrastrukturen. Mit dem Antrag auf den Hochleistungsrechner-Speicherkomplex beim Wissenschaftsrat im Jahr 2004 hat das ZIH begonnen, Kompetenz auf diesem Gebiet aufzubauen. Der Fokus lag dabei zunächst auf der Entwicklung von Analysemethoden für verschiedene Dateisysteme. Aktuell forscht das ZIH in diesem Kontext auf folgenden Gebieten:
- Analyse und Optimierung von Speicherinfrastrukturen und Anwendungen
- Entwurf von innovativen Speicherarchitekturen
- Betrieb von Speichersystemen und Anwenderbetreuung
Aktuelle Projekte
- Come2Data - Competence Center for Interdisciplinary Data Sciences
- DDtrust - Dresden Data Trust Center: Implementierung eines Datentreuhandmodells für den sächsischen Wissenschaftsraum an der TU Dresden
- DDtrust-scale - Skalierung und Etablierung einer Datentreuhandstelle für den
sächsischen Wissenschaftsraum - MCSE - Skalierbare und performante Massenspeicherzugriffe für Exascale-Supercomputer
- Nationale Forschungsdateninfrastruktur (NFDI)
- FAIRmat
- German Human Genome-Phenome Archive (GHGA)
- NFDI4Chem
- NFDI4DataScience
- NFDI4Earth
- Text+
- NFDIxCS
- Kontaktstelle Forschungsdaten - Unterstützung beim Forschungsdatenmanagement für Forschende der TU Dresden
-
SaxFDM - Etablierung einer kooperativen Unterstützung für das Forschungsdatenmanagement im Freistaat Sachsen
- Initialprojekt - Kompetenzteam
- Fokusprojekt "SaxFDM : Konzeption eines sachsenweiten Services zur Datenmanagementplanung"
- Fokusprojekt Opara4Saxony: Ausbau des Forschungsdatenrepositoriums OpARA
als sachsenweiter Dienst
- ScaDS.AI Dresden/Leipzig - Center for Scalable Data Analytics and Artificial Intelligence
- Informationsinfrastruktur für Sonderforschungsbereiche / Transregios
- SFB/TRR 205 -2: "Die Nebenniere: Zentrales Relais in Gesundheit und Krankheit " - Informationsinfrastrukturprojekt
- SFB/TRR 265 -2: "Verlust und Wiedererlangung der Kontrolle bei Suchterkrankungen" - Informationsinfrastrukturprojekt
- SFB/TRR 280 -2 :"Konstruktionsstrategien für materialminimierte Carbonbetonstrukturen – Grundlagen für eine neue Art zu bauen"
- SFB/TRR 369: "DegeneratIon of bONE induced by inflammation – DIONE"
- SFB/TRR 393: "TRAJECTORIES OF AFFECTIVE DISORDERS: COGNITIVE-EMOTIONAL MECHANISMS OF SYMPTOM CHANGE"
- SFB 940: "Volition and Cognitive Control" - Informationsinfrastrukturprojekt
- SFB 1415: "CHEMISTRY OF SYNTHETIC TWO-DIMENSIONAL MATERIALS"
- 100Gbit/s Testbed Dresden-Freiberg
- ADA-FS - Advanced Data Placement via Ad-hoc File Systems at Extreme Scales
- AI4DI - Artificial Intelligence for Digitalizing Industry
- Dataheap - Erhebung und Einbettung von externen Performance-Daten in Programmspuren
- D-Grid integrationsprojekt 1
- D-Grid Integrationsprojekt 2
- EMI: European Middleware Initiative
- EMuDIG 4.0 - Effizienzschub in der Massivumformung durch Entwicklung und Integration digitaler Technologien im Engineering der gesamten Wertschöpfungskette
- EXPLOIDS - Erkennung und Aufklärung von IT-Sicherheitsvorfällen mit einem neuartigen Angriffserkennungssystem
- GeoKur - Datenkuration für die Umweltwissenschaften
- GeRDi - Generic Research Data Infrastructure
- KEEN: KI-Inkubator-Labore in der Prozessindustrie - AI for process industries
- LSDMA - Large-Scale Data Management and Analysis
- MASi - Metadata Management for Applied Sciences
- MoSGrid: Molecular Simulation Grid
-
OpARA: Open Access Repository – Langzeitarchivierung und Veröffentlichung von Forschungsdaten
- Radieschen: Rahmenbedingungen einer disziplinübergreifenden Forschungsdateninfrastruktur
- SFB/TRR 280: „Konstruktionsstrategien für materialminimierte Carbonbetonstrukturen – Grundlagen für eine neue Art zu bauen“ - Informationsinfrastrukturprojekt
- SIOX: Scalable I/O for Extreme Performance
- Transatlantisches 10 Gbit/s Testbed Dresden-Indiana(USA)
- VAVID - Vergleichende Analyse von ingenieurrelevanten Mess- und Simulationsdaten
- WisNetGrid: Wissensnetzwerke im Grid
Dr. Ralph Müller-Pfefferkorn
Abteilungsleiter VDR / Gruppenleiter Datenmanagement
Eine verschlüsselte E-Mail über das SecureMail-Portal versenden (nur für TUD-externe Personen).
Besucheradresse:
Strehlener Str. 14, Raum 609
01069 Dresden