Datenintensives Rechnen und Data Life Cycle

Big-Data-Darstellung © DARPA Big-Data-Darstellung © DARPA
Big-Data-Darstellung

© DARPA

Neben Empirie, Theorie und Simulation ist auch die Analyse von Daten ein wichtiges Standbein der wissenschaftlichen Forschung. Die immer größer werdenden Datenmengen aus Experimenten, Simulationen, Sensoren oder Dokumenten – oft als „Big Data“ bezeichnet – erfordern zum einen Methoden, um sie zu verwalten, wiederzufinden und schnell auf sie zuzugreifen. Zum anderen werden für ihre Auswertung Speicher- und Rechnerarchitekturen sowie Algorithmen benötigt, mit denen das Wissen effizient aus diesen Daten extrahiert werden kann. Bereits im Jahr 2004 hat das ZIH im HBFG-Antrag zur Beschaffung eines Hochleistungsrechners auf der Titelseite den Begriff „Zentrum für datenintensives Rechnen“ geprägt und damit einen Fokus seiner methodenwissenschaftlichen Forschung gelegt.

Forschungsthemen

Data Life Cycle Management

Forschungsdaten fallen in nahezu allen Wissenschaftsdisziplinen an. Sie werden erzeugt, müssen gespeichert und verarbeitet werden,  werden verändert, von anderen genutzt oder dauerhaft archiviert. Dazu bedarf es Strategien, Methoden und Werkzeugen wie mit den Daten über deren gesamten Lebenszyklus umzugehen ist - das sogenannte Data Life Cycle Management. Das ZIH bietet hierzu nicht nur Dienste an, sondern entwickelt auch neue Konzepte, Strategien und Werkzeuge, u.a. in den folgenden Gebieten:

  • Analyse von Daten- und Computing-Workflows
  • Entwicklung von Strategien und Methoden zum Umgang mit Daten über deren gesamten Lebenszyklus
  • Metadaten zur Verwaltung und zum Wiederfinden von Daten
  • Werkzeuge und Dienste für das Data Life Cycle Management
Forschungsdateninfrastrukturen

Forschung bedeutet heutzutage Zusammenarbeit von Wissenschaftlern über institutionelle, politisch-geographische und Disziplingrenzen hinweg. Dazu bedarf es IT-Infrastrukturen, die eine kollaborative und verteilte Verwaltung und Verwertung der Daten, aber auch des aus den Daten generierten Wissens, ermöglichen. Das ZIH entwickelt dazu Methoden und Werkzeuge auf den folgenden Gebieten:

  • Mangement von Daten, Metadaten und Wissen
  • Verteilte Infrastrukturen für die (Meta)Datenspeicherung
  • Daten-Workflows
  • Integration von Dateninfrastrukturen in Forschungsumgebungen der Anwender
  • Science Gateways
Performante und flexible Speichersysteme

Die Verarbeitung großer Datenmengen erfordert leistungsfähige Speicherinfrastrukturen. Mit dem Antrag auf den Hochleistungsrechner-Speicherkomplex beim Wissenschaftsrat im Jahr 2004 hat das ZIH begonnen, Kompetenz auf diesem Gebiet aufzubauen. Der Fokus lag dabei zunächst auf der Entwicklung von Analysemethoden für verschiedene Dateisysteme. Aktuell forscht das ZIH in diesem Kontext auf folgenden Gebieten:

  • Analyse und Optimierung von Speicherinfrastrukturen und Anwendungen
  • Entwurf von innovativen Speicherarchitekturen
  • Betrieb von Speichersystemen und Anwenderbetreuung

Aktuelle Projekte

Abgeschlossene Projekte
Kontakt
Müller-Pfefferkorn © ZIH
Name

Dr. Ralph Müller-Pfefferkorn

Abteilungsleiter VDR

Organisationsname

Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH)

Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH)

Adresse work

Besucheradresse:

Falkenbrunnen, Raum 240 Chemnitzer Str. 46b

01187 Dresden

Zu dieser Seite

ZIH
Letzte Änderung: 07.11.2017