24.02.2021
Dresdner Forschung hilft, neue Standards für die genetische Spitzenforschung zu setzen
Forschende des DRESDEN-concept Genome Centers und des Zentrums für Informationsdienste und Hochleistungsrechnen (ZIH) der TU Dresden bilden einen von sechs Datenhubs innerhalb des neu gegründeten German Human Genome-Phenome Archive (GHGA). Das GHGA bringt humane Omics-Daten und High Performance Computing zusammen, um eine komplette Infrastruktur für modernste "Omics"-Technologien aufzubauen.
Genomics, Transcriptomics, Proteomics, Metabolomics und verschiedene weitere so genannte "Omics"-Technologien revolutionieren die Medizin und die biomedizinischen Wissenschaften. Sie generieren Mengen wertvoller Daten, gehen aber mit fast ebenso vielen Herausforderungen einher. Wie können einzelne Institute die riesigen Datenmengen speichern? Wie können sie diese sicher mit anderen nationalen und internationalen Zentren teilen? Können sie die Datenschutzrechte der Patienten stets sicherstellen? Können verschiedene Forschungszentren kollektive Erfahrungen der Datenanalysen nutzen? Ist es möglich, eine Plattform zu etablieren, die die gesamte benötigte Infrastruktur und Ressourcen bietet? Die GHGA ist eines von neun durch die Deutsche Forschungsgemeinschaft (DFG) geförderten Konsortien im Rahmen der Initiative Nationale Forschungsdateninfrastruktur (NFDI). Es widmet sich speziell der Beantwortung dieser Fragen .
Ein Teil des GHGA-Konsortiums ist nun auch das DRESDEN-concept Genome Center als eines von vier DFG-geförderten Next Generation Sequencing (NGS)-Kompetenzzentren. Innerhalb der nächsten fünf Jahre wird das Forschungs-Team aus Dresden dazu beitragen, neue internationale Standards für den Austausch von Daten in der Humangenomik zu schaffen. Ziel ist es, zunächst Prozesse der Datenerfassung zu entwickeln, zu harmonisieren und zu optimieren. Metadaten, also Zusatzinformationen zu den Sequenzierdaten, sind dabei ein Stichwort. „Wir müssen gute Grundlagen schaffen, aber das ist eine heikle Aufgabe. Einerseits möchten wir so viele Informationen wie möglich haben, um sicherzustellen, dass die Datensätze umfassend sind und für möglichst viele verschiedene Zwecke analysiert werden können. Gleichzeitig müssen wir sicherstellen, dass die Datenschutzrechte der Patientinnen und Patienten immer an erster Stelle stehen", erklärt Mathias Lesche, Forscher am DRESDEN-concept Genome Center. Für die Klärung rechtlicher und ethischer Fragen kann das Team auf juristische Expertise zu nationalen und internationalen Datenschutzbestimmungen zurückgreifen.
Das Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) der TU Dresden hat gemeinsam mit vier weiteren deutschen HPC-Zentren die Aufgabe übernommen, die notwendige technische Infrastruktur zu entwickeln. „Wir werden modernste HPC-, Cloud- und Speichertechnologien nutzen, um eine verteilte Infrastruktur aufzubauen, die für alle interessierten Forschenden sowie im klinischen Bereich zugänglich ist. Die Integrationsplattform wird sowohl auf die humanen Omics-Daten zuzugreifen können, als auch deren Analyse, Verwaltung und Archivierung unterstützen", erklärt Dr. Ralph Müller-Pfefferkorn, Leiter der Abteilung für Datenintensives Rechnen und Data Life Cycle des ZIH. Ziel ist es, den sogenannten FAIR-Leitprinzipien zu folgen und einen Rahmen zu schaffen, in dem Daten findbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reusable) sind (FAIR). „Wir wollen ein umfassendes Werkzeug-Set für Datenmanagement und -verarbeitung bereitstellen und den Forschenden ermöglichen, ihre Daten gegenseitig zu nutzen. Zugleich wollen wir eine Verbindungsstelle sein, die neue Initiativen fördert und Unterstützung beim Aufbau neuer wissenschaftlich-klinischer Kollaborationen bietet", fügt Dr. Müller-Pfefferkorn hinzu.
„Wir freuen uns sehr, die TU Dresden als Partner bei GHGA an Bord zu haben“, sagt Prof. Oliver Stegle, der als Sprecher des Direktoriums das Konsortium am Deutschen Krebsforschungszentrum (DKFZ) in Heidelberg koordiniert. „Wir vereinen die führenden Zentren der HPC und Genomforschung in Deutschland. Indem wir mehr Genomdaten in standardisierter Weise zusammenführen, wollen wir das Potential dieser Daten für die Forschung noch besser nutzen.“ Die GHGA wird im Rahmen der NFDI-Initiative gemeinsam mit anderen Konsortien aus der Chemie, Biologie und anderen Disziplinen eine deutschlandweite interdisziplinäre Dateninfrastruktur für die Forschung aufbauen. In Dresden beginnt die operative Phase des Projekts am 1. März 2021.
Informationen für Journalisten:
Dr. Ralph Müller-Pfefferkorn
Tel.: +49 351 463-39280
Über das DRESDEN-concept Genome Center (DcGC)
Das DcGC ist ein gemeinsames Sequenzierungszentrum der Core Facility Hochdurchsatzsequenzierung am Center for Molecular and Cellular Bioengineering (CMCB) der TU Dresden und der Sequencing Facility des Max-Planck-Instituts für molekulare Zellbiologie und Genetik (MPI-CBG). Es ist eines von vier DFG-geförderten deutschen Kompetenzzentren für das Next Generation Sequencing. Das DcGC ist ein Zusammenschluss von Mitarbeitern des CMCB, des MPI-CBG, sowie des Zentrum für Systembiologie Dresden (CSBD). Das DcGC besteht aus drei Plattformen, die sich auf long-read-Sequenzierungstechnologien, Einzelzell-Sequenzierung und short-read-Sequenzierung konzentrieren, und deckt die experimentellen Workflows und die bioinformatische Analyse ab.
Über das Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH)
Als nationales Kompetenzzentrum für das Hochleistungsrechnen bietet das ZIH spezielle HPC-Ressourcen sowie eine gezielte Unterstützung und Beratung an. Neben der reinen Rechenkapazität steht insbesondere auch moderne und leistungsfähige Hardware für Anwendungen der Bereiche Datenanalyse, maschinelles Lernen und künstliche Intelligenz bereit. Im Fokus der ZIH-Forschung stehen die Unterstützung der Nutzenden bei der Optimierung ihrer wissenschaftlichen Anwendungen sowie die Entwicklung neuer Methoden zur Lösung wissenschaftlich-technischer Forschungsfragen. Das ZIH leitet u.a. das ScaDS.AI Dresden/Leipzig (Center for Scalable Data Analytics and Artificial Intelligence), eines von sechs nationalen Kompetenzzentren für Big Data und Künstliche Intelligenz.