28.06.2021
ZIH@ISC2021 – Mit echter Alpha-Centauri-Platzierung, virtuellem Stand und spannenden Präsentationen
Platz 182 in der aktuellen Top500-Liste für das ZIH-System „Alpha Centauri“
In der traditionell zur ISC High Performance (ISC) veröffentlichten Top500-Frühjahrsliste der weltweit schnellsten Supercomputer erreichte das gerade am Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) der TU Dresden installierte System Alpha Centauri den Platz 182. Unter den deutschen Systemen belegt der Cluster damit den 17. Platz. Die Besonderheit dieser Platzierung ist, dass es unser Cluster mit nur 34 sehr leistungsfähigen Compute-Knoten in die aktuelle Liste geschafft hat. Bei der Beschaffung dieser Erweiterung lag der Fokus neben der reinen Rechenleistung v.a. darauf, den sehr speziellen Anforderungen der Nutzenden im Bereich Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) gerecht zu werden. Festzuhalten ist insbesondere, dass das System in der nach der Energieeffizienz - der Zahl der Berechnung pro Watt - sortierten Green500-Liste im weltweiten Vergleich auf den Platz 18 kam.
Das Herzstück des HPC-Clusters und entscheidend für die Rechenleistung sind die insgesamt 272 NVIDIA A100 GPUs, von denen jeweils acht in einem Compute-Knoten enthalten sind. Ihre theoretische Maximalleistung bei Fließkomma-Operationen beträgt mehr als 2,6 PFlop/s bei 64-Bit (double precision), mehr als 5,3 PFlop/s bei 32-Bit (single precision) und mehr als 42 PFlop/s bei FT32-to-FP32 Tensor-Operationen. Darüber hinaus verfügt jeder Knoten über einen 1 TB großen Hauptspeicher und 3,2 TB lokalen NVMe-Cache, um die GPUs schnell mit Daten zu versorgen. Die schnelle Anbindung an den zentralen HPC-Speicherkomplex erfolgt über je zwei HDR-Infiniband-Karten mit 400 Gbit/s Netzwerkbandbreite bei sehr geringer Latenz. Die maximale Leistungsaufnahme eines Knotens beträgt 4,8 kW. Eine direkte Heißwasserkühlung (DLC) sorgt für hohe Energieeffizienz bei gleichzeitiger Nutzung der Abwärme. https://tu-dresden.de/zih/news/zih-ki-cluster-2021
Das Ende Februar in Betrieb genommene System wurde von der NEC Deutschland GmbH bereitgestellt. Das ZIH betreibt den Cluster insbesondere für die KI- und ML-Anwendungen aus dem Big-Data- und KI-Kompetenzzentrum ScaDS.AI Dresden/Leipzig. Freie Kapazitäten stehen der Forschung darüber hinaus jedoch deutschlandweit im Rahmen des Nationalen Hochleistungsrechnens (NHR) zur Verfügung, für das das ZIH seit Januar 2021 als einer von acht Standorten durch den Bund und den Freistaat Sachsen gefördert wird. https://tu-dresden.de/zih/news/nhr-am-zih-der-tud.
"Angesichts der HPC- und Analyse-Bedarfe in immer mehr wissenschaftlichen Anwendungsgebieten – insbesondere aber aufgrund des erwarteten Zuwachses im Hinblick auf Datenvolumen und -komplexität dieser Anwendungen – muss das ZIH die Leistungsfähigkeit seiner Computing-Infrastruktur kontinuierlich mithilfe der neuesten Technologien steigern und dabei auch das Design seiner Rechnerarchitektur immer wieder neu durchdenken. Mit den Anforderungen unseres KI-Kompetenzzentrums ScaDS.AI und der gelebten engen Zusammenarbeit von HPC-, Big-Data-, Performance-, I/O-Expert:innen usw., bei permanenter direkter Rückkoppelung in die verschiedenen Fachwissenschaften, bleibt dann noch die Herausforderung, die Leistungsfähigkeit dieser Systeme durch geeignete Methoden effizient auszunutzen.“, resümiert Prof. Wolfgang E. Nagel, als Leiter des ZIH und wissenschaftlicher Sprecher von ScaDS.AI im Hinblick auf die aktuelle Top500-Platzierung.
Der neue Supercomputing-Cluster wurde in die bestehende leistungsfähige HPC-Infrastruktur des ZIH integriert. Neben den spezialisierten HPC-Ressourcen bieten wir unseren Nutzenden individuelle Unterstützung und umfassende Beratung an, um die Systeme effizient für die wissenschaftliche Forschung einzusetzen. Das ZIH-Weiterbildungsangebot wird derzeit in enger Abstimmung mit den anderen NHR-Standorten massiv ausgebaut. Für die ZIH-Methodenschwerpunkte Big Data und Datenanalyse sowie -Management, Maschinelles Lernen, Tiered-Storage-Architekturen und I/O-Optimierung sowie Leistungs- und Energieeffizienzanalyse und -optimierung werden dedizierte Formate erarbeitet, die noch in diesem Sommer beginnen sollen.
ZIH präsentiert sich mit virtuellem Stand und wissenschaftlichen Beiträgen
Mit dieser ganz realen Top500-Platzierung kann das ZIH seine sonst leider nur virtuelle Messepräsenz auf der diesjährigen ISC abrunden. Auf dem virtuellen Messestand stellen wir ein breites Spektrum unserer aktuellen Arbeiten in den Bereichen Hochleistungsrechnen, Machine Learning und High Performance Data Analytics vor, das wir im wissenschaftlichen ISC-Programm mit zahlreichen virtuellen Konferenzbeiträgen über die Themenschwerpunkte unserer Forschung von KI, Machine Learning und Data Analytics über Performanceanalyse von HPC-Anwendungen, bis hin zur Vorstellung der von uns entwickelten Performance-Werkzeuge sowie einem LLVM-Compiler-Workshop untermauern.
Virtueller ISC-Messestand des ZIH
https://booth.zih.tu-dresden.de
ZIH-Beiträge zum wissenschaftlichen Konferenzprogramm
https://www.isc-hpc.com/schedule.html
- "Hands-on Practical Hybrid Parallel Application Performance Engineering“, Tutorial mit Bill Williams (ZIH) am 24. Juni, ab 14:00 Uhr
- "Guidelines for HPC data center monitoring and analytics framework development“, BoF-Session mit Thomas Ilsche (ZIH) am 30. Juni, ab 14:00 Uhr
- „Performance Analysis for new HPC programming models”, Focus-Präsentation von Andreas Knüpfer (ZIH) am 1. Juli, ab 15:35 Uhr
- „4th HPC Applications in Precision Medicine Workshop" von Andreas Deutsch (ZIH) am 2. Juli, ab 14:00 Uhr
- "Machine Learning on HPC Systems“, Workshop mit Sunna Torge (ZIH) und Peter Winkler (ZIH) sowie Nico Hoffmann (TU Dresden) am 2. Juli, ab 14:00 Uhr
- „LLVM-CTH: The Second Workshop on LLVM Compiler and Tools for HPC“ mit Anja Gerbes (ZIH) am 2. Juli, ab 14:00 Uhr
Über die TU Dresden
Die TU Dresden ist eine der größten technischen Universitäten in Deutschland mit mehr als 31 000 Studierenden. Als eine von elf deutschen Exzellenzuniversitäten bietet sie ein weitgefächertes Angebot aus Studiengängen und deckt ein breites Forschungsspektrum ab. Ihre in Deutschland einzigartige Fächervielfalt verpflichtet die TU Dresden, Interdisziplinarität zu fördern und zur Integration der Wissenschaft in die Gesellschaft beizutragen. Zu ihren fünf Forschungsschwerpunkten gehört die Informationstechnik.
Über das ZIH
Das ZIH ist das universitäre IT-Zentrum der TU Dresden. Seit mehr als 20 Jahren betreibt es HPC-Systeme als Kompetenzzentrum für Hochleistungsrechnen – stets mit dem Fokus auf datenintensiven Anwendungen. Seit Anfang 2021 ist das ZIH eines von acht NHR-Zentren in der Initiative "Nationales Hochleistungsrechnen" der Gemeinsamen Wissenschaftskonferenz (GWK) und der Deutschen Forschungsgemeinschaft (DFG) und unterstützt damit die akademische Forschung in ganz Deutschland.
Über ScaDS.AI Dresden/Leipzig
Das Center for Scalable Data Analytics and Artificial Intelligence – ScaDS.AI Dresden/Leipzig erweitert seit 2019 das Forschungsprogramm des 2014 gegründeten nationalen Kompetenzzentrums für Big Data, ScaDS. Mit seiner Forschung schlägt ScaDS.AI die Brücke zwischen der effizienten Nutzung von Massendaten und fortgeschrittener KI und befasst sich mit neuen Methoden für maschinelles Lernen, Wissensmanagement und effizientem Umgang mit Daten. Darüber hinaus entwickelt ScaDS.AI serviceorientierte Lösungen und kooperiert mit einer Vielzahl von Anwendungspartnern aus Wissenschaft und Industrie.