27.09.2022
NHR-TrainingsangeboteML-HPC-B-Tutorial: Machine Learning on HPC - Einführung
Peter Winkler (ZIH),
Wenyu Zhang (ZIH)
Aufgrund der Heterogenität von ML-Anwendungen kann die Motivation zum Umstieg auf ein HPC-System vielfältig sein, z.B. aufgrund von großem Speicherbedarf, GPU-Auslastung oder Erhöhung der Rechengeschwindigkeit. Der Kurs zeigt, wie ein typischer ML-Workflow im HPC-Umfeld realisiert werden kann. Ein Wechsel auf das HPC-System ist an unterschiedlichen Stellen im Workflow möglich – je nach Anforderung. Die Entwicklung von ML-Anwendungen erfolgt häufig durch kollaboratives Arbeiten innerhalb von Gruppen, was auch bei der Umsetzung des ML-Workflows berücksichtigt wird.
Agenda:
- Zugriff auf das HPC-System (z. B. ssh, Jupyterhub)
- Datenübertragung und Speicherung von Trainingsdaten, Modellen, Quellcodes etc. (z.B. scp, dtcp, Userspace, Workspaces)
- Einrichtung der benötigten Softwareumgebung (z.B. mittels Modulsystem, virtuelle Umgebungen, Container)
- Ausführen/Testen/Debuggen von Anwendungen (z. B. Batch-Jobs, interaktive Jobs)
- Auswertung und Speicherung der Ergebnisse
- einfaches Monitoring zur Optimierung von Anwendungen (Pika)
Der Kurs ist kostenfrei. Kurssprache: Englisch.
Bitte registrieren Sie sich bis zum 16.09.2022 unter: Anmeldung ML-HPC-B
Die Zugangsdaten erhalten Sie kurz vor der Veranstaltung per E-Mail an Ihre registrierte E-Mail-Adresse.
Kontakt für Rückfragen: Anja Gerbes () gern zur Verfügung.