06.05.2022
NHR-TrainingsangeboteML-HPC-B-Tutorial: Machine Learning on HPC - Einführung
Taras Lazariv (ZIH),
Apurv Kulkarni (ZIH)
Aufgrund der Heterogenität von ML-Anwendungen kann die Motivation zum Umstieg auf ein HPC-System vielfältig sein, z.B. aufgrund von großem Speicherbedarf, GPU-Auslastung oder Erhöhung der Rechengeschwindigkeit. Der Kurs zeigt, wie ein typischer ML-Workflow im HPC-Umfeld realisiert werden kann. Ein Wechsel auf das HPC-System ist an unterschiedlichen Stellen im Workflow möglich – je nach Anforderung. Die Entwicklung von ML-Anwendungen erfolgt häufig durch kollaboratives Arbeiten innerhalb von Gruppen, was auch bei der Umsetzung des ML-Workflows berücksichtigt wird.
Agenda:
- Zugriff auf das HPC-System (z. B. ssh, Jupyterhub)
- Datenübertragung und Speicherung von Trainingsdaten, Modellen, Quellcodes etc. (z.B. scp, dtcp, Userspace, Workspaces)
- Einrichtung der benötigten Softwareumgebung (z.B. mittels Modulsystem, virtuelle Umgebungen, Container)
- Ausführen/Testen/Debuggen von Anwendungen (z. B. Batch-Jobs, interaktive Jobs)
- Auswertung und Speicherung der Ergebnisse
- einfaches Monitoring zur Optimierung von Anwendungen (Pika)
Der Kurs ist kostenfrei. Kurssprache: Englisch.
Bitte registrieren Sie sich bis zum 02.05.2022 unter folgendem Link: Anmeldung ML-HPC-B-Tutorial
Die Zugangsdaten erhalten Sie kurz vor der Veranstaltung per Email an Ihre registrierte E-Mail-Adresse. Für Fragen steht Ihnen Frau Anja Gerbes () gern zur Verfügung.