Studentische Arbeiten

1. Bachelor, Master und Diplomarbeitsthemen
2. Belegarbeiten

Bachelor, Master und Diplomarbeitsthemen

Detailierte Analyse des SPEChpc2021 Benchmarks auf Taurus Alpha mit Score-P/Vampir

(online seit 06.09.2022) nur Master/Diplom!

Der neue SPEChpc2021 Benchmark erlaubt es, aktuelle System-Archtekturen mittels verschiedener paralleler Programmierparadigmen (MPI, OpenMP, OpenACC, OpenMP target offloading) zu vermessen. Dabei kann grundsätzlich aus vier verschiedenen Problemgrösen gewählt werden (tiny, small, medium, large).
Ziel dieses Themas ist es, die vollständige Performance-Suite (d.h. alle vier Paradigmen) zu installieren, mit dem Laufzeit-Monitor Score-P zu instrumentieren und die erhobenen Spur-Daten mit dem Analyse-Werkzeug Vampir zu analysieren.
Schlussendlich sollen die einzelnen Anwendungen der Suite in ihren vier Versionen detailiert miteinander verglichen und auf zu erwartende Performance-Engpässe untersucht werden.
Da der Benchmark noch vergleichsweise neu ist, sind Probleme bei Portabilität und Rechenperformance zu erwarten, die wiederum mit den genannten Werkzeugen aufgedeckt und dokumentiert werden können.

Schwerpunkte:

Arbeiten auf Hochleistungsrecheninfrastruktur in Linux Arbeitsumgebung
Konfiguration und Installation des SPEChpc2021 Benchmarks
Bash/C/C++/Fortran und GPU Programmierung
Nutzung der Performance-Aufzeichnungs-Werkzeuge Score-P und Vampir
Analyse und Interpretation der gewonnenen Daten im Hinblick auf Performance-Merkmale wie Skallierbarkeit, Speedup, Parallele Effiziens, Performance Boundness

Kontakt: Dr. Holger Brunst

Erstellung eines Analysekonzeptes für periodische Effekte in Programmspuren

(Online seit: 05.09.2022)

Konventionell werden Programmspuren als Zeitlinien von Funktionsaufrufen oder verarbeitet als Programmprofile dargestellt. Um periodische Effekte zu visualisieren, sollen verschiedene Transformationen und Visualisierungen auf ihre Eignung hin getestet werden. Beispielhaft seien Fourier-Analyse, Spektrogramme und Autokorrelation genannt. Nach Erarbeitung eines Konzeptes zur Visualisierung mit Fokus auf das Hervorheben von möglichen Störquellen, soll ein Prototyp in C++ und Qt entwickelt werden.

Inhaltliche Schwerpunkte:

Literaturrecherche
Tracing mit Score-P und OTF2
C++
Qt
Signalverarbeitung

Kontakt: Maximilian Knespel

Performance-Analyse einer hochparallelen Anwendung (Diplom/Master)

Hochskalierende Anwendungen stellen hohe Anforderungen an die gleichzeitig verfügbaren Ressourcen eines HPC-Clusters. Deshalb ist es wünschenswert, die Laufzeit zu minimieren und gleichfalls eine gute Auslastung der verfügbaren Ressourcen zu erreichen, ohne die Qualität der Ergebnisse zu beeinträchtigen. Ziel dieser Arbeit ist die Durchführung einer Performanceanalyse einer hochparallelen Anwendung auf dem Hochleistungsrechner des ZIH unter Verwendung der Werkzeuge Score-P, Lo2s und Vampir. Für die in der Analyse ermittelten kritischen Bereiche sollen Strategien zur Laufzeitverbesserung entwickelt, implementiert und evaluiert werden. Mögliche Ansatzpunkte können beispielsweise verbesserte Datenaufteilungsstrategien sein.

Schwerpunkte:

Untersuchungen an hochskalierenden Anwendungen
Performance-Analyse mittels Score-P, Lo2s & Vampir
Parallelisierungsstrategien: z.B. (dynamische) Datenverteilung, Load-Balancing
MPI-Programmierung in C/C++, Fortran, Python

Literatur:

Andreas Knuepfer u. a. „The Vampir Performance Analysis Tool-Set“. In: Tools for High Performance Computing - Proceedings of the 2nd International Workshop on Parallel Tools for High Performance Computing, July 2008, HLRS, Stuttgart. Hrsg. von Michael M. Resch u. a. Springer, 2008, S. 139–155. DOI: 10.1007/978-3- 540-68564-7\_9. URL: https://doi.org/10.1007/978-3-540-68564-7_9
Williams, William, and Holger Brunst. „Parallel Performance Engineering Using Score-P and Vampir.“ In Companion of the 2023 ACM/SPEC International Conference on Performance Engineering, ICPE 2023, Coimbra, Portugal, April 15-19, 2023, edited by Marco Vieira, Valeria Cardellini, Antinisca Di Marco, and Petr Tuma, 121–25. ACM, 2023. https://doi.org/10.1145/3578245.3583715.

Kontakt: https://tu-dresden.de/zih/die-einrichtung/struktur/sebastian-doebel

Vorkenntnisse erforderlich

Belegarbeiten

Parallele Datenverarbeitung mit R zur Analyse von Sensordaten

(online seit: 19.04.2021, update 06.12.2021 )

R ist eine der führenden Lösungen für die statistische Datenanalyse und kann für Data Analytics und Visualisierung eingesetzt werden. In der Arbeit sollen die Möglichkeiten des parallelen Rechnens mit R untersucht und evaluiert werden. Im Anwendungsfall sollen Sensordaten aus einem HPC-System parallel ausgewertet werden. Zur Bearbeitung der Aufgabenstellung sind Vorkenntnisse der Programmiersprache R obligatorisch.

Schwerpunkte:

Konzeptionelle Umsetzung verschiedener paralleler Programmierparadigmen in R.
Möglichkeiten und Probleme bei der Code-Optimierung für R.
Bezug zu aktuellen Architekturen.

Literatur:

Terence Sloan et al. Mastering Parallel Programming with R. Packt Publishing, 2016.
McCallum, Q. Ethan; Weston, Stephen. Parallel R. O'Reilly, 2012.

Kontakt: Dr. Taras Lazariv

Performance-Analyse von Apache Flink-Prozessen mit lo2s

(Online seit: 02.05.2022)

Apache Flink ist ein Framework, das es erlaubt, die Verarbeitung von Daten auf Knoten eines Rechenclusters zu verteilen. Verschiedene Möglichkeiten bei der Implementierung einer Anwendung und Konfiguration des Clusters können die Geschwindigkeit der Verarbeitung beeinflussen. Die Geschwindigkeit von Anwendungen muss daher konkret untersucht werden. Lo2s ermöglicht es, das Anwendungsverhalten aufzuzeichnen. Im Rahmen dieser Arbeit soll Lo2s auf Flink-Benchmarks angewendet und deren Verhalten untersucht werden.

Inhaltliche Schwerpunkte:

Untersuchung der Integration von lo2s und Apache Flink
Vergleich der Performance-Daten von lo2s mit dem Flink-internen Monitoring
Unterschiede zur Aufzeichnung mit Score-P
Messung des Overheads

Kontakt: Jan Frenzel

Analyse der Performance der AMD Optimizing CPU Libraries

(Online seit: 02.05.2022)

AMD bietet mit den "AMD Optimizing CPU Libraries" (AOCL) optimierte Bibliotheken an, die spezifisch für Prozessoren ab der AMD Zen Architektur gedacht sind. Ziel dieser Arbeit ist es, die Einsatztauglichkeit dieser Bibliotheken zu prüfen. Hierfür soll die Romeo-Partition des HPC-Systems des ZIH genutzt werden. Zu analysieren ist die Performance im Vergleich zu etablierten Standardbibliotheken, wobei neben Benchmarks auch wissenschaftliche Anwendungen herangezogen werden können.
Zudem soll der Aufwand, diese Bibliotheken anstatt etablierter Standardbibliotheken einzubinden, überprüft werden.

Inhaltliche Schwerpunkte:

Anpassung von Benchmarks für die Nutzung von AOCL Bibliotheken
Messung der Performance von Benchmarks und ggf. Anwendungen auf dem HPC-System des ZIH
Auswertung der Messungen
Vergleich der AOCL-Ergebnisse mit etablierten Bibliotheken

Kontakt: Markus Velten

Forschungsdatenmanagement mit iRods

Forschungsdatenmanagement (FDM) umfasst die Definition und die Umsetzung von Prozessen, um Forschungsdaten langfristig und personenunabhängig zugänglich, nachnutzbar und nachprüfbar zu halten. Dazu werden während des Lebenszyklus von Daten diese so aufbereitet, dass die wissenschaftliche Aussagekraft erhalten bleibt. Das System iRODS (integrated Rule-Oriented Data System) ist eine Open-Source-Implementierung einer Lösung für das Forschungsdatenmanagement und erlaubt es, Daten auf verschiedenen Speichersystemen abzulegen und diese mit Metadaten anzureichern, so dass Daten immer auffindbar und zugreifbar sind und trotzdem kostenoptimiert gespeichert werden können. Das System ist seit mehr als 25 Jahren in kontinuierlicher Entwicklung durch öffentliche Einrichtung, Labore und Industriepartner. Der übliche Einsatzbereich an Hochschulen ist die Langzeitarchivierung von Forschungsdaten. Die Aufgabe der Arbeit ist, einen Überblick über das System auszuarbeiten und die Schnittstellen zu beschreiben, über die Daten und Metadaten gelesen und geschrieben werden können. Parallel soll analysiert werden, wie zwei ausgewählte Anwendungsszenarien durch iRods implementiert werden könnten. Bei einer längeren Bearbeitungszeit sollen die technischen Grenzen des Systems durch Messungen ermittelt werden.

Schwerpunkte:

Beschreibung der Architektur von iRods
Exemplarische Unterstützung von wissenschaftlichen Daten-Workflows
Performance-Analyse des Systems (optional, je nach Zeit)

Literatur:

Nieroda, Lech, et al. "iRODS metadata management for a cancer genome analysis workflow." BMC bioinformatics 20.1 (2019): 1-8.
Winters, Kevin D., et al. "Integrated Rule-Oriented Data System (iRODS) and High Performance Computing (HPC) Requirements Document." (2020).
Xu, Hao, et al. iRODS primer 2: integrated rule-oriented data system. Williston: Morgan & Claypool, 2017.

Kontakt: https://tu-dresden.de/zih/die-einrichtung/struktur/michael-kluge

Machbarkeitsstudie: Erkennung des Optimierungsgrades von Assembler-Code mittels Sprachmodellen

Moderne Compiler bieten eine Vielzahl von Plattformoptimierungen. Diese werden jedoch nicht von allen Anwendern genutzt, teils aus Gründen der Portabilität, teils aus anderen Gründen. Aus Sicht der Betreiber von HPC-Systemen ist es interessant, bestehende übersetzte Anwendungen daraufhin zu untersuchen. Spätestens seit ChatGPT sind Sprachmodelle zur Verarbeitung natürlicher Sprache allgegenwärtig. Ziel dieser Machbarkeitsstudie ist es, zu evaluieren, inwieweit Sprachmodelle geeignet sind, den Optimierungsgrad von vorhandenem Assemblercode zu erkennen.

Schwerpunkte:

Evaluation vorhandener Sprachmodelle
Trainieren von Sprachmodellen auf HPC-Ressourcen
Verarbeitung von Assembler Code

Literatur:

Touvron, Hugo, Thibaut Lavril, Gautier Izacard, Xavier Martinet, Marie-Anne Lachaux, Timothée Lacroix, Baptiste Rozière, et al. “LLaMA: Open and Efficient Foundation Language Models,” 2023.
https://pytorch.org/
https://huggingface.co/models

Kontakt: https://tu-dresden.de/zih/die-einrichtung/struktur/sebastian-doebel

Konzept zur zyklischen GPU Performance Bewertung von HPC Rechenknoten

GPU Benchmark ermöglichen es, die Leistungsfähigkeit aktueller GPU Architekturen mittels verschiedener paralleler Programmierparadigmen auszumessen und zu bewerten.
Im Produktionsbetrieb eines Rechenzentrums ist es neben einer einmaligen Leistungsbewertung sinnvoll, wiederkehrend den Istzustand eines (GPU-)Rechenknotens mit seinem Sollzustand (Hardware und Software) mittels Benchmarks zu vergleichen, um Hardware- und Konfigurationsfehler zu entdecken.
Ziel dieser Arbeit ist es, einen geeigneten GPU Benchmark auszuwählen (z.B. aus der SPEC Familie) und mit diesem ein Konzept zu entwickeln, das beschreibt, wie wiederkehrende Messungen organisiert, durchgeführt und aufbereitet werden müssen, damit im kontinuierlichen Betrieb Fehler oder Beeinträchtigungen entdeckt werden können. Wenn das Thema im Rahmen einer Beleg- oder Bachelorarbeit verwendet wird, ist neben der konzeptionellen Arbeit auch eine prototypische Umsetzung vorgesehen. Studierende können dabei auf Vorarbeiten zurückgreifen, die zeigen, wie die SPEC Benchmark Familie verwendet und wie kontinuierlich Messungen in einem Produktionsbetrieb integriert werden können.
Dieses Thema beinhaltet offene Forschungsfragen, die ggf. eine intensive Zusammenarbeit mit dem Betreuer erforderlich machen.

Schwerpunkte:

Literaturrecherche
Konzeptionelle Arbeit basierend auf zwei studentischen Vorarbeiten
Arbeiten auf Hochleistungsrecheninfrastruktur in Linux Arbeitsumgebung
Nutzung der Bash Kommandozeile
ggf. Konfiguration und Installation von Benchmarks (Vorarbeit vorhanden)
ggf. Automatisierung der Messung (Vorarbeit vorhanden)
ggf. Speicherung der Daten in einer Datenbank (Vorarbeit vorhanden)
ggf. grafische Aufbereitung der Daten (Vorarbeit vorhanden)

Literatur:

Brunst, Holger, et al. “First Experiences in Performance Benchmarking with the New SPEChpc 2021 Suites.” 2022 22nd IEEE International Symposium on Cluster, Cloud and Internet Computing (CCGrid) (2022): 675-684.
Juckeland, Guido, et al. “SPEC ACCEL: A Standard Application Suite for Measuring Hardware Accelerator Performance.” PMBS@SC (2014).

Kontakt: https://tu-dresden.de/zih/die-einrichtung/struktur/holger-brunst

Studentische Arbeiten

Inhaltsverzeichnis

Bachelor, Master und Diplomarbeitsthemen

Belegarbeiten

Zu dieser Seite

Rechnerarchitektur