Thesis Topics
Table of contents
Bachelor, Master And Diploma Thesis
The topic selection is made together with the student. Possible topics for a thesis might include:
- Measuring and evaluating the energy consumption of applications
- Developing standardised energy efficiency benchmarks
- Developing and evaluating energy efficiency metrics
- Developing strategies for energy savings
Contact: Daniel Hackenberg
(online since 06.09.2022)
The new SPEChpc2021 benchmark allows current system architectures to be measured using various parallel programming paradigms (MPI, OpenMP, OpenACC, OpenMP target offloading). In principle, four different problem sizes can be selected (tiny, small, medium, large).
The goal of this topic is to install the complete performance suite (i.e. all four paradigms), to instrument it with the runtime monitor Score-P and to analyze the collected trace data with the analysis tool Vampir.
The individual applications of the suite in their four versions are to be compared in detail and examined for expected performance bottlenecks.
Since the benchmark is still comparatively new, problems with portability and computing performance are to be expected, which in turn can be uncovered and documented with the aforementioned tools.
Priorities:
- Working on high-performance computing infrastructure in Linux working environment
- Configuration and installation of the SPEChpc2021 benchmark
- Bash/C/C++/Fortran or GPU programming
- Use of the performance recording tools Score-P, lo2s and Vampir
- Analysis and interpretation of the obtained data with respect to performance characteristics like scalability, speedup, parallel efficiencies, performance boundnes
Contact: Dr. Holger Brunst
(Online seit: 02.05.2022)
Apache Flink ist ein Framework, das es erlaubt, die Verarbeitung von Daten auf Knoten eines Rechenclusters zu verteilen. Verschiedene Möglichkeiten bei der Implementierung einer Anwendung und Konfiguration des Clusters können die Geschwindigkeit der Verarbeitung beeinflussen. Die Geschwindigkeit von Anwendungen muss daher konkret untersucht werden. Lo2s ermöglicht es, das Anwendungsverhalten aufzuzeichnen. Im Rahmen dieser Arbeit soll Lo2s auf Flink-Benchmarks angewendet und deren Verhalten untersucht werden.
Inhaltliche Schwerpunkte:
- Untersuchung der Integration von lo2s und Apache Flink
- Vergleich der Performance-Daten von lo2s mit dem Flink-internen Monitoring
- Unterschiede zur Aufzeichnung mit Score-P
- Messung des Overheads
Kontakt: Jan Frenzel
(Online seit: 05.09.2022)
Konventionell werden Programmspuren als Zeitlinien von Funktionsaufrufen oder verarbeitet als Programmprofile dargestellt. Um periodische Effekte zu visualisieren, sollen verschiedene Transformationen und Visualisierungen auf ihre Eignung hin getestet werden. Beispielhaft seien Fourier-Analyse, Spektrogramme und Autokorrelation genannt. Nach Erarbeitung eines Konzeptes zur Visualisierung mit Fokus auf das Hervorheben von möglichen Störquellen, soll ein Prototyp in C++ und Qt entwickelt werden.
Inhaltliche Schwerpunkte:
- Literaturrecherche
- Tracing mit Score-P und OTF2
- C++
- Qt
- Signalverarbeitung
Kontakt: Maximilian Knespel
(Online since: 23.09.2022)
The matter of sustainable data use is becoming more and more important in science and for HPC centers. In the HPC-NFDI4Earth interest group, use cases involving the use of several data centers are known. The NFDI (National Research Data Infrastructure) is working on possibilities for further use of such data based on their FAIR principles. The possible data transfer between centers will be investigated in this work using various methods and presented in the form of a data transfer map. The goal is to give a recommendation for HPC users.
Priorities:
- Data Transfer (more than two centers/logins)
- ssh, scp, S3 protocol, irods, glusterfs, ufdp/gridftp
- Literature research
Contact: Noah Trumpik
Beleg-Topics
(online seit: 19.04.2021, update 06.12.2021 )
R ist eine der führenden Lösungen für die statistische Datenanalyse und kann für Data Analytics und Visualisierung eingesetzt werden. In der Arbeit sollen die Möglichkeiten des parallelen Rechnens mit R untersucht und evaluiert werden. Im Anwendungsfall sollen Sensordaten aus einem HPC-System parallel ausgewertet werden. Zur Bearbeitung der Aufgabenstellung sind Vorkenntnisse der Programmiersprache R obligatorisch.
Schwerpunkte:
- Konzeptionelle Umsetzung verschiedener paralleler Programmierparadigmen in R.
- Möglichkeiten und Probleme bei der Code-Optimierung für R.
- Bezug zu aktuellen Architekturen.
Literatur:
- Terence Sloan et al. Mastering Parallel Programming with R. Packt Publishing, 2016.
- McCallum, Q. Ethan; Weston, Stephen. Parallel R. O'Reilly, 2012.
Kontakt: Dr. Taras Lazariv
(Online seit: 02.05.2022)
Apache Flink ist ein Framework, das es erlaubt, die Verarbeitung von Daten auf Knoten eines Rechenclusters zu verteilen. Verschiedene Möglichkeiten bei der Implementierung einer Anwendung und Konfiguration des Clusters können die Geschwindigkeit der Verarbeitung beeinflussen. Die Geschwindigkeit von Anwendungen muss daher konkret untersucht werden. Lo2s ermöglicht es, das Anwendungsverhalten aufzuzeichnen. Im Rahmen dieser Arbeit soll Lo2s auf Flink-Benchmarks angewendet und deren Verhalten untersucht werden.
Inhaltliche Schwerpunkte:
- Untersuchung der Integration von lo2s und Apache Flink
- Vergleich der Performance-Daten von lo2s mit dem Flink-internen Monitoring
- Unterschiede zur Aufzeichnung mit Score-P
- Messung des Overheads
Kontakt: Jan Frenzel