DataHeap
Einer der Forschungsschwerpunkte des ZIH ist die auf Ereignisspuren basierende Analyse von parallelen Programmen. Greifen diese in verteilten Umgebungen auf gemeinsame Ressourcen zu, werden oft Performance-Daten benötigt, die aus verschiedenen Gründen nicht auf den Compute-Knoten zur Verfügung stehen. Am ZIH wird eine Softwareumgebung entwickelt, die es erlaubt, solche externen Performance-Daten zu sammeln und in Programmspuren einzubetten. Diese Software heißt "Dataheap".
Basis von Dataheap ist ein zentraler, paralleler (pThreads) Server. Innerhalb der verteilten Umgebung sind externe Agenten dafür zuständig, die Performance-Daten der verschiedenen Quellen zu sammeln. Dies erlaubt eine Abstraktion von den jeweiligen Zugriffsmöglichkeiten auf die Datenquelle (TCP, seriell, ...). Aus den Daten, die die Agenten bereitstellen, kann der Server abgeleitete Metriken zur Verfügung stellen. Über eine Schnittstelle können diese Daten in Programmspuren eingebettet werden. Zusätzliche Komponenten der Software erlauben es, die gesammelten Performance-Daten in einer Datenbank zu speichern und historische Performance-Daten abzufragen. Ebenso sind administrative Werkzeuge vorhanden, um den Zustand der Dataheap-Infrastruktur z.B. via Nagios zu überwachen. Mehr Informationen können in der zur Verfügung gestellten Dokumentation gefunden werden. Die Software wird unter der Opern Source LGPL-Lizenz zur Verfügung gestellt.
Letzte stabile Softwareversion
- Dataheap version 1.00 (04/20/2012, 672 KB)
- Projekt Homepage
- Bug Tracker
Kontakt
Publikationen
- Michael Kluge, Daniel Hackenberg, Wolfgang E. Nagel. Collecting Distributed Performance Data with Dataheap: Generating and Exploiting a Holistic System View. In: Proceedings of the International Conference on Computational Science (ICCS), 2012.