13.03.2026; Verteidigung
Echtzeit-AGFehlergruppierung zur heuristischen Beschleunigung von Fehlerinjektionskampagnen
BBB-Link: https://bbb.tu-dresden.de/b/mat-xin-oyh-xzn
Presentation Language: German
Simulationsbasierte Fehlerinjektionen ermöglichen eine reproduzierbare Bewertung der Fehlertoleranz von Anwendungen gegenüber Hardwarefehlern. Eine vollständige Untersuchung ist jedoch aufgrund der Anzahl möglicher Fehlerstellen für komplexe Anwendungen unpraktikabel. Diese Arbeit untersucht daher sogenannte Gang-Fault-Injektionen, also die Gruppierung mehrerer Fehlerstellen zu einem Injektionsexperiment, als Optimierungsverfahren für simulationsbasierte Fehlerinjektionen.
Hierzu wird auf Basis bestehender Literatur eine parametrisierte Strategie entwickelt, die Injektionsstellen für transiente Einbitfehler im Hauptspeicher zeitlich und räumlich strukturiert gruppiert. Diese Strategie wird im Fehlerinjektionsframework FAIL* implementiert. Das ermöglicht die Untersuchung in Kombination mit Def-Use-Pruning, einem etablierten Optimierungsverfahren für Fehlerinjektionen. Zur schnellen Exploration des Konfigurationsraums der Strategie wird eine Voruntersuchung konzipiert, die Gang-Fault-Injektionskampagnen auf Basis der Resultate konventioneller Kampagnen nachbildet. Es werden Metriken vorgestellt, um die Laufzeitreduktion und die Exaktheit von Gang-Fault-Injektionen zu quantifizieren.
Zur Evaluation werden repräsentative Embedded-Benchmarks verwendet. Die Ergebnisse zeigen, dass Gang-Fault-Injektionen in Kombination mit Def-Use-Pruning die Anzahl an notwendigen Injektionsexperimenten um bis zu 75 % reduzieren können. Gleichzeitig wird eine hohe Exaktheit von über 95 % im Vergleich zu konventionellen durch Def-Use-Pruning optimierten Fehlerinjektionskampagnen erreicht. Im Rahmen der Untersuchung werden potenzielle Ursachen für den Verlust der vollständigen Exaktheit analysiert.
Die vorgestellte Implementierung kann das Potential der Reduktion der Anzahl notwendiger Injektionsexperimente in den realen Laufzeiten nicht vollständig ausschöpfen. Hier ist eine maximale Verbesserung von 16 % zu beobachten. Es werden mögliche Ursachen für diese Diskrepanz diskutiert und Ansätze zur weiteren Verbesserung der Implementierung vorgestellt.
Die Ergebnisse dieser Arbeit legen nahe, dass Gang-Fault-Injektionen ein vielversprechendes Optimierungsverfahren für simulationsbasierte Fehlerinjektionen darstellen und damit die Grundlage für weiterführende Forschung in diesem Bereich schaffen.