Fehlergruppierung zur heuristischen Beschleunigung von Fehlerinjektionskampagnen

Adrian Kulisch

13:00 - 14:00 Uhr

APB 3105 oder online

APB Andreas-Pfitzmann-Bau, Nöthnitzer Str. 46

Zeige Karte von diesem Ort.

BBB-Link: https://bbb.tu-dresden.de/b/mat-xin-oyh-xzn

Presentation Language: German

Simulationsbasierte Fehlerinjektionen ermöglichen eine reproduzierbare Bewertung der Fehlertoleranz von Anwendungen gegenüber Hardwarefehlern. Eine vollständige Untersuchung ist jedoch aufgrund der Anzahl möglicher Fehlerstellen für komplexe Anwendungen unpraktikabel. Diese Arbeit untersucht daher sogenannte Gang-Fault-Injektionen, also die Gruppierung mehrerer Fehlerstellen zu einem Injektionsexperiment, als Optimierungsverfahren für simulationsbasierte Fehlerinjektionen.

Hierzu wird auf Basis bestehender Literatur eine parametrisierte Strategie entwickelt, die Injektionsstellen für transiente Einbitfehler im Hauptspeicher zeitlich und räumlich strukturiert gruppiert. Diese Strategie wird im Fehlerinjektionsframework FAIL* implementiert. Das ermöglicht die Untersuchung in Kombination mit Def-Use-Pruning, einem etablierten Optimierungsverfahren für Fehlerinjektionen. Zur schnellen Exploration des Konfigurationsraums der Strategie wird eine Voruntersuchung konzipiert, die Gang-Fault-Injektionskampagnen auf Basis der Resultate konventioneller Kampagnen nachbildet. Es werden Metriken vorgestellt, um die Laufzeitreduktion und die Exaktheit von Gang-Fault-Injektionen zu quantifizieren.

Zur Evaluation werden repräsentative Embedded-Benchmarks verwendet. Die Ergebnisse zeigen, dass Gang-Fault-Injektionen in Kombination mit Def-Use-Pruning die Anzahl an notwendigen Injektionsexperimenten um bis zu 75 % reduzieren können. Gleichzeitig wird eine hohe Exaktheit von über 95 % im Vergleich zu konventionellen durch Def-Use-Pruning optimierten Fehlerinjektionskampagnen erreicht. Im Rahmen der Untersuchung werden potenzielle Ursachen für den Verlust der vollständigen Exaktheit analysiert.

Die vorgestellte Implementierung kann das Potential der Reduktion der Anzahl notwendiger Injektionsexperimente in den realen Laufzeiten nicht vollständig ausschöpfen. Hier ist eine maximale Verbesserung von 16 % zu beobachten. Es werden mögliche Ursachen für diese Diskrepanz diskutiert und Ansätze zur weiteren Verbesserung der Implementierung vorgestellt.

Die Ergebnisse dieser Arbeit legen nahe, dass Gang-Fault-Injektionen ein vielversprechendes Optimierungsverfahren für simulationsbasierte Fehlerinjektionen darstellen und damit die Grundlage für weiterführende Forschung in diesem Bereich schaffen.

Fehlergruppierung zur heuristischen Beschleunigung von Fehlerinjektionskampagnen

Zu dieser Seite

Finden!

Fehlergruppie­rung zur heuristischen Beschleunigung von Fehlerinjekti­onskampagnen

Zu dieser Seite

Fehlergruppierung zur heuristischen Beschleunigung von Fehlerinjektionskampagnen