28.09.2021
Datenarchivierung - Eine Begriffssuche
In unseren Beratungen fällt oft der Begriff Datenarchivierung. Wir beobachten, dass dieser Begriff von den Forschenden unterschiedlich gedeutet wird. Dabei werden die folgenden drei Interpretationen häufig genannt:
- Ein neues Projekt. Eine neue Ordnerstruktur. Aber was ist mit all den Daten aus den bisherigen Projekten? Wer hat die Zeit dafür, diese in die neue Struktur einzupflegen? Antwort: „Niemand!“. Lösung: "Lasst uns einfach die alten Daten so wie sie sind in einen Ordner namens "Archiv" verschieben." -> Ist das Archivierung? Nein.
- Das Gruppenlaufwerk der Arbeitsgruppe ist voll; es gibt unzählige Projektordner von Mitarbeitenden, die schon lange das Institut verlassen haben. Braucht man die Daten noch? Antwort: "Die dürfen wir auf gar keinen Fall löschen!“ Lösung: „Lasst uns einfach die Daten auf externe Festplatten oder das Zwischenarchiv des ZIH ziehen. Das kostet nicht viel und da liegen die Daten erstmal sicher." -> Ist das Archivierung? Nein.
- Das Forschungsprojekt wurde erfolgreich beendet. Sollte man die Daten jetzt nicht anderen Forschenden zur Nachnutzung zur Verfügung stellen? Antwort „Na klar!“ Lösung: "Wir verschieben die Daten in einen Ordner auf dem Gruppenlaufwerk. Dort kann dann jeder mit den Daten arbeiten. Brauchen wir mal wieder die Originalversion, dann kann uns das ZIH helfen, die machen ja regelmäßig ein Backup vom Gruppenlaufwerk." -> Ist das Archivierung? Nein.
Aber was ist denn dann eine Datenarchivierung? Eine Datenarchivierung ist das „Einfrieren“ eines Datensatzes in der Zeit und bietet den folgenden Schutz für Ihre Daten:
- Der archivierte Datensatz ist dauerhaft vor Veränderung geschützt: müssen dennoch Änderungen vorgenommen werden, dann muss eine neue Version angelegt werden.
- Der archivierte Datensatz ist dauerhaft vor der Vergänglichkeit von Speichermedien geschützt: dazu werden Duplikate des Datensatzes auf lang haltbaren Speichermedien wie z.B. Magnetbändern gespeichert, regelmäßig auf Lesbarkeit geprüft und vorsorglich alle 10-20 Jahre auf aktuellere Speichermedien verschoben.
- Der archivierte Datensatz ist dauerhaft vor der Veränderung der Technologien geschützt: durch die Verwendung von archivierbaren, nicht-proprietären Formaten, kann der Datensatz auch dann noch gelesen werden, wenn die Original-Software in einigen Jahrzehnten nicht mehr zur Verfügung stehen sollte.
Haben Sie weitere Fragen zum Thema Archivierung? Oder Anmerkungen zu dieser Definition?
Gerne kommen wir mit Ihnen ins Gespräch. Kontaktieren Sie uns dazu per E-Mail über Kontaktstelle Forschungsdaten, buchen Sie sich einen Termin, besuchen Sie unsere wöchentliche Sprechstunde oder nutzen Sie unser Weiterbildungsangebot.