28.08.2022
Wann ist eine Datenbank für Forschungsgruppen von Vorteil?
Dies ist der zweite Teil unserer Datenbankreihe. Den ersten Teil finden Sie hier.
SQL-Datenbank – Was ist das?
SQL ist ein etablierter Standard für Datenbanken und steht für Structured Query Language. Diese beschreibt die Abfrage-"Sprache", die bei der Arbeit mit einer relationalen Datenbank zur Anwendung kommt. In einer relationalen Datenbank sind die Daten in einzelnen Tabellen gespeichert, welche miteinander in Beziehung stehen.
Der erste Schritt: Erstellen eines Datenbankmodells
Bevor man die Datenbank erstellt und mit Daten bespielen kann, ist es wichtig eine umfangreiche Datenanalyse vorzunehmen, um festzustellen wie die Datenbank aufgebaut werden soll. Dabei werden die bestehenden Daten logisch auf Tabellen aufgeteilt, passende Spaltennamen gewählt und eindeutige (Primär)-Schlüssel zur Identifizierung vergeben, welche dann als Fremdschlüssel (Referenz) in anderen Tabellen genutzt werden können.
Ein Beispiel:
Eine Professur möchte einen systematischen Überblick über ihre Forschungsprojekte erstellen. Die Projekte beschäftigen sich - bei aller Unterschiedlichkeit – mit der Untersuchung von biologischen Proben, welche in speziellen Kühlbehältern bei unterschiedlichen Temperaturen aufbewahrt werden. Um die gesetzliche Archivierungsfrist zu erfüllen und um Proben für weitere Forschung nachvollziehbar aufzubewahren, sollen alle Proben in einer Datenbank registriert werden. Es sind unter anderem Daten zur Herkunft der Probe, dem Aufbewahrungsort, dem zugehörigen Projekt, Ansprechpersonen und der Temperatur des Aufbewahrungsortes zu verwalten und zueinander in Relation zu bringen.
Das sich ergebende Datenmodell, bestehend aus den Relationen und den zu verwaltenden Merkmalen der verschiedenen Entitäten, kann auch graphisch darstellt werden:
Für jede Art von Entitäten werden in unserem Fall drei bzw. vier Merkmale gespeichert.
Datenbank und Datenbankabfrage
Um das Datenmodell und die Arbeit damit zu veranschaulichen, setzen wir das obige Beispiel fort und befüllen dessen Tabellen mit ein paar beispielhaften Einträgen:
In der Tabelle Samples dient die Spalte „Sample-ID“ dabei als Primärschlüssel für die Proben.
Zudem referenzieren die Datensätze aus dieser Tabelle über die Spalte „Project“ die Tabelle Projects. Hierbei fungiert die Spalte „Project“ als Fremdschlüssel, der auf den Primärschlüssel „Project-ID“ verweist.
Analog dazu referenziert die Spalte „Storage Device" den Primärschlüssel „Storage-ID“ in der Tabelle Storage Devices.
Die Angehörigen der oben genannten Professur können nun zum Beispiel folgende Abfrage starten: „Zeige mir alle Blutproben aus Projekten von Dr. Miller und wo diese aufbewahrt sind“. Es sind also komplexe Abfragen möglich, die Informationen aus den einzelnen, jedoch miteinander verknüpften Tabellen verwenden.
Welchen Nutzen haben relationale Datenbanken gegenüber Excel?
Schon in diesem einfachen Beispiel wird der Vorteil einer relationalen Datenbank gegenüber einer einzigen Excel-Tabelle deutlich: Im Falle von Änderungen – zum Beispiel an der Temperatur – muss in einer relationalen Datenbank nur ein Eintrag verändert werden. Ein weiterer Vorteil ist, dass Informationen zu Projekten und Aufbewahrungsorten wiederverwendet werden können und von weiteren Tabellen referenziert werden (z.B. durch eine Tabelle mit Publikationen).
Die Datenmengen und die Komplexität der Daten können schnell zu groß für Excel werden. Auch die Abfragen geschehen meist über eine Datenbank besser und schneller. Außerdem können Excel-Dateien oft nur lokal bearbeitet werden und müssten zwischen Bearbeitenden transferiert werden. Vor allem bei vielen Einträgen - stellen Sie sich ein Institut mit hunderten Beschäftigten, unterschiedlicher Expertise sowie vielfältigen Methoden und Daten vor - kann somit eine relationale Datenbank hilfreich sein.
Hat dieser Einblick Ihr Interesse an Datenbanken geweckt, aber Sie sind sich noch nicht sicher, ob und wie eine Datenbank Ihrer Arbeitsgruppe helfen kann?
Dann kontaktieren Sie uns dazu gerne per E-Mail über Kontaktstelle Forschungsdaten, buchen Sie sich einen Termin, besuchen Sie unsere wöchentliche Sprechstunde oder nutzen Sie unser Weiterbildungsangebot.