15.08.2017
Abgeschrieben und geklaut bei Platon?!
Wer hat Platon wie zitiert? Welcher antike Autor hat von welchem Text Platons abgeschrieben? Wer hat Platons Ideen als Grundlage für eigene Konzepte und Theorien verwendet.? Wie die Ideen und Texte von Platon rezipiert, zitiert und paraphrasiert wurden, untersucht das Forschungsprojekt „Digital Plato: Tradition and Reception “. Digital Plato ist ein Verbundprojekt mit Projektpartnern aus der Klassischen Philologie (Prof. Dr. Sier, Universität Leipzig), der Alten Geschichte (Prof. Dr. Schubert, Universität Leipzig), der Korpuslinguistik (Prof. Dr. Scharloth, TU Dresden) und der Informatik (Prof. Dr. Molitor / Dr. Ritter, Universität Halle-Wittenberg). Das Projekt wird im Rahmen der Förderschiene „Offen - für Außergewöhnliches“ der VolkswagenStiftung gefördert. Die Projektlaufzeit beträgt 3 Jahre (2016-2019).
„Unser Ziel ist“, erklärt Prof. Dr. Joachim Scharloth, Professor für Angewandte Linguistik an der TU Dresden, „die Nachwirkung und Rezeption von Platons Werken in der antiken griechischen Literatur vom 3. Jahrhundert v.Chr. bis zu den spätantiken Autoren des Neoplatonismus im 6. Jahrhundert n.Chr. zu erschließen“. Dazu sollen neben Testimonien und Zitationen auch Paraphrasen seiner Ideen bei anderen antiken griechischen Autoren gefunden und in Form eines digitalen Thesaurus zusammengestellt werden. Der so erstellte Paraphrasen-Thesaurus wird über ein Web-Portal mit angepassten Such- und Einstellungsmöglichkeiten veröffentlicht. „Dabei wollen wir den Wissenschaftlern nicht nur ein Ergebnis vorlegen, sondern sie sollen selbst explorativ arbeiten können und verschiedene Einstellungsmöglichkeiten haben“, beschreibt Franz Keilholz, Doktorand bei Prof. Joachim Scharloth. „Das Potential des Tools können wir aktuell noch nicht abschätzen. Es soll aber so funktionieren, dass die Wissenschaftler einen bestimmten Text eingeben und das Tool dann entsprechende Paraphrasen vorschlägt“.
Die Wissenschaftler haben sich für die Texte von Platon entschieden, weil diese sehr wichtig in der antiken Forschung sind und das Korpus sehr gut erschlossen ist. „Schließlich wollen wir ja das Platon-Korpus mit allen Texten aus der Antike vergleichen, um herauszufinden, wo sich Paraphrasen verbergen“, erklärt Prof. Scharloth. Dazu mussten die Forscher als erstes festlegen, was genau eine Paraphrase ist. Allgemein definiert ist eine Paraphrase als eine intentionale, absichtsvolle Umformulierung eines Sachverhaltes oder eines Urtextes. „Und das kann alles Mögliche bedeuten“, resümiert der Wissenschaftler. „Wenn ich über Ideenlehre rede, kann das schon eine Platon-Paraphrase sein. Sie ist durch ein Wort bestimmt, weil in diesem einen Wort die ganze Philosophie von Platon zusammengefasst ist. Es kann aber auch sein, dass einzelne Textstücke eine Paraphrase von Platon darstellen. Also eine Paraphrase kann von einem Zitat, in dem sich ein Wort unterscheidet, bis hin zu dieser konzeptionellen Gleichheit, alles sein. Wir müssen folglich einen Mittelweg finden, beschreiben und ihn algorithmisch umzusetzen.“
Nach einem Jahr intensiver Arbeit haben sie allerdings festgestellt, dass sie mit der ursprünglichen Definition von Paraphrasen aktuell an bestimmte Grenzen kommen. „Das ist ja aber auch das Spannende – wir wenden maschinelle Methoden an, um traditionelle Konzepte in Frage zu stellen und weiterzuentwickeln. Das ist das Potential von datengeleiteten Methoden“, erklärt Herr Keilholz. „Mit dem datengeleiteten Ansatz suchen wir Paraphrasen. Das bedeutet, dass wir uns überlegen, wie Muster aussehen könnten und was zu einer Annäherung an eine Paraphrase führen könnte. Ob das dem traditionellen Paraphrasenbegriff entspricht, müssen wir dann mit den Kollegen besprechen.“
Paraphrasen-Erkennen ist eines der spannenden Felder in den Digital Humanities. Lange wurde versucht Texte über Regeln zu erschließen. Es wurden regelbasierte Verfahren entwickelt, um Texte maschinell lesbar zu machen. Einen Text maschinell verstehen zu können, heißt ihn parsen zu können und ihn somit semantisch zu verstehen. Anfang der 2000er Jahre gab es einen Paradigmenwechsel. Einen Text verstehen zu können, bedeutet jetzt ihn paraphrasieren zu können. „Das ist ja auch nachvollziehbar“, erklärt Prof. Scharloth. „Wenn ich einen Text oder Sachverhalt mit eigenen Worten wiedergeben kann, habe ich ihn auch verstanden. Und wir wenden diese Methoden jetzt auf antike Texte an.“
Die Wissenschaftler erarbeiten also ein Grundgerüst, wie eine Paraphrase aussehen könnte. Dafür gibt es gewisse Kriterien, die z.B. für eine Wiederbenutzung von Text stehen. „Wir haben natürlich auch in unserem Team jemanden, der Alt-Griechisch lesen kann, da es auch bei uns nicht möglich ist komplett sprachunabhängig zu arbeiten“, berichtet Franz Keilholz. „Wir müssen ja entscheiden, welche Algorithmen sinnvoll sind. Dafür müssen wir wissen, wie die Sprache aufgebaut ist und wie die Sprache funktioniert. Es macht z.B. nur Sinn nach Mustern aufeinanderfolgender Wörter suchen, wenn die Sprache eine feste Wortstellung hat. Bei Sprachen, die eine freie Wortstellung haben, müssen auch die Algorithmen mehr Variation erlauben.“
Das Projekt ist aktuell so weit, dass die ersten Algorithmen implementiert und die ersten Tests durchgeführt wurden. Jetzt geht es an die Feinabstimmung und Justierung der Algorithmen für eine sinnvolle und verwendbare Paraphrasenerkennung. Die ersten Ergebnisse werden im Forschungsteam gemeinsam besprochen. „Wir schauen uns die gefundenen Paraphrasen mit Philologen, Philosophen und Historikern gemeinsam an, um zu entscheiden, ob diese Textpassagen für die Wissenschaftler nutzbar sind,“ erklärt Scharloth. „Es bringt ja nichts, wenn unser Algorithmus Textpassagen als Paraphrasen identifiziert, die wir wissenschaftlich nicht nutzen können. Es geht also um die Anpassung der Algorithmen für historische, philologische und kulturwissenschaftliche Fragstellungen - weg von der klassischen Verwendung dieser Algorithmen.“
Für die Paraphrasenerkennung gibt es breite Anwendungsbereiche. In der Plagiatserkennung kann sie eine wichtige Rolle spielen. Hier dient sie zu dazu Abschnitte zu finden, die sich jemand angeeignet hat ohne diese zu kennzeichnen oder auszuweisen. „Wir wollen aber auch untersuchen, was man mit Paraphrasen-Erkennung sonst noch machen kann. Ist es z.B. möglich, ideologische Diffusionen zumessen?“ fasst Prof. Scharloth zusammen.
Weitere Informationen unter: https://tu-dresden.de/gsw/slk/germanistik/al/forschung