21.12.2023
Gastvortrag "Lernersprachenanalyse mit großen Datenmengen: Ein Werkstattbericht aus dem Projekt DAKODA." | Lisa Lenort
Referentin: Lisa Lenort (Universität Leipzig)
Ort: TU Dresden, Wiener Straße 48, Raum W48/0101
Datum/Zeit: 17.01.2024, 14:50 - 16:20
Das Projekt DAKODA widmet sich der computerlinguistischen Analyse von syntaktischen Erwerbsstufen des Deutschen anhand von Sprachdaten von Lerner:innen des Deutschen als Fremd- und Zweitsprache. Dazu werden viele Lernerkorpora des Deutschen gesammelt, zu einer großen Datenbasis konsolidiert und für die (teil-) automatischen Analysen aufbereitet.
Neben bereits verfügbaren Sammlungen wie den Korpora der Falko-Familie oder MERLIN, werden auch wichtige Korpora aus klassischen Zweitsprachenerwerbsstudien, wie z.B. die ESF- oder ZISA-Daten, sowie bisher unveröffentlichte Korpora, wie z.B. MULTILIT, aufgenommen. Diese teilweise recht inhomogenen Daten für korpusübergreifende Analysen zusammenzuführen, birgt auf mehreren Ebenen Herausforderungen. Viele davon betreffen die Aufbereitung der gesammelten Lernendendaten selbst. Neben der technischen Vorverarbeitung der Sprachdaten (in Bezug auf Formate, Annotationen, usw.), sind Metadaten (über die Lernenden, das Setting, die Aufgabe, etc.) zentral für die fokussierten Fragestellungen. Daher wird in DAKODA ein Metadatenschema erarbeitet, das die verschiedenen Korpora miteinander verankert und so die Sprachdaten um wichtige Informationen zu den Sprechenden (usw.) anreichert.
Der Vortrag bettet das Projekt, Ziele und Voraussetzungen ein und fokussiert dann den Arbeitsbereich Metadaten. Ergänzend zum ersten Entwurf des Metadatenschemas für DAKODA und dessen Genese wird die Relevanz von Metadaten für die Lernerkorpusforschung und die damit einhergehende Notwendigkeit von Standardisierungsbemühungen hervorgehoben.
DAKODA (Datenkompetenzen in DaF/DaZ: Exploration sprachtechnologischer Ansätze zur Analyse von L2-Erwerbsstufen in Lernerkorpora des Deutschen) ist ein interdisziplinäres Projekt des Language Technology Lab der FernUniversität Hagen (Leitung: Prof. Dr.-Ing. Torsten Zesch) und des Herder-Insituts der Universität Leipzig (Leitung: Prof. Dr. Katrin Wisniewski). Für weitere Informationen siehe www.dakoda.org.
Interessierte Studierende und Kolleg:innen sind herzlich eingeladen.
Die Teilnahme am Gastvortrag ist kostenfrei.
Aktueller Beitrag zum Projekt:
Wisniewski, K., Zesch, T., Schwendemann, M., Ruppenhofer, J. & Portmann, A., (2023) AUTOMATISCHE ANALYSEN VON ERWERBSSTUFEN IN EINER GROSSEN LERNERKORPUS-DATENBANK FÜR DAF/DAZ. Das Forschungsprojekt DAKODA Korpora Deutsch als Fremdsprache 3(2), 179–224. doi: https://doi.org/10.48694/kordaf.3845