May 21, 2019
200 Jahre sprechende Maschinen: Die historische Sammlung aufbereitet für das digitale Zeitalter
Bevor Sprachassistenten ihre Stimme bekamen und Navigationssysteme zu sprechen lernten, versuchten Forscher bereits vor 200 Jahren die Sprache künstlich zu erzeugen. Die historische akustisch-phonetische Sammlung (HAPS) der TU Dresden zeigt die Entwicklung der Sprachtechnologie seit dem 18. Jahrhundert in einer für Europa einmaligen Geschlossenheit. Im Rahmen des Projektes „Faszination sprechende Maschine: Technologischer Wandel der Sprachsynthese über zwei Jahrhunderte“ wurde die HAPS-Sammlung wissenschaftlich erfasst und für Forschung und Lehre aufbereitet. Nun klingt die 2,5-jährige Forschungsarbeit mit einer Abschlussveranstaltung am 21. Mai 2019 im Makerspace der SLUB Dresden aus.
Das interdisziplinäre Projektteam unter der Leitung von Jun.-Prof. Peter Birkholz (Institut für Akustik und Sprachkommunikation) überführte die HAPS-Sammlung in eine digitale Ausstellung. Apparate, Maschinen und Gegenstände, die die Entwicklung der Experimentalphonetik und Sprachtechnologie von der Mitte des 18. bis in die zweite Hälfte des 20. Jahrhunderts darstellen, wurden multimedial aufbereitet, um eine höhere Sichtbarkeit und eine interaktive Auseinandersetzung mit den Exponaten zu gewährleisten. Ausgewählte Objekte wurden im Rahmen des Projektes als Demonstrationsobjekte für die Lehre eingerichtet und können von nun an in den Vorlesungen und Praktikumsversuchen eingesetzt werden.
Die HAPS-Kollektion ist aber deutlich mehr als nur eine Sammlung von historischen Kuriositäten. Die historischen Sprechmaschinen können wichtige Erkenntnisse und Inspirationen für die moderne Forschung bieten. In jüngster Zeit gewinnen Verfahren zur Sprachsynthese zunehmend an Bedeutung, denn sie sind wesentlicher Bestandteil von sprachgesteuerten Dialog- und Assistenzsystemen (z. B. von Navigationssystemen oder „persönlichen Assistenten“ wie Apples SIRI oder Microsofts CORTANA). Außerdem besitzt die Sprachsynthese großes Potential beim Erlernen einer Fremdsprache sowie bei der automatischen Übersetzung. Moderne Geräte sprechen zwar schon verständlich, ihre Stimme hört sich jedoch immer noch künstlich an. „Die aktuellen Synthesesysteme arbeiten weitestgehend nach dem Prinzip der Verkettung kurzer Bausteine natürlicher Sprachaufnahmen, ohne den Prozess der Spracherzeugung zu berücksichtigen“, erklärt Birkholz. „Obwohl dieser Ansatz recht erfolgreich ist, sind die Ausdrucksfähigkeit und Manipulierbarkeit der künstlichen Stimmen stark eingeschränkt. Daher gibt es wieder Versuche, Sprache durch eine computerimplementierte vollständige Simulation der Sprachproduktion zu erzeugen.“ Diese Herangehensweise ähnelt damit den frühen Sprechmaschinen des 18. und 19. Jahrhunderts mit der Ausnahme, dass der Sprechtrakt, die Stimmlippen usw. nun in Form von Computermodellen statt mechanischen Modellen entwickelt werden. „Es hat sich gezeigt, dass mechanische Modelle des Sprechtrakts äußerst wertvolle Hilfsmittel sind, um die Computermodelle in ihrem Verhalten realistischer zu gestalten“, so Birkholz. „So können zur Validierung z. B. die Computersimulationen akustisch direkt mit ihren mechanischen Gegenstücken verglichen werden, was mit einem menschlichen Sprechtrakt nicht im Detail möglich ist.“ Dies hat zu einem neu erwachenden Interesse an (motorgesteuerten) mechanischen Sprechmaschinen geführt, die bei Bedarf beliebig mit Sensoren versehen werden können. Durch die Einbindung der Geschichte in die moderne Forschung kann eine innovative Technologie entstehen, die in der Lage ist, elektronische Geräte mit einer absolut natürlich klingenden und emotional ausdrucksstarken Stimme auszustatten.
Die Vielschichtigkeit des Projekts „Faszination Sprechende Maschine“ brachte Experten geistes- und technikwissenschaftlicher Fächer zusammen. Projektbeteiligte waren neben Jun.-Prof. Peter Birkholz weiterhin Seniorprofessor Rüdiger Hoffmann (ebenfalls Institut für Akustik und Sprachkommunikation), Prof. Rainer Groh (Institut für Software und Multimediatechnik), Prof. Jens Krzywinski (Institut für Maschinenelemente und Maschinenkonstruktion), Prof. Joachim Scharloth (Institut für Germanistik), sowie Dr. Peter Plaßmeyer vom Mathematisch-Physikalischen Salon der Staatlichen Kunstsammlungen Dresden. Besucher können voraussichtlich ab dem Spätsommer die frisch aufbereitete HAPS-Sammlung im Barkhausen-Bau auf dem TU Dresden Campus bewundern. Weiterhin wird ein im Rahmen des Projektes entwickelter Demonstrator eines elektro-mechanischen Sprechtraktmodells neben weiteren Objekten Teil der geplanten Ausstellung „DER SCHLÜSSEL ZUM LEBEN – 500 Jahre mechanische Figurenautomaten“ vom 24. Juli bis zum 1. November 2020 im Japanischen Palais sein.
Informationen für Journalisten:
Jun.-Prof. Dr.-Ing. Peter Birkholz
Juniorprofessur für Kognitive Systeme
Tel.: 0351 463-32721