Vorlesung Spracherkennung
(Hier finden Sie verbindliche Studienordnungen und Modulhandbücher. )
Die Vorlesung Spracherkennung behandelt Methoden zur Umwandlung von Sprachaudiosignalen in geschriebenen Text, also „Speech-to-Text“. Nachdem wir uns mit der Problemstellung vertraut gemacht haben gibt es eine kurze Einführung in die Phonetik und Phonologie, die sowohl die Grundlage für die Spracherkennung als auch für die Sprachsynthese bildet. Dann behandeln wir die Merkmalsberechnung und Methoden zur Einzelworterkennung. Anschließend betrachten wir das schwierigere Problem der Wortfolgenerkennung, einerseits mit klassischen Hidden-Markov-Modellen, und andererseits durch moderne neuronale Modelle. Bei der Wortfolgenerkennung spielen auch Sprachmodelle eine Rolle, die heute in erweiterter Form in ChatGPT oder Gemini eingesetzt werden.
Die Vorlesung kann bei Bedarf auf Englisch gehalten oder durch englischsprachige Unterlagen unterstützt werden.
Die Vorlesung ist geeignet für
Studiengang | Abschluss | Modulname | Modulnummer |
---|---|---|---|
Elektrotechnik / Informationstechnik | Diplom | Sprachtechnologie | ET-12 09 04 |
Informationssystemtechnik | Diplom | Sprachtechnologie | ET-12 09 04 |
Weiterhin geeignet für Studierende anderer technischer Disziplinen.
Empfohlene Kenntnisse: Systemtheorie I und II, Signalverarbeitung, Signalanalyse und Mustererkennung