Audiokodierungen
Kodierungsalgorithmen (Komprimierungsalgorithmen) bilden die Grundlage für sogenannte Codecs. Codecs sind Soft- oder Hardware, die den Audio- oder Videostrom vor der Übertragung zur Gegenstelle kodieren und an der Gegenstelle wieder dekodieren. Dadurch wird der notwendige Bedarf an Übertragungskapazität bzw. Speicherplatz durch Vereinfachungen und Zusammenfassungen reduziert. Während der Kodierung können weniger wichtige Informationen verworfen werden.
Bei der Audiokodierung und der darauf aufbauenden Komprimierung werden verschiedene Eigenschaften des menschlichen Gehörs ausgenutzt. Dabei soll die Qualität des Audiostromes mit einer möglichst geringen Datenmenge erhalten bleiben.
Pulse Code Modulation (PCM)
PCM ist ein Verfahren zur kompressionsfreien Umwandlung analoger Audiosignale in digitale Daten. Es bildet die Grundlage des Audio-Standards G.711.
Dazu wird ein analoges Ton-Signal mit einem Impuls multipliziert (moduliert) und das Ergebnis durch einen binären Code mit der sogenannten Abtasttiefe / Sampling-Tiefe (z.B. 16 Bit) dargestellt. Der Vorgang wird periodisch mit der Abtast- oder Sampling-Rate (z.B. bei G.711 8 Bit und 8 kHz Samplingrate) wiederholt. Der erreichte Kompressionsfaktor liegt bei 1,75:1.
Das Verfahren wird in Nordamerika und Japan als µ-Law und in Europa auch als A-Law bezeichnet.
Differential Pulse Code Modulation (DPCM)
DPCM ist ein Verfahren zur Umwandlung von zeitlich diskreten Signalen in digitale Signale. Es ist eine Erweiterung von PCM und die Vorstufe von ADPCM.
Es ist besonders geeignet für aufeinanderfolgende Signale, die eine hohe Korrelation beinhalten. Das ist bei digitalen Audiosignalen der Fall, die dadurch mit hoher Datenkomprimierung gewandelt werden können.
Adaptive Differential Pulse Code Modulation (ADPCM)
ADPCM ist ein Verfahren für Audiosignale, welches in einer Reihe von Audio-Empfehlungen der ITU-T standardisiert wurde (G.721, G.722, G.725, G.726, G.727). Im Standard G.721 wird für die Übertragung ein Bereich bis zu 4kHz, in den Standards G.722 und G.725 werden bis zu 7 kHz verwendet.
ADPCM ist eine Sonderform der Pulse Code Modulation (PCM), welche versucht, den Signalverlauf im nächsten Abschnitt vorherzusagen. Bei der Quantisierung wird nur die Differenz zwischen dem vorhergesagten und dem realen Signal berechnet. Die Differenz kann mit 2-5 Bits übertragen werden, wodurch eine schmale Bandbreite zur Übertragung ausreichend ist. Die Ausgangsdatenrate kann bei ADPCM dynamisch zwischen 16 kbps und 64 kbps angepasst werden.
Linear Predictive Coding (LPC)
LPC ist eine Kodierungsart zur effizienten Übertragung von Sprachsignalen. Die Datenreduktion wird durch den Einsatz eines Prädiktionsverfahrens erreicht, welches Signale linear vorhersagt. Dadurch muss nur die Differenz von zwei direkt aufeinanderfolgenden Kurzzeitsegmenten übermittelt werden.
LPC nutzt ein einfaches synthetisches Modell der Sprache, das auf Lautstärke, Sprachgrundfrequenz und Stimmhaftigkeit des Ausgangssignales aufbaut. Auf der Empfängerseite ist mittels eines LPC-Vocoders eine natürlich klingende Sprachwiedergabe möglich, wogegen mit einem Phonem-Synthesizer nur eine sehr mechanisch klingende Sprachwiedergabe zu realisieren ist.
LPC wird oft fälschlicherweise mit dem Algorithmus CELP gleichgesetzt.
Code Excited Linear Prediction (CELP)
CELP ist ein Verfahren, welches auf LPC aufbaut. Es benutzt eine feste Datenrate von 4,8 kbps.
Der CELP-Coder arbeitet wie ein LPC-Coder. Zusätzlich berechnet er aber die Fehler zwischen dem Original und dem synthetischen Modell. Die Fehler werden mittels eines Codeaustauschs zwischen Decoder und Encoder übermittelt. Alle Fehlercodes sind in einem sogenannten „Codebuch“ auf beiden Seiten gleichermaßen definiert. Durch diesen etwa eine Größenordnung höheren Aufwand als im LPC-Verfahren wird eine wesentlich bessere Sprachqualität erreicht.
CELP ging in Teil 3 des MPEG-4-Standards der ISO ein. Eine Variante mit sehr geringer Signalverzögerung von unter 2 ms („low-delay CELP“) ist Grundlage des ITU-T Audiostandards G.728.