Unhörbare Musik

0
101

Der Weg zum MP3-Format

Musik steckt voller Signale, die wir gar nicht wahrnehmen, und genau diesen Umstand macht sich das MP3-Format bei der Datenreduktion zunutze. Wir zeigen Ihnen die Tricks der Ingenieure und ab welcher Bitrate MP3 vom Original nicht zu unterscheiden ist.

In den 1970er Jahren keimte die Idee auf, Musik in hoher Qualität übereine Telefonleitung zu übertragen. Akustische Signale konnten und könnenaufgrund der geringen Bandbreite von ISDN jedoch nur mit einem sehrbeschnittenen Frequenzspektrum übertragen werden. Der sogenannteHauptsprachbereich umfasst Frequenzen von 250 Hertz bis fünf Kilohertzund garantiert eine optimale Sprachverständlichkeit, ist vonHi-Fi-Qualität aber weit entfernt. Eine Erweiterung desFrequenzbereiches vergrößert den Datenstrom, eine Komprimierung derSignale ist also notwendig.
 
Damit war der Grundstein für das MP3-Formatgelegt. Die Erfolgsgeschichte begann bereits 1987 an der UniversitätErlangen-Nürnberg, seinen charakteristischen Namen erlangte der Standardindes 1995. Die Forscher berücksichtigten in ihrem Ansatz dieGrundlagen der Datenkompression und untersuchten Musik in Bezug aufredundante und irrelevante Anteile. Wenn etwas kleiner werden soll, mussschließlich etwas entfernt werden – in diesem Fall natürlich ohneQualitätsverlust. Das MP3-Format erfüllt dieses Versprechen und setztdabei auf die Eigenschaften des menschlichen Gehörs.

Ohrenbetrug

Musik steckt voller Töne, die wir gar nicht hören. Das liegt daran, dass die Wahrnehmung von Frequenzen in unserem Innenohr über Wanderwellen erfolgt und je nach Frequenz fallen diese kürzer respektive länger aus. Zudem verlangen tiefere Töne zur Wahrnehmung einen kräftigeren Schalldruck als hohe. Diese Vorgänge benötigen natürlich Zeit und es kommt zu Verdeckungseffekten (Maskierung), die einen Grundpfeiler bei der Datenreduktion des MP3-Formats bilden. Dabei werden Töne von anderen überlagert und sind somit irrelevant. Beispielsweise verdeckt ein lauter, dominanter Trompeteneinsatz ein filigranes Flötenspiel. Dessen Töne sind selbstverständlich noch vorhanden, werden aber aufgrund der Beschaffenheit unserer Ohren nicht mehr wahrgenommen. In der Praxis offenbaren sich Simultan-, Nach- und Vorverdeckung. Letzteres klingt nach einem Paradoxon, ist allerdings durchaus real und der Signalverarbeitung in unserem Gehirn zuzuschreiben.
 
Das MP3-Codierungsverfahren bildet also gut hörbare Teile der Musik sehr genau ab, andere Teile wiederum weniger genau und unhörbare Informationen werden schlicht ignoriert. Diese flexible Darstellung spart Bandbreite und fügt gleichzeitig eine Abweichung in Form eines Rauschens in das Musiksignal ein; im Idealfall wird dieses aber maskiert und ist nicht hörbar. Das ist abhängig von der Bitrate, denn ist diese zu niedrig gewählt, wird das Codiergeräusch wahrnehmbar.
 

Ein weiterer Grundpfeiler für die Codierung ist die Erkenntnis, dass wir in Frequenzbändern hören. In Abhängigkeit von den in der Gruppe enthaltenen Tönen wird die Zahl der Quantisierungsstufen dynamisch gewählt. Je höher ein Ton wird, desto breiter wird die Gruppe. Das ist auch der Grund für die höher empfundene Lautstärke bei hohen Tönen; außerdem werden mehr Bits für die Quantisierung benötigt. Im Gegenzug fallen nur wenig Bits an, wenn ein Ton einen großen Teil des Frequenzspektrums verdeckt und so das Quantisierungsrauschen maskiert. Die jeweils erforderliche Zahl von Quantisierungsstufen und damit der zulässige Grenzstörabstand lassen sich für jedes Teilband eindeutig berechnen. Für eine noch effizientere Codierung können zudem Teilbänder ohne Nutzsignal unterdrückt werden.

Hörtest

Die Codierung ist also ein Zusammenspiel der quantisierten Frequenzbänder, Verdeckungseffekte und der gewählten Bitrate. Am effizientesten arbeitet hier der variable Ansatz, bei dem die Datenrate flexibel angepasst wird. Natürlich spielt daneben die Musikart eine große Rolle, so lässt sich etwa ein Popsong effizienter codieren als ein filigranes Jazzensemble.
 
Die Datenrate eines unkomprimierten Musikstücks auf einer Audio-CD beträgt rund 1,4 Megabit pro Sekunde, während das MP3-Format CD-Qualität bei einer Datenrate von lediglich 128 Kilobit pro Sekunde (kBit/s) verspricht. Aber selbst ungeschulte Hörer können hier das Quantisierungsrauschen wahrnehmen, insbesondere bei hohen Tönen. Bei noch niedrigeren Datenraten klingt die Musik zunehmend dumpfer und blecherner. Die Datenrate sollte 192 kBit/s nicht unterschreiten. Die Wahrnehmung ist allerdings auch stark von der Qualität der Wiedergabekette abhängig und auf professionellem Studio-equipment wird die verlustbehaftete Codierung schneller enttarnt. Im handelsüblichen MP3-Player macht das Format jedoch eine hervorragende Figur.

(Dennis Schirrmacher)

Kommentare im Forum