Objektbasiertes Audio

0
992

Objektbasiertes Audio, Seite 2

Die Dolby-Atmos-Software

Surround aus Objekten

In dem bisher recht einfachen Szenario wird zwar die Flexibilität des Verfahrens deutlich, allerdings kann es so noch nicht alle Stärken entfalten. Wirklich interessant wird es, wenn wir das Geschehen auf die komplette Räumlichkeit aufweiten. Unser Sprecher soll sich also einmal kreisförmig um den Hörer herumbewegen. Bei einem gewöhnlichen 7.1-Setup waren hier also (mit Subwoofer) acht Kanäle im Einsatz und mit Daten bestückt, um die Bewegung abzubilden. Denn auch hier mussten die Richtungsinformationen bereits bei der Produktion mit den Audiodaten verrechnet werden, um die gewünschte Räumlichkeit zu erzielen. Das möglichst perfekte Aufstellen des Systems ist ebenso notwendig. Doch eine echter Mehraufwand entsteht nun, wenn bei der Produktion nicht nur Surround-Hörer, sondern auch die Besitzer von Stereo-Setups berücksichtigt werden sollen.
 
Die einfache Variante ist, sich auf den Surround-Mix zu konzentrieren und darauf zu vertrauen, dass der Stereo-Downmix von den Wiedergabegeräten des Benutzers (Blu-ray-Player, AV-Receiver, …) übernommen wird. Hierbei agiert das System jedoch nach starren Vorgaben, die nebenbei nicht standardisiert sind. Qualitativ hochwertiger kann ein Stereo-Mix dagegen von Hand erstellt werden, da der Toningenieur hier alle Ereignisse, die sich eigentlich auf den Surround-Kanälen abspielen, nach bestem Gewissen in den Stereokanälen unterbringen kann und dabei Überladungen und ungünstige Lautstärkeverhältnisse vermieden werden können. Zugegebenermaßen ist ein einzelner Sprecher da unbedenklich, aber in Szenen mit Musik, Dialog und Effekten sieht das schon anders aus. Doch auf der anderen Seite erhöht sich der Arbeitsaufwand, da zwei komplette Mischungen erstellt werden müssen – gerade bei Filmen und Live-Konzerten gerne mit einer Laufzeit von über zwei Stunden.

Bei aufwendigen Produktionen existieren sogar diskrete Mischungen für 2.0, 5.1 und 7.1 – in Zukunft sind auch Varianten wie 9.1 mit Höhenkanälen denkbar. Für unseren Sprecher als Audio-Objekt verändert sich die Situation hingegen kaum. Wieder kommen nur die monaurale Aufnahme und die Metadaten für die kreisförmige Bewegung zum Einsatz. Diesmal arbeitet der Prozessor jedoch nicht mit Objekten auf einer Linie, sondern einer virtuellen Fläche um den Hörer herum. Und wieder errechnet der Surround-Prozessor, welche Signale an die einzelnen Lautsprecher gesendet werden müssen, um die Situation möglichst originalgetreu abzubilden. Dabei bleibt auch die Gesamtzahl der Lautsprecher variabel, denn es werden so viele wie möglich einbezogen.
 
Für den Heimanwender könnte sich so sogar die Unterbringung im Wohnzimmer erleichtern, denn vielleicht lassen sich beispielsweise zehn kleine Lautsprecher gut in Regalen etc. unterbringen, während ein optimal platziertes 7.1-Set räumlich ungünstig ist. Voraussetzung ist natürlich eine genaue Einrichtung des Systems, damit der Prozessor weiß, wo sich welche Lautsprecher befinden und wie sich ihr Klang durch die Position verändert. Für den Toningenieur im Studio hingegen erleichtert sich die Arbeit: Er erstellt lediglich ein Szenario mit den vorgesehenen Bewegungen aller Objekte. Das Erstellen der unterschiedlichen Mixes passiert im Surround-Prozessor bei der Wiedergabe, denn auch mit nur zwei Lautsprechern wird der optimale Klang berechnet. Im Unterschied zur kanaldiskreten Mischung liegen die Tonspuren hier hinsichtlich ihrer Position unbearbeitet vor, die Anpassung von Pegel, Laufzeit und evtl. anderen Effeketten passiert in Echtzeit. Dadurch kann das Ergebnis optimaler wirken als ein automatischer Downmix von 7.1 auf Stereo, ob aber die Qualität eines diskreten Stereomixes erreicht wird, ist fraglich. Ein gerade für komplexe Filminhalte praktischer Fortschritt ist diese Herangehensweise aber allemal.

Alter Wein?

Das Prinzip von Audioobjekten kommt derzeit mit Dolby Atmos vermehrt ins Gespräch und erreicht auch die ersten Kinosäle. Doch die grundlegende Idee des Prinzips ist viel älter und kommt aus der Welt der Videospiele. Mit zunehmender Komplexität des Geschehens auf dem Bildschirm wurde das Verfahren hier nämlich eine Notwendigkeit. Am anschaulichsten wird die Problematik, wenn man sich ein Spiel mit 3D-Grafik als Beispiel nimmt. Der virtuelle Held bewegt sich durch eine Landschaft, in der akustisch einiges passiert. Zunächst wird über die Stereo-Lautsprecher eine Spielmusik ausgegeben. Die Fußschritte des Protagonisten und das Rascheln im Gras übernimmt wahrscheinlich der Center-Lautsprecher. Bis hierhin kann man die Dinge eventuell festlegen. Aber etwa ein Lagerfeuer, ein Fluss oder Wasserfall, das Knarren eines Bootes und Baumes sind Geräusche, die an einem festen Punkt in der Landschaft erzeugt werden. Diese fest zuzuordnen ergibt keinen Sinn, weil nicht vorhergesagt werden kann, welche Bewegungen der Spieler in der Landschaft vollführt. Deshalb haben die meisten modernen Game-Engines bereits eine einfache Implementierung von objektbasiertem Audio, denn die Geräusche in Spielen sind meistens eh an sichtbare Objekte gekoppelt. Die Game-Engine lässt die CPU nun also berechnen, wo sich die Objekte um den Hörer herum befinden und wie diese am sinnvollsten auf dem ausgewählten Lautsprechersetup darzustellen sind.

Neue Schläuche!

Und hier liegt auch der entscheidende Unterschied: Da es sich natürlich um keine reine Audioanwendung handelt, werden hier lediglich Standardsetups, für gewöhnlich bis 7.1, angeboten. Die objektbasierten Daten werden also am Ende nur für die bekannten diskreten Kanäle berechnet. Mit Vorstößen in diesem Bereich, wie eben auch von Dolby mit Atmos, könnte generell mehr Flexibilität in die Multimediawelt einziehen. Denn mit einem hochwertigen Einmessystem kann man sich von den gewohnten Aufstellungsschemata lösen und mehr Freiheit hinsichtlich der Lautsprecherpositionen und -Anzahl geben. Hat sich das oder ein ähnliches Format im Kino etabliert, ist auch der Sprung in das Wohnzimmer greifbarer geworden. Dankbar sind nicht nur die Filmstudios, die sich den Aufwand mehrerer Mischungen sparen können, sondern auch die Entwickler, die Dank des Ausbruchs aus den starren Kanalvorgaben Innovationen freier umsetzen können.
 
Es könnten zum Beispiel schon Mischungen unter Berücksichtigung der Elevation von Objekten erstellt werden, also im dreidimensionalen Raum, sodass auch Höhenkanäle und völlig frei positionierbare Lautsprecher sinnvoll ins Geschehen integriert werden können. Das ist zwar noch Zukunftsmusik, aber zumindest flexiblere Aufstellungsmöglichkeiten würden wohl vom Endanwender gerne wahrgenommen werden. Mit einer größeren Anzahl von Lautsprechern wäre eine beeindruckend räumliche Wiedergabe möglich. Und sind wir mal ehrlich: Das Problem mit Lautsprechern im Wohnraum ist in vielen Fällen eher die Platzierung, nicht nur die reine Anzahl. In dem Sinne dürfen wir gespannt sein, ob dieser Ansatz von Audiomischungen in Zukunft zu einem Umdenken in der Wohnzimmerausstattung führen kann.
(Martin Heller)

Kommentare im Forum