MPEG entschlüsselt, Teil 3
Interaktive Elemente in digitalen Videoströmen
Das erste Bild des Theaterstückes ist unser Ausgangsbild, das komplett übertragen wird. Dieses Bild wird als „Intra-Frame“ (I-Frame) bezeichnet. Dieser I-Frame ist damit unsere Bühne, die unverändert erhalten bleibt. Nun beginnen sich die Akteure vor dem Bühnen- bild zu bewegen. Die Kompression ermittelt den Endpunkt des Schauspielers, den so genannten „Predictive-Frame“ (P-Frame). Dieser enthält alle Veränderungen, im Vergleich zum I-Frame. Im Theaterbeispiel symbolisiert der P-Frame nicht nur unsere Darsteller, die sich auf der Bühne bewegen, sondern schließt auch alle Bereiche ein, die der Darsteller zuvor verdeckte und die nun wieder sichtbar sind.
Legt man den P-Frame über den I-Frame, erhält man das vollständige Bild. Zwischen den einzelnen P-Frames werden die übrigen Einzelbilder nur noch als „Bidirectional Frame“ (B-Frame) abgebildet. Diese enthalten keine eigentlichen Bilddaten, sondern Bewegungsvektoren, die die Veränderungen zwischen den P-Frames beschreiben. Unser sich bewegender Darsteller muss also nicht ständig neu abgespeichert werden, sondern es wird einzig seine Richtung bis zum Endpunkt erfasst.
I-, P- und B-Frame bilden die so genannten Bildgruppen (GoP = Group of Pictures). Durch diesen Prozess wird die Datenmenge massiv gekürzt. Statt 24 Filmbilder pro Sekunde einzeln komplett abzuspeichern, wird die Theaterbühne einmalig abgelegt. Die laufenden Akteure werden in Anfangs- und Endpunkt kategorisiert und am Ende wird dieser Ortswechsel als ein Pfad gespeichert. MPEG-4 verfügt über eine ganze Palette weiterer Neuerungen.
Ursprünglicher Grund zur Definition dieses neuen Formats war die Einführung interaktiver Elemente in digitalen Videoströmen. So lassen sich MPEG-4- Computeranimationen und vom Hintergrundbild unabhängige Einblendungen viel einfacher realisieren. Es können dabei mehrere Bilder überlagert werden. Ein Moderator vor einer Wetterkarte ist ebenso möglich, wie die Einblendung einer weiteren Perspektive bei einer Sportübertragung.
Aber viel wichtiger als die Multimedia-Funktionen ist die Einführung eines neuen Kompressionsalgorithmus für die I- und P-Frames. Mit der Wavlet-Kompression lassen sich Bilder bis zu viermal effizienter als mit dem bisher verwendeten JPEG-Verfahren komprimieren. Auch viele andere Firmen und Forschungseinrichtungen haben weltweit entscheidend zum Erfolg von MPEG-4 beigetragen, etwa die Fraunhofer Gesellschaft oder das Heinrich- Hertz-Institut. Mit dem VC-1-Format hat sich auch der Branchenriese Microsoft dem MPEG-4 Standard angeschlossen.
Farbverlust
Eine weitere Form der Datenspeicherung betrifft die Farbcodierung. Ein Videobild ist aus den Farben Rot, Grün und Blau aufgebaut (RGB-Signal). Die MPEG-Verschlüsselung kann allerdings mit dem kaum reduzierten YUV-Verfahren arbeiten. Das Y-Signal gibt dabei die Helligkeitsinformationen weiter. Die U- und V-Signale kümmern sich um die Einfärbung des Bildes. YUV 4:4:4 beinhaltet die volle Farbinformation, d. h. jeder Helligkeitspunkt (Y-Signal) wird komplett eingefärbt (U- und V-Signal). Bei YUV 4:2:2 erhält nur jeder zweite horizontale Bildpunkt die Farbinformationen, die anderen sind schwarzweiß. Die Elektronik muss nun den Farbverlust ausgleichen – der Vorgang nennt sich „Chroma Upsampling“, also Farbabtastung und Hochrechnung. Mit dem YUV-Format 4:2:0 wird weiterer Speicherplatz eingespart, da hier sowohl horizontal als auch vertikal jeder zweite Bildpunkt schwarzweiß bleibt. Bereits bei der DVD wird YUV 4:2:0 zur Farbdarstellung genutzt. Unserem Auge ist es zu verdanken, dass wir fast keinen Unterschied zwischen einem RGB- und YUV-Bild sehen, denn empfindlich sind wir vor allem bei Helligkeitsunterschieden, aber nicht bei farblichen Differenzierungen.