Ein qualitätsbasiertes Bitrate Ladder‐Entwurfsverfahren für Over‐the‐Top‐Video‐Streaming‐Dienste

Andreas Kah


Sein Bachelorstudium an der Hochschule RheinMain im Studiengang Medientechnik, schloss Andreas Kah 2016 mit einer Abschlussarbeit am Fraunhofer-Institut für Digitale Medientechnologie (IDMT) ab. Den daran anschließenden Masterstudiengang Media & Communications Technology an der Hochschule RheinMain, beendete er erfolgreich Mitte 2018 mit einer Masterarbeit zum Thema Videocodierung. Derzeit ist er als wissenschaftlicher Mitarbeiter im BMBF geförderten Forschungsprojekt VidUX angestellt, welches sich zum Ziel gesetzt hat die User Experience beim Video-Streaming zu verbessern. Er fokussiert sich dabei auf die Entwicklung von Algorithmen im Zusammenhang mit adaptivem Video-Streaming.  

Kurzfassung des Vortrags No. 68


Over-the-Top (OTT)-Videostreaming-Dienste gewinnen fortlaufend an Bedeutung. Dabei werden Videoinhalte mit verschiedenen Datenraten und zugehörigen Qualitäten codiert auf Servern abgelegt und über das Internet an Endnutzergeräte ausgeliefert. Codierte Videoinhalte mit einer bestimmten Datenrate und Qualität werden als Rendition bezeichnet, die Gesamtheit aller Renditions als Bitrate Ladder. Basierend auf der Bitrate Ladder wählt jedes Endnutzergerät die Rendition aus, die an die Kanalkapazität der individuellen Internetanbindung angepasst ist. In der Vergangenheit wurden Renditions mit vordefinierten Datenraten für alle Inhalte verwendet, unabhängig von der Videoqualität, die jedoch signifikant vom Videoinhalt abhängt.
Heutzutage wird dieser Ansatz zunehmend durch Bitrate Ladder Entwurfsverfahren ersetzt, welche auch die Videoqualität berücksichtigen. Diese werden als Per-Title-, Per-Scene- oder Shot-based-Verfahren bezeichnet. Dabei nehmen Per-Title-Verfahren eine Optimierung der Bitrate Ladder für ganze Videosequenzen vor. Per-Scene- oder Shot-based-Verfahren zerlegen Videosequenzen in Abschnitte und optimieren die Bitrate Ladder für jeden Abschnitt.
Alle diese Verfahren müssen mit einem Bitrate Ladder-Entwurfsverfahren eine Auswahl hinsichtlich der angebotenen Qualitäten und Datenraten treffen.
In dieser Arbeit wird ein Entwurfsverfahren vorgeschlagen, welches als Kriterium die von den Endnutzer*innen subjektiv wahrgenommene Videoqualität maximiert und gleichzeitig die Datenrate minimiert. Zur Automatisierung des Entwurfs wird die Videoqualität mittels Video Multi-Method Assessment Fusion (VMAF) bewertet. Dabei umfasst die VMAF-Skala Werte von 0 bis 100, wobei höhere Werte einer höheren Videoqualität entsprechen. Der vorgeschlagene Entwurf orientiert sich an drei Parametern, die in umfangreichen subjektiven Tests auf Basis der internationalen Recommendation ITU-R BT.500 und einer 4K TV-Testumgebung ermittelt wurden.
Der erste Parameter ist der niedrigste VMAF-Wert 95, bei dem endnutzerseitig decodierte Videosignale im Durchschnitt subjektiv nicht vom ursprünglichen Videosignal zu unterscheiden sind. Der zweite Parameter ist der niedrigste VMAF-Wert, der mit einer Rendition der Bitrate Ladder angeboten wird. Zur anwendungsorientierten Einstellung dieses Parameters wurde die Nutzerakzeptanz-Rate in Abhängigkeit vom VMAF-Wert für kostenlose und gebührenpflichtige OTT-Dienste gemessen. Der dritte Parameter ist die maximale Differenz zwischen zwei VMAF-Werten, bei denen die zugehörige subjektive Qualität im Durchschnitt nicht zu unterscheiden ist. Für diese Differenz wurde der Wert 2 ermittelt.
Eine entsprechend dieses Entwurfes ideale Bitrate Ladder mit 13 Renditions weist folgende VMAF-Werte auf: 95, 93, ..., 73, 71. Der hierbei niedrigste VMAF-Wert von 71 korrespondiert mit einer Nutzerakzeptanz-Rate von etwa 80 % für kostenlose und von etwa 50 % für gebührenpflichtige OTT-Dienste.