Christian Simon

Vita Christian Simon

Dipl.-Tonmeister Christian Simon ist seit 2016 am Fraunhofer IIS als Experte für AV-Produktion und Barrierefreiheit tätig. Sein aktueller Fokus liegt auf objektbasiertem Audio und automatisierten Workflows für Broadcast- und Streaming-Anwendungen. Christian entwickelt Projekte wie MPEG-H Dialog+ und NGA Musikproduktionen mit deutschen und internationalen Rundfunkanstalten und steht in engem Kontakt mit Industriepartnern, um Fraunhofer IIS Technologie auf den Markt zu bringen.

Mi., 28.09.2022 - 08:27

Kurzfassung des Vortrags No. 41


Zuschauerbeschwerden zum Thema Sprachverständlichkeit sind ein wohlbekanntes und andauerndes Thema bei deutschen und internationalen Fernsehsendern. Objektbasiertes Audio kann dieses Problem zukünftig mit seinen weitreichenden Möglichkeiten der Interaktivität und Personalisierung lösen. Solange die Umstellung auf derartige Produktions- und Distributionssysteme jedoch noch nicht vollzogen ist, werden Lösungen benötig, die auf die bestehenden, kanalbasierten Workflows abgestimmt sind.

Daher drängen derzeit verschiedene Deep-Learning-basierte Lösungen auf den Markt, die aus der finalen stereo Audiomischung ein Dialogue Enhancement Tonspur ohne Personalisierung erzeugen. Diese Workflows sind zum großen Teil automatisiert und bieten Möglichkeiten für die lineare oder offline-Bearbeitung.

Dieser Vortrag beschreibt den vorläufigen ""Klare Sprache"" Workflow für das On Demand Angebot des WDR in der ARD Mediathek. Er wurde gemeinsam vom Fraunhofer Institut für Integrierte Schaltungen (IIS) und dem Westdeutschen Rundfunk entwickelt, getestet und zur Anwendung gebracht. Es werden die Abläufe von der Redaktion bis zur Transcoding-Plattform, sowie die technischen Hintergründe der DNN-basierten Dialogseparation beschrieben. Abschließend folgt ein Ausblick auf die Optimierung des beschriebenen Deep Learning Systems und auf Möglichkeiten der Weiterentwicklung des Workflows.


Mehr Informationen

https://mpegh.com/produce/#dialog