KI-gestützter Videoschnitt für Nachrichtenclips

Dennis Quandt

Hochschule RheinMain

Dennis Quandt ist als wissenschaftlicher Mitarbeiter im BMBF geförderten Forschungsprojekt „KIGVI: Automatische KI-gestützte Generierung von Videoreportagen“ angestellt. Ziel des Projekts ist eine innovative Lösung zur KI-basierten Erstellung von Reportagen, die aus Videosequenzen geeignete Abschnitte extrahiert und zu einem sendefähigen Beitrag komponiert. Zuvor absolvierte Dennis Quandt den Bachelor of Engineering als Duales Studium bei der Deutschen Bahn und an der Hochschule RheinMain. Durch den Master of Science in Robotics and Computation am University College London und der beruflichen Tätigkeit als Entwicklungsingenieur bei der Vitronic GmbH verfügt er über internationale Forschungs- und Berufserfahrung.

Co-Referenten


Philipp Altmeyer
Hochschule RheinMain

Prof. Dr.-Ing. Wolfgang Ruppel
Hochschule RheinMain

Prof. Dr.-Ing. Matthias Narroschke
Hochschule RheinMain

Kurzfassung des Vortrags


Dienstag, 4. Juni 2024
11:20 bis 12:35 Uhr

Saal 1: Themenblock KI im Newsroom

Im schnelllebigen journalistischen Tagesgeschäft müssen Nachrichtensender rasch ansprechende Videoclips produzieren, um im intensiven Wettbewerb zu bestehen. Verschiedene Faktoren, wie die Vielzahl von Nachrichtenquellen und der sich wandelnde Medienkonsum, verstärken die Notwendigkeit, Nachrichtenclips zügig und zuverlässig zu erstellen. Diesem Streben stehen jedoch manuelle und zeitaufwändige Videobearbeitungsverfahren entgegen.

Obwohl bereits Fortschritte in der Automatisierung der Videoproduktion erzielt wurden, erreichen die aktuellen Systeme oft nicht die erforderlichen Effizienz- und Qualitätsstandards professioneller Nachrichtensendungen. Um diese Lücke zu schließen, präsentieren wir ein innovatives Transformer-basiertes System für den automatischen Schnitt von Nachrichtenclips.
Es ermöglicht die Erstellung von Nachrichtenclips aus Quellenmaterial (Roh- und Archivmaterial), die sowohl semantisch kohärent zum Voice-Over-Text als auch stilistisch im Einklang mit professionellen Redaktionsstandards sind. Die Fähigkeit, schnell und effizient qualitativ hochwertige Videos zu produzieren, die sowohl inhaltlich als auch stilistisch den professionellen Standards entsprechen, ist ein bedeutender Fortschritt für die Nachrichtenbranche.

Unser System berücksichtigt dabei stilistische Regeln, wie die Reihenfolge der Einstellungsgrößen und Aufnahmewinkel, und reduziert manuelle Eingriffe, indem es eine Echtzeit-Komposition aus verschiedenen Quellen ermöglicht. Unser Ansatz ermöglicht es, effizient und qualitativ hochwertige Videos automatisiert zu produzieren.

Unsere Studie umfasst einerseits quantitative Auswertungen der generierten Nachrichtenclips und andererseits qualitative Wahrnehmungsstudien mit Zielgruppen unterschiedlichen Erfahrungsstandes.  Die Nutzerstudien wurden durchgeführt, um die Effizienz und Qualität der mit unserem System erstellten Nachrichtenclips zu validieren. Die Teilnehmerinnen und Teilnehmer, darunter erfahrene Redakteurinnen und Redakteure, sahen sich die Videos in zufälliger Reihenfolge an und beantworteten Fragen auf einer 6-Punkt-Likert-Skala. Die Fragen zielten darauf ab zu erfahren, ob (1) das Video den gesamten Inhalt des Voiceovers angemessen wiedergibt, (2) die Auswahl der Szenen angemessen ist und alle wichtigen Informationen abdeckt und (3) das Video als professionell bearbeitet wahrgenommen wird.

Die Ergebnisse unserer Studien belegen die Effektivität unseres Systems. Mit diesem Transformer-basiertem System bieten wir eine Lösung zur automatisierten Bearbeitung von Nachrichtenclips und kann Journalistinnen und Journalisten in ihrem Tagesgeschäft unterstützen.

Die Arbeiten werden im Rahmen des BMBF-Projektes KIGVI (Automatische KI-gestützte Generierung von Videoreportagen) gemeinsam mit dem Projektpartner Qvest GmbH durchgeführt.