Ein Bild sagt mehr als 1000 Tags (KI im Medienmanagement)

Referenten


  • Eddi Weinwurm
  • Obviusfuture GmbH

Über den Vortrag


Statistiken zeigen, dass Videoeditoren nur einen geringen Teil ihrer Arbeitszeit mit dem Schneiden, dem Editieren von Videos selbst verbringen, sondern dass die meiste Zeit mit der Suche nach dem richtigen Clip für den nächsten Schnitt verschwendet wird. Sei es schnelles Vorspulen durch Clips, das Durchsuchen von Dateien, Suchen im Speicher oder in Archiven. Videoeditoren sind also eigentlich eher „Suchende“ als Cutter.

KI verspricht seit Jahren eine Lösung für dieses Problem, ist aber bisher schmerzlich gescheitert. Das einzige, das KI bis jetzt konnte, war Objekte zu taggen. Aber die Suche nach einem „Haus“, einem „Baum“ oder einem „Auto“ im Material hat in der Postproduktion kaum oder gar keinen praktischen Nutzen. Denn ein Bild sagt mehr als tausend Worte und nicht nur 5 Tags - und all diese Information geht beim Taggen verloren.

Doch große Sprachmodelle in Kombination mit modernen visuellen Modellen sind nun endlich in der Lage, die wahre, mehrdimensionale Bedeutung von audiovisuellen Material zu erfassen. Sei es die Beziehung von Objekten zueinander, die Handlungen, die wir sehen, Emotionen oder auch der Ausdruck von Filmmaterial.

Revolutionärer Ansatz


Und diese Technologie ermöglicht es uns nun, Filmmaterial zu suchen, indem wir einfach beschreiben, wonach wir suchen - genau so wie wir einen Assistenten fragen würden. Doch während Menschen für die Suche viel Zeit benötigen, kann die KI die Ergebnisse nahezu augenblicklich bereitstellen und anzeigen. Gleiches gilt für die Suche in Audio, beispielsweise in Interviews, es ist nicht mehr erforderlich, den genauen Wortlaut zu kennen, wie dies bei der Suche in Transkriptionen der Fall ist, sondern die KI ermöglicht die Suche nach Bedeutung, auch kein einziges Wort mit der Suchanfrage ident ist.

ObviousFuture präsentiert diesen revolutionären neuen Ansatz für KI im Medienmanagement, der es Videoeditoren endlich ermöglicht, sich auf das zu konzentrieren, was ihre Berufsbezeichnung aussagt: Das Editieren, Schneiden von Videos.