AI-Driven Video Search: A New Era in Content Discovery

Dr. Vladyslav Danilov

nachtblau GmbH

Dr. Vladyslav Danilov is a researcher with over 3 years of experience leading and managing Machine Learning and Deep Learning projects. With 8 years of experience in data analysis, he holds a background in Quantum Physics (Dr. rer. nat) and specializes in AI research project management, emphasizing scientific approaches and efficient problem-solving. Currently, he is engaged in research at Nachtblau GmbH, focusing on autonomous image and video processing. His work includes exploring transformer-based gated models as well as generative models for audio generation, encompassing various emotions and styles.

Co-Referenten


M.Sc. Philipp Broze
nachtblau GmbH

Philipp Broze is a software developer at Nachtblau GmbH with over 7 years of experience in software development. With a diverse background in hardware and software development, he
thrives on leveraging cutting-edge technologies, including virtual reality, 3D printing and AI.

He currently directs his expertise towards crafting and delivering scalable infrastructure and user interfaces for AI services and media asset
management.

As such he understands how AI services offer new possibilities and insights to how users interact with media but also the requirements and need for a heterogeneous and distributed IT infrastructure.

Philip Broze

Kurzfassung des Vortrags


Dienstag, 4. Juni 2024
14:00 bis 15:40 Uhr

Saal 1: Themenblock KI

Im Bereich der Deep Neural Networks (DNN) verbessert sich nicht nur die Effizienz bestehender Methoden, sondern es nimmt auch die Anzahl vielfältiger, wissenschaftlicher Datenbanken zu. Dazu ermöglichen moderne Systeme sowohl die Erkennung und Beschreibung von Bildern, als auch die Echtzeitverarbeitung von Videodatenströmen.

In diesem Vortrag präsentieren wir Erfahrungen und Lösungsansätze für die KI gestützte Arbeit mit journalistischem Videomaterial, basierend auf den Ergebnissen eines zu diesem Zwecke durchgeführten Forschungsprojektes. Der Schwerpunkt liegt dabei auf der Verarbeitung und Erkennung von Videoinhalten sowie der Suche nach Videos anhand textueller Beschreibungen. In der Welt der DNN wird eine solche Aufgabe als "Video Retrieval" bezeichnet.

Eine bemerkenswerte Eigenschaft ist die Spezifität journalistischer Video- und Textmaterialien. Journalismus als Beruf mit seinem einzigartigen Kommunikationsstil, ethischen Normen, Standards und Veröffentlichungsanforderungen verleiht der Aufgabe des "Video Retrieval" Komplexität und Einschränkungen. Die Präsenz abstrakter journalistischer Themen (Politik, Wirtschaft, Rechtswissenschaft usw.) stellt zusätzliche Herausforderungen für die Erreichung der festgelegten Aufgabe dar.