Optimierung der Sprachqualität durch KI | FKTG - Fernseh- und Kinotechnische Gesellschaft

Fabian Seipel

ai|coustics

Fabian Seipel ist Spezialist für Audio-Machine-Learning, Co-Founder des Berliner Startups ai|coustics und Dozent für „Deep Learning for Audio Data“ am Fachgebiet Audiokommu- nikation und -technologie der Technischen Universität Berlin.

Kurzfassung des Vortrags

Dienstag, 4. Juni 2024
16:10 bis 17:50 Uhr

Saal 2: Themenblock Audio

Die Sprachqualität und -verständlichkeit ist trotz neuen Technologien und Codecs in vielen Fällen und Anwendungen unseres täglichen Lebens oft noch unzureichend, etwa bei Online-Meetings (der Kollege mit altem Headset), Radio/Podcasts (die Zuschaltung von Interviewgästen) oder auch bei der Kommunikation in schwierigen oder kritischen Situationen (im Auto, Einsatzfahrzeug oder Flugzeug). Schwierig ist die Aufzeichnung von hochqualitativen Sprachaufnehmen vor allem für Menschen, die kein optimales Audioequipment verwenden können, z.B. hochwertige Mikrofone und ein Aufnahmestudio, oder die Tonaufzeichnungen in suboptimalen Situationen produzieren müssen, z.B. mit Hintergrundgeräuschen in einer Außenaufnahme oder im Fußballstadion.

Dieses Problem hat sich das Berliner Startup ai|coustics zur Aufgabe gemacht und entwickelt dafür Sprachverbesserungsmodelle auf Basis von Künstlicher Intelligenz. Mit Hilfe eines eintrainierten Verständnis von Sprachqualität auf Basis von großen Datenmengen können KI-Sprachverbesserungsmodelle Artefakte im Audiosignal beheben, die mit klassischen Signalverarbeitungsmethoden bisher nicht zu bearbeiten sind. Dazu gehören beispielsweise Hintergrundgeräusche, Datenkompressionsartefakte, Bandbegrenzungen, Hall und Raumresonanzen sowie Übersteuern und Clipping. Die KI-Sprachverbesserungsmodelle können in Echtzeit eingesetzt und in vielerlei Software- und Hardwareanwendungen integriert werden. Die Möglichkeiten dieser Technologie haben das Potential, die Sprachsignalverarbeitung zu revolutionieren und den Weg zu neuartigen und vorher undenkbaren Anwendungen zu ebnen.

Eine ausführlichere Erklärung finden Sie in einem Online-Artikel der Mai-Ausgabe des FKT-Magazins:
https://www.fkt-online.de/fachartikel/artikeldetail/was-ki-mit-cocktail-partys-zu-tun-hat

Auf der Webpräsenz von ai|coustics sind dazu einige Audiobeispiele zu finden:
https://ai-coustics.com

PDF anzeigen