Von mp3 zu PARty: Wie digitale Signalverarbeitung, Psychoakustik und maschinelles Lernen zusammenfinden

Karlheinz Brandenburg


Karlheinz Brandenburg wurde bekannt durch seine wesentliche Mitarbeit bei der Erfindung, Standardisierung und Vermarktung des mp3-Audiocodierstandards. Der gebürtige Erlanger studierte und promovierte am Lehrstuhl für Technische Elektronik der FAU Erlangen-Nürnberg.

Er war Abteilungsleiter für Audio- und Multimediatechnologien am Erlanger Fraunhofer-Institut für Integrierte Schaltungen, bevor er im Jahr 2000 nach Ilmenau wechselte. Dort baute er das Fraunhofer-Institut für Digitale Medientechnologien (FhG-IDMT) auf und forschte und lehrte als Professor für elektronische Medientechnik an der TU Ilmenau. Seit Erreichen der Altersgrenze und dem Ausscheiden aus dem IDMT ist er weiter an der TU Ilmenau als Senior Professor aktiv in Forschung und Lehre. Sein neue Hauptaufgabe ist jedoch der Aufbau seiner eigenen Firma, der Brandenburg Labs GmbH, welche sich mit innovativen immersiven Audiotechnologien (über Kopfhörer) beschäftigt.

 

Kurzfassung des Vortrags No. 40


"Der Wunsch, Musik in Hi-Fi-Qualität zu übertragen, läutete das Zeitalter der praktischen Anwendung des Forschungsgebiets Psychoakustik ein. Hörtests wurden das Maß aller Dinge. Auf dieser Basis entstanden erste Audiocodierverfahren. Auch heute noch werden mp3, AAC und auf denselben Ideen aufbauende Verfahren weit verbreitet eingesetzt.

Fast alle Nutzer*innen sind mit der so erreichbaren Tonqualität einverstanden. Fast Forward: Nach Jahrzehnten der Forschung wurde immer klarer, dass mit einfacher Optimierung entlang der physikalischen Vorgänge im Ohr die Tonwiedergabe noch nicht vollkommen gelingt. Der Wunsch nach perfekter Illusion und insbesondere guter räumlicher Klangwiedergabe führte dahin, dass der Prozess des Hörens umfassender verstanden werden musste: Die Vorgänge im Gehirn, insbesondere Kognition, sind in ihrer Bedeutung lange unterschätzt worden. Ein wesentliches Forschungsfeld ist heute die Frage, wie über Kopfhörer eine naturgetreue Wiedergabe, aber auch eine Manipulation unserer akustischen Umwelt ermöglicht werden kann. Im Team in Ilmenau wurde dafür das Akronym „PARty“ entwickelt, in Langform: „Personalized Auditory Reality“. Dazu braucht es nicht nur ein verbessertes binaurales Rendering und Informationen über die Akustik des Wiedergaberaums, sondern an verschiedenen Stellen die Hilfe von Verfahren des maschinellen Lernens. Schließlich ist unser Gehirn für Tonereignisse „ein perfekter pattern matcher“, dem wollen wir nacheifern."