Audiometadaten in der MPEG-4-HE-AAC-Codierung

Multichannel audio is increasingly being used in broadcast radio programmes but its playback on a conventional two-channel stereo unit raises several issues. Preserving the intended sound content requiresmore than a fixed-parameter downmix process. Recently-developed algorithms have been proposed for this but the classic approach is the transmission of audio metadata to control the downmix. Audio metadata is also used for controlling dialogue level and dynamic range. This article describes the implementation of such metadata in the MPEG-4 HE-AAC codec which is increasingly used in broadcasting.

W. Fiesel; S. Schreiner: Im Trend liegt die Ausstrahlung von Rundfunksendungen im Mehrkanalton. Dessen Wiedergabe auf herkömmlichen Zweikanalstereogeräten wirft jedoch diverse Probleme auf. Die Erhaltung des intendierten Toninhalts bedarf dabei mehr als eines Downmix-Vorgangs mit festen Mischparametern. Während neuerdings intelligente Algorithmen dafür vorgeschlagen werden, ist der klassische Ansatz die Übertragung von Audiometadaten zur Steuerung des Downmixes. Audiometadaten finden darüber hinaus auch Anwendung zur Kontrolle des Dialoglevels und des Dynamikumfangs. Der Artikel beschreibt die Verwendung derartiger Metadaten im HE-AACCodec von MPEG-4, der in immer mehr Rundfunksystemen eingesetzt wird.

Zum Artikel >>