IEC 62574:音频、视频和多媒体——多声道音频的声道分配

多声道音频系统的标准化声道编号和标签框架

IEC 62574由IEC第100技术委员会于2011年发布,建立了音频、视频和多媒体系统中多声道音频的标准化声道分配框架。随着消费音频从单声道到立体声再到沉浸式环绕声格式的演进,以及HDMI、DisplayPort和AES3等数字接口成为传输多声道音频的主流方式,建立一致的声道标签和映射标准对于确保来自不同地区和细分市场的内容创作者、分发平台和播放设备制造商之间的互操作性变得至关重要。

该标准解决了多声道音频中的一个基本挑战:若没有标准化的声道分配,来自一个制造商编码器的”左环绕”信号可能被路由到另一个制造商解码器的”右环绕”扬声器,或者”中置”声道可能被误解为”低频效果”声道。IEC 62574通过定义一个明确的声道编号方案(声道1至声道16及更高)及相应的标签和位置来解决这个问题,创建了可跨所有音频设备一致实现的通用映射。该标准被HDMI Licensing Administrator规范、ATSC标准和DVB项目规范引用,成为现代音频生态系统的基础元素。

IEC 62574定义了最多16个主音频声道加低频增强声道的声道分配,覆盖从单声道、立体声、5.1环绕声到7.1、9.1和沉浸式22.2系统的配置。该标准还支持基于对象的音频元数据,其中单个音频对象被分配到渲染位置而非固定的扬声器声道。

声道分配框架

IEC 62574的核心是声道编号和标签方案。每个音频声道被分配一个唯一的编号和一个相应的标签,指示其相对于听者的预期空间位置。声道1-16覆盖水平扬声器平面,前两个声道始终为左和右(与立体声约定保持一致以实现向后兼容性)。该标准建立了三个主要声道配置系列:”SB”系列使用侧和后环绕声道,典型应用于影院和广播;”SD”系列使用侧和直接环绕声道;”SS”系列使用早期多声道格式中的侧和环绕声道。这种多系列方法认识到不同应用领域已演变出不同的扬声器布局惯例,IEC 62574提供了它们之间的统一映射。

声道编号遵循一致的逻辑:编号较小的声道对应更关键或更常用的位置。声道1-2始终为左和右。声道3为中置。声道4为LFE。声道5-6为左环绕和右环绕。较高编号的声道被分配给后环绕位置、顶部扬声器的高度声道和扩展前方声场的宽声道。标准还为基于对象的音频保留了声道编号分配,其中声道15-16可携带由播放系统基于相关元数据而非映射到固定扬声器位置的音频对象。

IEC 62574标准声道分配(常见配置)
声道编号 标签(SB系列) 标签(SD系列) 扬声器位置
1 左(L) 左(L) 前方左侧
2 右(R) 右(R) 前方右侧
3 中置(C) 中置(C) 前方中央
4 LFE LFE 超低音音箱
5 左环绕(Ls) 左侧(Lsd) 左侧/环绕
6 右环绕(Rs) 右侧(Rsd) 右侧/环绕
7 左后(Lb) 左直接(Ld) 左后方
8 右后(Rb) 右直接(Rd) 右后方
9 左宽(Lw) 左宽(Lw) 前方左宽
10 右宽(Rw) 右宽(Rw) 前方右宽
11 左高度(Lh) 左高度(Lh) 前方左顶
12 右高度(Rh) 右高度(Rh) 前方右顶
互操作性问题的常见来源是内容创建和播放设备之间使用不同的声道系列约定。IEC 62574要求设备在其元数据中明确声明其声道系列配置,现代HDMI和AES3实现分别将此类信息包含在Audio InfoFrame或声道状态数据中。工程师应验证音频链路的两端配置为相同的声道系列,以确保正确的播放。

数字接口声道映射

IEC 62574规定了声道分配框架在各种数字音频接口上的实现方式。对于HDMI,标准将其声道编号直接映射到CEA-861定义的HDMI Audio InfoFrame扬声器映射位。对于专业AES3接口,每个声道对携带两个音频声道,声道状态字节包含关于多声道模式和声道分配的信息。标准还规定了MPEG传输流、IP音频流以及其他数字音频接口的声道映射方法。对于基于IP的音频流生态系统的增长,标准提供了将声道映射到ADM(在BWF格式中使用)的指导,实现了跨文件和流媒体工作流的一致声道标识。

标准涵盖的另一个重要方面是不同声道配置之间兼容性的下混和上混规则。当5.1内容必须在立体声系统上播放时,IEC 62574定义了参考下混系数,确保无论播放系统配置如何都能保持一致的空间呈现。标准定义了ITU-R BS.775下混方程:L下混 = L + 0.707×C + 0.707×Ls,R下混 = R + 0.707×C + 0.707×Rs。这些标准化系数确保了内容创作者的艺术意图在不同播放环境中尽可能忠实地得以保留。

对于开发多声道音频产品的工程师来说,最重要的实际步骤是确保声道分配元数据在音频链的每个阶段都正确填充。常见故障模式是声道映射在内容创建工具中正确,但在编码或传输过程中因元数据剥离或格式转换而丢失。实施使用已知测试信号的端到端测试以验证声道到达正确的扬声器位置,这对于具有高度声道的沉浸式音频格式尤其关键,因为在正常内容播放期间可能不会立即发现路由错误。

多声道音频系统工程设计要点

从工程角度来看,IEC 62574为构建可互操作的多声道音频系统提供了基础层。实施者应特别关注以下设计考量。首先,元数据处理至关重要。声道分配信息必须在整个信号链中保持,包括编码、传输、解码、数字信号处理和数模转换。其次,标准通过可用户定义的声道标签支持标准配置之外的应用扩展。系统设计者应提供允许非标准配置的声道重新映射和标签的用户界面,特别是在需要灵活声道路由的专业广播和后期制作环境中。

第三,音频声道之间的同步对于空间精度至关重要。IEC 62574假设多声道配置中的所有声道都是采样精确同步的,声道间的时间对准必须在主流采样率的一个音频采样周期内。对于48 kHz系统,这对应于约20.8微秒的最大声道间延迟。超过此阈值的延迟会导致空间图像的感知偏移,特别是对于在声场中移动的瞬态声音。此外,标准建议在混音和母版制作阶段,应监测声道间的相位关系,确保环绕声场的连贯性和一致性。

在广播和流媒体应用中,IEC 62574的声道分配方案与元数据系统的集成尤为关键。DVB和ATSC广播系统在节目特定信息中携带声道配置描述符,消费级AV接收机利用这些信息自动配置扬声器布局。随着HDMI 2.1的普及,增强的音频回传通道和可变刷新率功能为多声道音频传输提供了更大的带宽和灵活性。工程师在系统设计过程中应确保声道映射逻辑能够正确处理各种输入源格式,包括传统的S/PDIF立体声、HDMI多声道PCM、压缩的Dolby Digital比特流以及沉浸式音频对象。设计良好的声道管理系统应能够在不同格式之间自动切换,同时保持正确的声道分配和空间定位。

按声道数推荐的音频接口配置
声道数 典型配置 推荐接口 元数据格式 常见应用
2 立体声(2.0) HDMI、AES3、S/PDIF 不需要 音乐、电视立体声广播
6 5.1环绕声 HDMI、AES3 HDMI Audio InfoFrame DVD、蓝光、流媒体
8 7.1环绕声 HDMI、AES3、MADI HDMI Audio InfoFrame 蓝光、影院、家庭影院
10 5.1.4 HDMI 2.0+、MADI HDMI厂商特定InfoFrame Dolby Atmos、DTS:X
16 9.1.6或7.1.8 HDMI 2.1+、MADI 扩展元数据(ADM) 沉浸式音频、影院混音
24 22.2 MADI、Dante、AVB ITU-R BS.2127(ADM) 超高清电视广播
问1:IEC 62574与ITU-R BS.775有何关系?
答:IEC 62574和ITU-R BS.775在标准配置(最高5.1)方面紧密对齐并共享相同的基本声道分配原则。ITU-R BS.775定义了多声道音频的主观聆听测试和参考聆听条件,而IEC 62574提供了声道标签、编号和数字接口映射的工程规范。两者相互引用,共同构成专业和消费类多声道音频互操作性的基础。
问2:当7.1音频流在5.1系统上播放时会发生什么?
答:根据IEC 62574参考下混规则,后环绕声道以低于直接环绕信号约3 dB的比率混合到相应的环绕声道中。具体系数为:Ls’ = Ls + 0.5 × Lb,Rs’ = Rs + 0.5 × Rb。一些先进的AV接收机还提供额外的处理,但IEC 62574基线下混至少确保在没有此类处理的情况下技术上正确的空间呈现。
问3:IEC 62574是否涵盖Dolby Atmos等基于对象的音频格式?
答:部分涵盖。标准提供了最高声道16的编号分配,并定义了可容纳基于对象格式中使用的固定扬声器位置的扩展编号方案。然而,音频对象(由播放系统基于位置元数据解码而非分配给固定声道)的渲染不在IEC 62574的范围内。
问4:LFE声道在数字音频制作中的正确处理方式是什么?
答:IEC 62574规定LFE声道是带宽限制在80-120 Hz的专用低频效果声道。它应仅携带低频效果内容,而非主声道的低频内容。LFE声道电平通常比主声道校准高10 dB,以提供额外的低频效果余量。在生产流程中,工程师应使用带有120 Hz低通滤波器的专用LFE总线,并确保输出元数据中正确标记LFE声道。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注