Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
IEC 61937-4:2003(及2004年勘误表)是一项重要的国际标准,专门规定了非线性PCM编码数字音频位流的传输接口。该标准定义了用于在IEC 60958(S/PDIF或AES/EBU)数字音频接口上传输压缩音频格式(包括杜比数字AC-3、DTS、MPEG-1/2音频和ATRAC)的突发负载格式。本文将从突发结构、数据率管理和系统设计三个维度进行深入分析。
IEC 61937的核心创新在于突发负载(burst-payload)概念。与线性PCM音频每个音频帧都用于采样数据不同,压缩音频格式产生的数据长度可变且间隔不规则。突发负载机制将这些压缩数据打包成短时、高强度的突发脉冲,嵌入IEC 60958帧结构中。
每个突发由以下元素组成:
| 数据类型(十六进制) | 音频格式 | 最大声道数 | 典型码率 |
|---|---|---|---|
| 0x01 | MPEG-1音频(Layer I/II/III) | 2 | 32-448 kbps |
| 0x02 | MPEG-2音频(LSF) | 5.1 | 8-160 kbps |
| 0x03 | MPEG-2 AAC | 5.1 | 可变 |
| 0x04 | 杜比数字(AC-3) | 5.1 | 32-640 kbps |
| 0x05 | DTS(数字影院系统) | 5.1-7.1 | 32-1536 kbps |
| 0x0A | ATRAC/ATRAC2/ATRAC3 | 2 | 66-292 kbps |
| 0x0C | DTS-HD高分辨率 | 7.1 | 高达6 Mbps |
IEC 61937解决的最关键工程挑战之一,是如何管理IEC 60958传输通道(固定于音频采样率)的恒定比特率与压缩音频的可变比特率之间的不匹配。
合规实现的关键时序参数包括:
| 格式 | 帧大小(采样数) | 帧时长(ms) | 突发大小(字节) | 峰值突发率(Mbps) |
|---|---|---|---|---|
| 杜比数字(AC-3) | 1536 | 32.0 | 1792 @ 448 kbps | 2.46 |
| MPEG-1 Layer II | 1152 | 24.0 | 1044 @ 384 kbps | 2.09 |
| DTS Core | 512 | 10.67 | 2048 @ 1536 kbps | 2.46 |
| MPEG-2 AAC | 1024 | 21.33 | 可变 | 可变 |
IEC 61937-4对家庭影院和多声道音频系统的成功起到了基础性作用。以下是实现合规接口的关键工程考量:
虽然IEC 60958在消费领域(S/PDIF——RCA同轴或Toslink光纤)和专业领域(AES/EBU——XLR)均有应用,但IEC 61937在两者上的操作完全相同。关键区别在于通道状态位:消费模式使用不同的位来标识非PCM音频,解码器必须正确解释这些位以在PCM和突发模式之间切换。
对于直播或游戏等应用,突发负载处理会增加可测量的延迟。每个压缩帧必须完全接收后才能开始解码(取决于编解码器的延迟),而IEC 61937突发解包又会增加1-2 ms。在对低延迟要求严格的应用中,可能需要采用I2S或HDMI ARC/eARC等替代传输方案。
随着HDMI(原生支持多声道音频)的普及,IEC 61937的重要性有所转移。然而,该标准在后向兼容性、光纤/同轴S/PDIF连接以及许多仍以AES/EBU为骨干的专业音频路由器中仍然不可或缺。突发格式在许多实现中也作为HDMI音频回传通道(ARC)的封装层。
答:不是。IEC 60958接收器必须专门支持非PCM突发模式。许多早期的S/PDIF接收器会将突发数据解读为PCM格式的咔嗒声和爆音。现代接收器使用通道状态位检测非PCM模式,并自动切换解码路径。标准提供了后向兼容机制:不支持突发格式的接收器只会产生白噪声,提示需要兼容的解码器。
答:可以,但有限制。DTS-HD Master Audio和杜比TrueHD等格式在通过S/PDIF传输其核心码率时使用IEC 61937突发帧格式。然而,这些格式的无损扩展部分往往超过3.072 Mbps的IEC 60958通道容量。对于完全无损多声道传输,HDMI是首选接口。部分专有扩展(如DTS 96/24)可以满足突发约束。
答:理论上限约为3.072 Mbps,即48 kHz立体声IEC 60958链路在24位采样下的最大数据率。实际中,突发头、前导码和填充的开销将可用负载码率降低到约2.5-2.8 Mbps。这可以轻松容纳杜比数字(最大640 kbps)和DTS(最大1536 kbps),但限制了DTS-HD MA(高达24.5 Mbps)等更高速率格式。
答:接收器持续监视IEC 60958音频帧数据,寻找Pa前导码模式(0xF872)。一旦检测到,读取随后的突发信息字段以确定数据类型和负载长度,然后从后续子帧中提取精确的负载字节。错误检测依赖于突发信息字段以及压缩音频格式本身的CRC保护机制。