ISO 26428-11:数字影院——第11部分:附加音频通道

数字影院沉浸式音频规范——基于对象的音频、高度声道和多维声场

1. ISO 26428-11 标准范围

ISO 26428-11 定义了数字影院附加音频通道规范,在基线 5.1/7.1 环绕声格式基础上扩展,支持沉浸式音频配置,包括基于对象的音频、高度声道和多维声场。该标准确保不同厂商的数字影院服务器、音频处理器和屏幕处理系统之间的互操作性,同时保持与现有影院音响基础设施的向后兼容性。

设计基于对象的音频(OBA)时,音频处理器需要同时处理多达 128 个音频对象外加 16 个床通道。确保您的 DSP 资源分配能够扩展到这种最坏情况下的混音配置,而不会在 48 kHz 采样率下引入超过 5 ms 的延迟。
参数 基线 (5.1) ISO 26428-11 扩展
最大声道数 6 64(≤ 16 床 + 128 对象)
采样率 48 kHz 48 / 96 / 192 kHz
位深度 16 或 24 bit 24 bit(强制)、32 bit 浮点(可选)
音频编解码器 线性 PCM PCM / Dolby Atmos / DTS:X / Auro-3D
声道映射 固定 动态,按卷元数据
延迟预算 (AES67) 不适用 ≤ 1 ms 网络 + 5 ms 处理

2. 沉浸式音频架构

ISO 26428-11 规定的附加音频框架采用元数据驱动渲染模型。每个音频素材都附有合成播放列表(CPL),描述空间定位元数据,包括方位角、仰角、距离和增益系数。影院音频处理器(CAP)实时将这些对象渲染到可用的扬声器阵列,根据存储在扬声器配置文件中的影厅特定扬声器布局配置,应用声像定位算法(VBAP、DBAP 或 Ambisonic 解码)。

部署高度声道扬声器阵列时,相邻层之间的垂直角度不应超过 30°,以避免定位间隙。对于典型的 15 m 银幕到后墙的影院,三层(地面、人耳高度、天花板)配置每侧墙壁至少需要 9 个高度扬声器。

音频同步至关重要。该标准要求所有音频声道和对象在 48 kHz 采样率下时间对齐精度在 ±1 个采样周期(±20.8 μs)以内。这需要通过 AES67 或 IEEE 1588(PTP)精确时间协议分配通用时钟参考。网络抖动必须低于 1 μs RMS,以在所有处理节点间保持此对齐精度。

3. 工程实施考虑

符合 ISO 26428-11 的系统的实际实施面临若干工程挑战。音频处理器必须同时支持基于声道和基于对象的渲染,并在可能使用不同音频格式的卷之间实现无缝过渡。数字影院服务器必须在现有 MXF 容器中嵌入附加音频元数据,而不干扰核心音频素材解码路径。

  • DSP 吞吐量:96 kHz/24-bit 的 64 声道沉浸式系统需要约 150 MIPS 的专用 DSP 处理能力用于实时渲染,不包括对象声像定位计算(根据对象数量可能额外增加 200–400 MIPS)。
  • 网络拓扑:使用专用 AVB 或 Milan 认证网络交换机,每跳存储转发延迟 ≤ 100 μs。标准以太网交换机会引入不可预测的排队延迟,违反 1 ms 端到端延迟预算。
使用 ISO 26428-11 校准测试曲目(含空间元数据的粉红噪声)进行适当的调试过程,可在 30 分钟内自动验证所有扬声器声道、延迟和声压级对齐——而手动对齐需要 3–4 小时。
沉浸式音频系统的上电时序至关重要。功放机柜在电容组充电期间可能瞬时拉高至 > 100 A 峰值电流。务必实施交错上电序列(机柜间延迟 2–3 秒),以避免系统启动时触发建筑断路器跳闸。

4. 常见问题解答

问:ISO 26428-11 是否向后兼容现有的 5.1 影院设施?
答:是的。该标准规定了编码在音频元数据中的向后兼容下混算法。传统的 5.1 处理器可将 7.1.4 沉浸式混音再现为标准 5.1 输出,尽管沉浸效果自然丢失。
问:支持的最大音频对象数是多少?
答:ISO 26428-11 支持最多 128 个同步音频对象加上 16 个床通道,总计 144 个同步音频元素。实际部署通常使用 32–64 个对象。
问:标准如何处理不同影院之间的扬声器布局差异?
答:存储在每个影厅音频处理器中的扬声器配置文件(SCF)将理想声场映射到物理扬声器布局。渲染引擎根据实际扬声器位置、高度层数和超低音扬声器配置自适应调整对象声像定位。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注