1. 标准概况与适用范围
ISO/IEC 13818-7-06 (2012)(通常称为MPEG-2 AAC)是信息技术——运动图像及其伴音信号的通用编码系列标准的第七部分,专门定义高级音频编码(Advanced Audio Coding, AAC)技术。该标准由国际标准化组织(ISO)与国际电工委员会(IEC)联合制定,2012年版本整合了2006版之后的多项修正案(包括对HE‑AAC、低延迟配置文件等扩展的技术澄清),是当前AAC编码体系的核心参考规范。
作为MPEG-2音频标准族中非线性、高压缩比的部分,AAC旨在提供比MPEG‑1/2 Layer III(MP3)更优的听觉质量和编码效率。本标准广泛适用于要求高质量、低码率的数字音频应用,包括:
- 数字电视广播(DVB、ATSC)的伴音频编码;
- 数字音频广播(DAB/DAB+、DRM)的音频服务;
- 流媒体平台(如Apple Music、YouTube)的默认音频格式;
- 蓝光光盘、DVD等家庭娱乐媒体的音频轨道;
- 便携设备(智能手机、MP4播放器)的本地音频存储。
标准化效益: ISO/IEC 13818-7‑06为全球音频内容互通提供统一底层压缩框架,使不同厂商的编码器/解码器可在同一技术语言下实现互操作,显著降低产业研发与集成成本。
2. 主要技术内容与要求
2.1 AAC编码框架与工具组
本标准定义了一套基于感知音频编码的完整框架,包含以下关键技术模块:
- 改进型离散余弦变换(MDCT)—— 使用长/短窗切换实现暂态信号的高效表示;
- 瞬时噪声塑形(TNS)—— 在频域内预回声控制;
- 感知噪声分配(PNS)—— 对不重要的频率成分以噪声替代,降低码率;
- 联合立体声编码(中/侧MS与强度IS立体声);
- 比例因子与量化—— 非线性量化与霍夫曼编码复用。
2.2 音频编码配置(Profile)与级别
标准定义了多种配置以满足不同应用场景的质量‑延时‑复杂度需求:
| 配置(Profile) | 缩写 | 典型应用 | 最大通道数 | 采样率范围 |
| 低复杂度配置 | AAC‑LC | 通用音乐/语音编码,蓝光、广播 | 48 | 8 kHz – 96 kHz |
| 高级音频编码低延迟配置 | AAC‑LD | 会议通话、实时通信 | 48 | 8 kHz – 48 kHz |
| 高效AAC v1 | HE‑AAC(SBR) | 流媒体、DAB+ | 48 | 8 kHz – 48 kHz(核心) |
| 高效AAC v2 | HE‑AAC v2(SBR+PS) | 低码率流媒体(如48 kbps立体声) | 2 | 8 kHz – 48 kHz(核心) |
关键提示: 实际系统实现时,必须正确声明 AudioSpecificConfig 中的 audioObjectType 字段,解码器才能正确识别配置并切换解码内核。
2.3 比特流格式与语法约束
AAC采用ADTS(Audio Data Transport Stream)或ADIF(Audio Data Interchange Format)封装。2012版进一步明确了RAW_DATA_BLOCK 中语法元素的填充与对齐要求,并增补了跨样点帧的块交换规则,以便于与MPEG‑4音频无缝对接。标准还规定了最大比特率(512 kbps/ch)及帧长(每帧1024或960频谱系数)等基本参数。
注意: AAC编码器的专利通常由Via Licensing(前Dolby/ATT联合)统一管理,任何商业使用均需获得AAC专利池授权。即使标准本身可免费获取,实现或分发编码工具仍可能涉及专利费。
3. 实施/应用要点
3.1 编解码器适配与兼容性
部署ISO/IEC 13818-7‑06系统时,应关注:
- 配置协商: 发送端应依据接收端能力选择配置(例如对老旧DVB机顶盒应选用AAC‑LC而非HE‑AAC);
- 延迟管理: AAC‑LC典型算法延迟约为20 ms(1024样本帧,48 kHz采样),AAC‑LD可降低至5 ms以内,适合双向实时通话。
- 位宽与文件尺寸: 同等音质下,AAC一般比MP3节省约30%的比特率,编码器参数(如带宽截止、TNS强度)直接影响输出质量。
3.2 产品中的测试与验证
标准提供了一系列符合性比特流(conformance bitstreams),建议在产品开发阶段使用以下方式进行验证:
- ISO/IEC 13818-4(系统级符合性测试)中与音频相关的测试套件;
- 使用官方ADIF/ADTS参考解码器进行比特流通过率测试;
- 主观听音测试(如ITU‑R BS.1116方法)以确认感知质量不低于基准。
强制性要求: 根据标准第6.3节,所有声称符合ISO/IEC 13818-7‑06的编码器必须能够输出至少一种核心配置(AAC‑LC或AAC‑LD)的有效比特流,且必须支持ADTS封装方式。厂商不得因为简化实现而删除标准中定义的任何强制性工具(例:除非配置文件明确排除,否则必须支持TNS)。
4. 与其他标准的关系
ISO/IEC 13818-7‑06所属的MPEG‑2音频体系与多个互补或衍生标准密切相关:
- ISO/IEC 13818-3 —— MPEG‑2 BC(后向兼容)音频,AAC不具备与Layer I/II的后向兼容性,但效率显著更高。
- ISO/IEC 14496-3 —— MPEG‑4音频,其核心AAC对象类型(AEOT)直接继承并扩展自MPEG‑2 AAC,包括HE‑AAC、AAC‑LD等。实际上,2012版修正案已将部分MPEG‑4配置向后移植,以提高一致性。
- ITU‑R BS.1196 —— 定义AAC在数字音频广播中的使用约束(如带宽限制)。
- ETSI TS 101 154 —— 欧洲数字视频广播(DVB)标准,将ISO/IEC 13818-7 AAC列为强制音频编解码格式之一。
互操作建议: 在开发同时支持MPEG‑2 AAC与MPEG‑4 AAC的产品时,建议将比特流的 AudioObjectType 设置为2(AAC‑LC),以保证最大兼容性;使用HE‑AAC时需传递SBR配置索引,且解码器应能自动切换内核。
常见问题(FAQ)
问: ISO/IEC 13818-7‑06 与常见的AAC格式(如 .aac、.m4a)有何关系?
答: 本标准定义了AAC的核心编码语法和标准封装格式(ADTS/ADIF)。.aac文件通常是纯ADTS流或原始AAC数据流,而.m4a(MP4容器)使用MPEG‑4音频标准(ISO/IEC 14496-3)对AAC数据进行封装。二者的底层音频解码逻辑一致,仅复用层不同。
问: AAC相对于MP3的主要技术优势体现在哪些方面?
答: AAC在基于MDCT的调制、感知模型、TNS、立体声编码等方面均较MP3有显著改进。在同等比特率(如128 kbps)下,AAC可提供更宽的音频带宽(20 Hz‑20 kHz)、更少的编码失真,尤其在瞬态信号和语音表现上优于MP3。
问: 实施本标准的AAC解码器是否必须支持HE‑AAC(SBR)?
答: 不需要。ISO/IEC 13818-7‑06仅把HE‑AAC作为可选扩展(通过SBR工具),且SBR工具的实际定义在2004年随修正案加入。解码器若只声明支持AAC‑LC配置,则只需处理核心AAC解码;若要支持HE‑AAC,则必须在 AudioSpecificConfig 中声明相应的SBR配置。
© 2026 本文档基于ISO/IEC 13818-7-06 (2012) 公开标准编写,内容仅供技术交流。实际产品设计应以正式出版的标准文本为准。