ISO/IEC TR 29170-1:信息技术——高级图像编码——第1部分:评估框架

深入解析ISO/IEC TR 29170-1高级图像编码评估框架及其在编码器选择与性能评估中的应用

图像编码技术的格局已远超众所周知的JPEG标准。ISO/IEC TR 29170-1为高级图像编码技术建立了评估框架,提供了在不同编码器之间比较编码效率、视觉质量和计算需求的标准化方法。该技术报告为需要选择或评估图像压缩技术的工程师提供了必不可少的参考。

ISO/IEC TR 29170-1是技术中立的——它不强制规定特定编码器,而是定义如何评估任何高级图像编码技术。这使得框架能够在AVIF、JPEG XL、VVC等新编码器出现时保持相关性。

评估框架与性能指标

该标准定义了涵盖三个领域的综合评估框架:压缩效率、视觉质量和资源需求。压缩效率通过率失真曲线来衡量,该曲线描绘了解码图像质量(通过PSNR、SSIM或VMAF测量)与比特率之间的关系。标准指定了一个参考测试集,包含在多种分辨率下具有不同内容类型(自然场景、文本、计算机图形、医学影像)的图像。

ISO/IEC TR 29170-1中的视觉质量评估将客观指标(PSNR、SSIM、MS-SSIM、VMAF和CIEDE2000)与源自ITU-R BT.500的主观测试方法相结合。标准承认仅靠客观指标不足以评估感知质量,特别是在低比特率下不同编码器表现出不同的伪影特征——块效应、振铃效应、模糊或色彩偏移——人类观察者对它们的感知各不相同。

编码器世代 代表性标准 相比JPEG压缩增益 主要伪影类型
第一代 JPEG(ISO/IEC 10918) 基准 块效应、色度抽样
小波基 JPEG 2000(ISO/IEC 15444) 比特率降低20-30% 低比特率下模糊
视频衍生 HEIC/HEIF(HEVC)、AVIF(AV1) 比特率降低40-60% 振铃效应、色彩渗漏
下一代 JPEG XL(ISO/IEC 18181)、VVC 比特率降低50-70% 典型比特率下极少
在不同内容类型优化的编码器之间比较时,率失真曲线可能产生误导。在自然照片上表现良好的编码器可能在屏幕内容(文本、UI截图)上表现不佳。ISO/IEC TR 29170-1要求按测试集中每种内容类别分别报告性能,防止选择性呈现有利结果。

编码器选择的工程考虑

为生产系统选择图像编码技术涉及超越压缩效率的权衡。ISO/IEC TR 29170-1提供了评估计算复杂度(编码和解码时间、内存使用、目标硬件上的功耗)、编码延迟(对实时应用关键)、并行化能力和硬件加速可用性的指导。标准引入了”工作点”的概念——即实现压缩比与计算成本之间目标平衡的特定编码参数组合。

解码复杂度对于网络和移动应用尤为重要,因为内容只编码一次但需解码数百万次。即使某个编码器提供20%更好的压缩,如果每次图像解码需要5倍的计算量,且额外的解码成本在数百万用户间倍增,该编码器可能仍不可接受。标准的框架明确量化了这些权衡,支持数据驱动的编码器决策。

对于渐进式渲染应用(网页浏览、图片库),不仅要考虑总文件大小,还要考虑何时能获得视觉上有用的重建图像。支持高级渐进式细化或空间可伸缩性(JPEG 2000、JPEG XL)的编码器可在完整文件大小的5-10%时提供可辨识图像,显著改善感知加载性能。
不要仅依赖PSNR进行编码器比较。对于使用感知量化和环路滤波器的现代编码器,PSNR与感知质量的相关性不佳。对于影响用户面对应用的编码器选择决策,VMAF或主观测试应作为主要质量指标。

面向未来的图像编码架构

ISO/IEC TR 29170-1还讨论了需要支持多种编码器代际的系统的架构策略。支持多种编码器类型的容器格式(如HEIF和AVIF)可在生态系统支持演进时实现编码器之间的平滑过渡。标准建议设计图像处理流水线时采用编码器抽象层,将应用代码与特定编码器实现隔离,使编码器升级无需全面架构变更。

该框架还特别关注编码时间可变性的评估。现代编码器的编码与解码复杂度往往差异显著,且不同图像之间的编码时间变化很大。对于批量处理流水线,这种可变性会影响调度和吞吐量可预测性。标准建议测量编码时间直方图而非简单平均值,以捕获真实运行条件下编码性能的完整分布特征。这对于云端图像处理服务的大规模部署尤为重要。

常见问题

问:在相同视觉质量下JPEG与JPEG XL的实际比特率差异是多少?
对于视觉无损质量(SSIM > 0.98)的照片内容,JPEG XL通常比JPEG减少50-60%的比特率。在缩略图可接受的较低质量水平下,优势缩小至30-40%但仍显著。
问:ISO/IEC TR 29170-1是否指定了单一的”最佳”编码器?
不——该标准仅为评估方法。它定义了如何测量和比较性能,但不指定哪种编码器最佳,认识到最佳编码器选择取决于应用特定要求,包括质量目标、计算预算、生态系统约束和内容类型分布。
问:硬件加速对编码器选择有多重要?
对于移动和嵌入式应用,硬件解码支持往往是决定性因素。现代编码器的软件解码可能消耗大量电池电量并产生热量。标准建议在电池供电设备的评估中纳入每图像的能耗指标。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注