Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
图像编码技术的格局已远超众所周知的JPEG标准。ISO/IEC TR 29170-1为高级图像编码技术建立了评估框架,提供了在不同编码器之间比较编码效率、视觉质量和计算需求的标准化方法。该技术报告为需要选择或评估图像压缩技术的工程师提供了必不可少的参考。
该标准定义了涵盖三个领域的综合评估框架:压缩效率、视觉质量和资源需求。压缩效率通过率失真曲线来衡量,该曲线描绘了解码图像质量(通过PSNR、SSIM或VMAF测量)与比特率之间的关系。标准指定了一个参考测试集,包含在多种分辨率下具有不同内容类型(自然场景、文本、计算机图形、医学影像)的图像。
ISO/IEC TR 29170-1中的视觉质量评估将客观指标(PSNR、SSIM、MS-SSIM、VMAF和CIEDE2000)与源自ITU-R BT.500的主观测试方法相结合。标准承认仅靠客观指标不足以评估感知质量,特别是在低比特率下不同编码器表现出不同的伪影特征——块效应、振铃效应、模糊或色彩偏移——人类观察者对它们的感知各不相同。
| 编码器世代 | 代表性标准 | 相比JPEG压缩增益 | 主要伪影类型 |
|---|---|---|---|
| 第一代 | JPEG(ISO/IEC 10918) | 基准 | 块效应、色度抽样 |
| 小波基 | JPEG 2000(ISO/IEC 15444) | 比特率降低20-30% | 低比特率下模糊 |
| 视频衍生 | HEIC/HEIF(HEVC)、AVIF(AV1) | 比特率降低40-60% | 振铃效应、色彩渗漏 |
| 下一代 | JPEG XL(ISO/IEC 18181)、VVC | 比特率降低50-70% | 典型比特率下极少 |
为生产系统选择图像编码技术涉及超越压缩效率的权衡。ISO/IEC TR 29170-1提供了评估计算复杂度(编码和解码时间、内存使用、目标硬件上的功耗)、编码延迟(对实时应用关键)、并行化能力和硬件加速可用性的指导。标准引入了”工作点”的概念——即实现压缩比与计算成本之间目标平衡的特定编码参数组合。
解码复杂度对于网络和移动应用尤为重要,因为内容只编码一次但需解码数百万次。即使某个编码器提供20%更好的压缩,如果每次图像解码需要5倍的计算量,且额外的解码成本在数百万用户间倍增,该编码器可能仍不可接受。标准的框架明确量化了这些权衡,支持数据驱动的编码器决策。
ISO/IEC TR 29170-1还讨论了需要支持多种编码器代际的系统的架构策略。支持多种编码器类型的容器格式(如HEIF和AVIF)可在生态系统支持演进时实现编码器之间的平滑过渡。标准建议设计图像处理流水线时采用编码器抽象层,将应用代码与特定编码器实现隔离,使编码器升级无需全面架构变更。
该框架还特别关注编码时间可变性的评估。现代编码器的编码与解码复杂度往往差异显著,且不同图像之间的编码时间变化很大。对于批量处理流水线,这种可变性会影响调度和吞吐量可预测性。标准建议测量编码时间直方图而非简单平均值,以捕获真实运行条件下编码性能的完整分布特征。这对于云端图像处理服务的大规模部署尤为重要。