ISO 26429-4:2008 数字影院封装 — MXF JPEG 2000 应用

用于数字影院发行的 JPEG 2000 2K/4K 配置文件到 MXF 通用容器的映射

1. 数字影院 MXF 的 JPEG 2000 映射

ISO 26429-4 规定了 JPEG 2000 编码图像映射到 MXF 通用容器中用于数字影院应用的规范。基于 SMPTE 422M,该标准定义了跨数字影院播放设备互操作性所需的约束和特定值。JPEG 2000 配置文件在 ISO/IEC 15444-1 Amd 1 中定义,指定了两个配置文件:2K(2048×1080)和 4K(4096×2160)。

2K 和 4K 配置文件在 JPEG 2000 码流中使用不同的 Rsiz 值2K 为 03h,4K 为 04h。解码器必须检查此值以正确配置解压缩管线。尝试用 2K 解码器解码 4K 码流将会失败。

2. KLV 编码和 UL 约束

参数 2K 配置 4K 配置 说明
Rsiz(JPEG 2000) 03h 04h 数字影院配置文件标识符
存储宽度 最大 2048 最大 4096 水平像素分辨率
存储高度 最大 1080 最大 2160 垂直像素分辨率
分量最大参考值 4095 4095 X’Y’Z’ 最大码值(12 位)
分量最小参考值 0 0 X’Y’Z’ 最小码值
像素布局 D8h-0Ch-D9h-0Ch-DAh-0Ch-00h-00h 相同 X’Y’Z’ 颜色分量标识
图像素材压缩 UL 03h(字节 16) 04h(字节 16) JPEG 2000 码流限制标识符

3. 工程实现细节

数字影院 JPEG 2000 的素材元素键在 16 字节 UL 的字节 14-16 中使用特定值:字节 14 = 素材元素计数(01h),字节 15 = 素材元素类型(08h 表示帧封装 JPEG 2000),字节 16 = 素材元素编号(01h)。基于帧的封装是强制性的按照 ISO 26429-3 的定义,每个 MXF 文件正好有一个图像素材轨道。

像素布局使用 D8h、D9h 和 DAh 分别表示 X’、Y’、Z’ 分量。注意,这些值是 X、Y、Z 的 ISO 7 位字符代码,最高有效位设置为 1。这区分了 DCDM 颜色分量与 SMPTE 377M 中已定义的 X、Y、Z 值。

RGBA 图像素材描述符提供了关于图像编码的全面元数据。关键字段包括:采样率(通常为 {24,1} 或 {48,1})、帧布局(0 = 逐行)、分量最大参考值(12 位为 4095)、分量最小参考值(0)和 Gamma(设置为按照 SMPTE RP 224 的数字影院特定 UL)。JPEG 2000 图像子描述符承载 Rsiz、图像尺寸(Xsiz、Ysiz)、瓦片尺寸(XTsiz、YTsiz)和分量尺寸信息,包括每个分量的精度位数。

为数字影院设计 JPEG 2000 解码器时,子描述符中的分量尺寸数组指示 3 个分量,每个具有 11 位精度(加 1 位符号位,共 12 位)。这种 12 位处理路径是与通常以 8 位精度运行的消费级 JPEG 2000 解码器的关键区别。硬件设计者必须为所需的额外处理能力和内存带宽做好预算。

宽高比默认为 {256,135}(约 1.896:1),即数字影院的平展格式。当像素阵列未完全占用 DCDM 操作级别时,使用其他值。视频行映射属性使用四个 Int32 值的数组(通常为 2、4、0、0)来描述视频信号的第一行和最后有效行。

4. 常见问题解答

问:如果我尝试在 2K 解码器上解码 4K JPEG 2000 流会发生什么?
答:解码器应检查 Rsiz 值(03h 与 04h),如果不匹配其能力则拒绝流。尝试用 2K 解码器解码 4K 流将因不同的瓦片尺寸和小波变换参数而产生错误结果。
问:我可以使用 ISO/IEC 15444-1 Amd 1 中定义之外的 JPEG 2000 配置文件吗?
答:不可以,只允许修正案中定义的两个数字影院专用配置文件(2K 和 4K)。使用其他配置文件会破坏互操作性。
问:为什么基于帧的封装是强制性的?
答:基于帧的封装确保每个 MXF 内容包恰好包含一帧。与基于片段或多帧封装相比,这实现了帧精确的随机访问并简化了编辑操作。
问:RGBA 图像素材描述符如何标识 X’Y’Z’ 色彩空间?
答:通过 PixelLayout 字段,使用最高有效位设置为 1 的值 D8h(X)、D9h(Y)、DAh(Z)。这是一个 8 字节数组,结构为 4 对(分量代码,水平子采样因子),例如 D8h-0Ch-D9h-0Ch-DAh-0Ch-00h-00h。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注