Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
IEC TS 62579作为技术规范由IEC第100技术委员会(音频、视频和多媒体系统与设备)发布,定义了一种用于电子出版多媒体内容的标准化XML格式。随着出版业经历从以印刷为中心到以数字为先的工作流程的根本性转变,对稳健、可扩展且平台无关的内容格式的需求变得至关重要。该标准满足了在单一基于XML的文档框架中表示结构化多媒体出版物的需求——结合文本、图像、音频、视频和交互元素——确保在从专用电子阅读器和平板电脑到网页浏览器和移动设备等多种阅读平台上的一致渲染。
标准定义了一种基于XML Schema的分层文档结构,将多媒体出版物组织为逻辑组件。在顶层,Publication元素包含元数据、清单、阅读顺序和媒体集合元素。遵循Dublin Core和PRISM词汇标准的元数据部分捕获书目信息,包括标题、创建者、出版者、标识符(DOI、ISBN或URI)、出版日期、语言、主题分类和权利管理条款。标准通过多媒体特定元素扩展了基本元数据:媒体时长、所需带宽、支持的渲染配置文件和无障碍功能,包括隐藏字幕轨道、音频描述和图像的替代文本。
spine元素定义了内容的线性阅读顺序,支持自适应内容交付的强制和可选阅读序列。出版物中的内容文档使用XHTML 1.1子集以及在IEC TS 62579命名空间中定义的附加多媒体元素。media-collection元素聚合所有多媒体资源——通过唯一标识符引用——及其关联元数据,包括编解码器要求、分辨率变体(用于响应式渲染)、语言轨道和内容保护标志。容器结构使用基于ZIP档案打包的OCF约定,包含MIME类型描述符文件和指定出版物根文件位置的container.xml文件。
| 元素 | 描述 | 必需 | 基数 |
|---|---|---|---|
| publication | 多媒体出版物的根元素 | 是 | 1 |
| metadata | 书目和技术元数据容器 | 是 | 1 |
| manifest | 出版物中所有资源的列表 | 是 | 1 |
| spine | 内容文档的线性阅读顺序 | 是 | 1 |
| media-collection | 聚合的多媒体资源注册表 | 否 | 0..1 |
| nav-map | 目录和导航层级 | 是 | 1 |
| content-document | 单个内容文档 | 否 | 0..n |
| media-resource | 对外部或嵌入式媒体资产的引用 | 否 | 0..n |
IEC TS 62579的一个关键创新是其多媒体同步模型,实现了文本、音频、视频和交互元素之间的精确时间协调。通过嵌入在内容文档中的基于SMIL的时间线模型实现同步。段落级时间标记允许与音频旁白同步的文本高亮显示,而视频片段可以链接到文本的特定部分以用于插图技术文档。标准定义了三种同步模式:顺序(媒体元素按顺序播放)、并行(同时播放带同步点)和交互式(用户驱动的进度,由读者操作触发媒体)。
内容渲染要求规定了合规阅读系统的最小显示能力。文本必须使用CSS布局跨不同屏幕尺寸重排,页面模板在出版物清单中定义。标准强制支持至少六种字体系列(衬线、无衬线、等宽、手写、幻想和一种中日韩字体),允许通过OpenType格式嵌入字体并可进行子集化以减小文件大小。对于数学和科学内容,需要在呈现级别支持MathML渲染,建议使用内容级别MathML以实现与学习管理系统的语义互操作性。
构建符合IEC TS 62579的出版系统需要仔细规划内容创建流水线。标准不要求作者编写原始XML;相反,它建立了创作工具必须生成的目标格式。对于构建出版工作流程的工程团队,推荐的方法是以语义XML源格式维护内容——如DocBook或DITA——并使用XSLT样式表将其转换为IEC TS 62579。这种内容与呈现的分离能够实现单一来源出版,自动生成多媒体出版物格式。转换流水线必须处理媒体资源引用、分辨率变体选择以及从创作模式到IEC TS 62579元数据词汇表的元数据映射。
数字版权管理集成通过可插拔的权利管理接口实现。标准在元数据部分定义了一个权利管理信息元素,可以引用外部DRM系统参数而不强制规定特定DRM技术。出版物可以在容器级别使用AES-128 CBC模式加密,加密密钥通过权利发布者服务传递。标准建议阅读系统至少实现OMA DRM 2.0配置文件以支持移动兼容性和Marlin DRM系统以支持宽带连接设备,不过实现者可以通过可扩展的权利管理框架支持额外的DRM系统。
多媒体出版物的性能优化需要注意几个工程参数。标准建议应在元数据中声明总出版物大小,以允许阅读系统在下载前检查可用存储。对于超过50 MB的出版物,建议使用按章节粒度的渐进下载,利用HTTP范围请求按需获取内容。清单必须声明容器内每个内容文档的字节偏移量,以支持无需完全解压缩的随机访问。阅读系统级别的缓存策略应优先缓存最近访问的章节,并在带宽允许时预加载阅读顺序中的下一章,提供无缝的阅读体验,各节之间没有可感知的加载延迟。
| 媒体类型 | 基本配置文件 | 增强配置文件 | 容器格式 |
|---|---|---|---|
| 文本 | XHTML 1.1 + CSS 2.1 | XHTML 5 + CSS 3 | application/xhtml+xml |
| 静态图像 | JPEG, PNG, GIF | JPEG 2000, WebP, SVG | image/* |
| 音频 | MP3, AAC-LC | AAC-HE, Opus, FLAC | audio/mpeg, audio/mp4 |
| 视频 | H.264 AVC, 720p | H.265 HEVC, 1080p | video/mp4, video/webm |
| 交互 | SMIL 3.0时间线 | JavaScript + Canvas API | application/smil+xml |
| 字体 | OpenType子集 | WOFF 2.0可变字体 | font/otf, font/woff2 |