1. 标准概况与适用范围
ISO/IEC 15938-5:2004(加拿大采纳为 CAN/CSA-ISO/IEC 15938-5-04)是国际标准 MPEG-7 (Multimedia Content Description Interface) 的第五部分,正式名称为 多媒体描述方案 (Multimedia Description Schemes, MDS)。该标准定义了一组基于 XML Schema 的描述工具,用于对多媒体内容(视频、音频、图像、文本等)的结构、语义、时间信息、创作信息及使用信息进行标准化描述。
MDS 是整个 MPEG-7 框架的“骨架”,它提供了丰富且可扩展的描述元素(Descriptors)和描述方案 (Description Schemes, DS),使得多媒体内容可以被唯一标识、检索、过滤和重用。该标准广泛应用于数字图书馆、广播与电视档案管理、在线多媒体平台、视频监控索引、以及数字内容编辑与分发等领域。
技术要点: ISO/IEC 15938-5:2004 采用 XML Schema 语言定义描述结构,确保描述内容的机器可解析性和跨平台互操作性。实施时建议综合使用 MPEG-7 参考软件(XRM)进行验证与开发。
2. 主要技术内容与要求
MDS 描述方案可分为多个功能类别,每个类别提供特定的描述能力。以下表格总结了核心的描述方案类别及其典型应用:
| 类别 | 核心描述方案 | 主要用途 |
| 基础媒体元素 | MediaSource, MediaTime | 标识媒体资源、定义时间轴与时间点 |
| 结构性方案 | Segment DS, Region DS, MovingRegion DS | 描述内容的空间分割、时间分割及动态区域 |
| 语义性方案 | Semantic DS, Object DS, Event DS | 描述内容的语义实体、事件及相互关系 |
| 创作与元数据 | CreationInformation DS, UsageInformation DS, RightsManagement DS | 描述作者、日期、版权、使用历史、用户偏好等 |
| 摘要与过滤 | Summarization DS, ClassificationScheme DS | 支持内容摘要生成、分类体系定义与过滤条件表达 |
各描述方案之间通过扩展和组合实现复杂的描述。例如,Segment DS 可以包含多个子片段,每个片段可关联 MediaTime 与 CreationInformation,从而构建出完整的媒体结构化描述。标准还规定了描述方案的抽象基础类型、属性及关系(如等同、部分、序列等),确保描述的连贯性与可组合性。
2.1 关键描述方案详解
Multimedia DS (MMDS) 是顶层容器,可包含多个多媒体内容实例的定义。Segment DS 是最常用的结构方案,支持对时间区间(视频片段)、空间区域(图像中的矩形)以及时-空区域(视频中的移动对象)的细粒度描述。Semantic DS 则通过 SemanticRelation DS 表达概念之间的关系,例如对象、事件、地点、时间等的语义关联。
实施益处: 采用 MDS 标准化描述可以极大提升多媒体内容的可寻址性,降低多系统间的集成成本,并支持高级检索(如基于语义、基于事件的查询)。
3. 实施与应用要点
实施 ISO/IEC 15938-5:2004 需要关注以下几个关键环节:
- 熟悉 XML Schema:MDS 使用 XML Schema 定义,实施人员需熟悉 XML 命名空间、类型定义及扩展机制。标准提供了完整的 Schema 文件(.xsd),建议作为开发的基础。
- 工具链选择:可使用 MPEG-7 参考软件(XRM)生成和解析描述实例,也可使用通用的 XML 解析器(如 Xerces)结合自定义程序。商业产品如 Adobe Scene7 和诺基亚 Mobile Media API 也部分兼容 MDS。
- 版本兼容性:ISO/IEC 15938-5 有 2003、2004、2008 等多个版本,部分元素已标记为废弃(Deprecated)。2004 版增加了对 XML Schema 1.0 的完全遵从、更强的数据类型支持以及新的描述方案如 Summarization DS。实施时需明确目标版本。
- 应用扩展:标准允许通过 ClassificationScheme DS 自定义分类字典,或通过派生定义专有描述方案,但需遵循 MDS 的扩展规则以保证互操作性。
重要提醒: 虽然 MDS 提供了丰富的描述能力,但不宜盲目使用所有方案。建议针对典型应用场景(如视频摘要、基于语义的图像检索)精选子集并建立描述模板,以平衡描述粒度与处理效率。
4. 与其他标准的关系
ISO/IEC 15938-5 是 MPEG-7 系列标准的核心,与其姊妹部分紧密配合:
- Part 3 (Visual) 和 Part 4 (Audio):分别定义了低层视觉特征(颜色、纹理、形状)和听觉特征(音调、频谱)的描述子。这些低层描述工具通过 MDS 定义的结构性方案(如 Segment DS)嵌入到整体描述中。
- Part 6 (Reference Software) 和 Part 7 (Conformance Testing):提供参考实现和一致性测试指南,帮助验证 MDS 描述的正确性。
- 外部标准映射:MDS 中的 CreationInformation DS 可与 Dublin Core 元数据术语(如 creator, date, rights)建立映射;UsageInformation DS 兼容 TV-Anytime 的偏好描述;Semantic DS 可与 CIDOC-CRM 等文化遗产本体互操作。
此外,该标准也可与 ISO/IEC 15938-12(MPEG-7 Query Format)结合,实现基于 MDS 描述的查询与检索。
强制性要求: 在涉及个人隐私、版权内容使用时,描述中的 RightsManagement DS 仅提供权利声明框架,合规的具体操作仍需遵循当地法律(如 GDPR、数字版权法)。标准不替代法律,但可辅助权利管理与溯源。
常见问题 (FAQ)
问: MDS 与 MPEG-7 的其他部分有什么区别?
答: MDS (Part 5) 提供高层的结构化、语义和元数据描述方案,而 Part 3 (Visual) 和 Part 4 (Audio) 提供低层特征描述子。MDS 负责组织这些描述子,使其能够完整描述多媒体内容。简单来说,MDS 是“骨架”,特征是“血肉”。
问: 如何开始使用 MDS 描述一个视频片段?
答: 首先基于 MPEG-7 Schema 创建一个多媒体描述实例,顶层使用 元素,然后添加 并指定类型 (Video)。在
问: 是否有开源工具支持 MDS 的生成和解析?
答: 有。MPEG-7 官方参考软件 (XRM) 提供实例生成与验证功能。另外,开源库如 libmpeg7(Java)以及基于 XSLT 的处理框架也可用于 MDS 的转换与分析。商业工具如 IBM Video Search、Autonomy 等也曾集成 MDS 支持。
问: 该标准的最新版本是什么?
答: ISO/IEC 15938-5 的最新版本是 2008 年发布的第二版 (ISO/IEC 15938-5:2008),但 2004 版仍被广泛使用。2008 版主要修正了 Schema 中的少许错误并添加了若干新的描述方案。2026 年的今天,部分功能已被后继的 MPEG-7 Ultimate 或 MPEG-21 DIP 所延续,但 MDS 依然是多媒体描述的基础参考。