CAN/CSA-ISO/IEC 13250-3-15 信息技术 — 主题地图 — 第3部分:XML语法 (XTM)

加拿大采纳的国际标准,定义主题地图的XML表示语法,用于语义知识的结构化交换与互操作。

1. 标准概况与适用范围

CAN/CSA-ISO/IEC 13250-3-15 是加拿大标准协会(CSA)采纳的国际标准,全文等同采用 ISO/IEC 13250-3:2015。该标准属于信息技术主题地图(Topic Maps)系列,正式名称为《信息技术 — 主题地图 — 第3部分:XML语法》(通常简称为 XTM,XML Topic Maps)。截至2026年,该标准仍是主题地图领域最为广泛使用的XML序列化格式,广泛应用于知识管理、语义标注、企业信息集成及关联数据发布等场景。

本标准规定了主题地图的XML表示语法,为在异构系统之间交换主题地图数据提供了统一的格式要求。它定义了XTM文档的结构、元素、属性及命名空间,并提供了模式(XSD)和文档类型定义(DTD)两种验证途径。任何遵循该语法的XTM文档均可被符合标准的处理器正确解析和合并。

技术提示:XTM 2.0(即本标准定义的版本)与早期的XTM 1.0在命名空间和元素结构上有重大差异。建议新项目直接采用本标准,以获得更好的数据模型一致性。

适用范围包括:

  • 语义网应用中的主题地图构建与交换;
  • 企业知识图谱(Enterprise Knowledge Graph)的XML序列化;
  • 跨系统、跨组织的主题地图互操作;
  • 主题地图与XML工具链(如XSLT、XQuery)的集成;
  • 基于主题地图的索引、分类和导航系统。

本标准是ISO/IEC 13250系列的核心组成部分,与数据模型(第2部分)紧密耦合。只有在理解主题地图数据模型(TMDM)的基础上,才能正确使用XTM语法进行数据表示。

2. 主要技术内容与要求

2.1 XTM文档结构与命名空间

一个有效的XTM文档以 <topicMap> 元素为根,命名空间必须声明为 http://www.topicmaps.org/xtm/2.0/。文档可以包含 <topic><association><mergeMap> 等顶级元素。所有元素必须使用小写字母,属性值必须符合XML规范。

2.2 核心元素一览

下表列出了XTM文档中最常用的元素及其用途,反映了主题地图数据模型的三大核心概念:主题(Topic)、关联(Association)、出现(Occurrence)。

元素 描述 出现次数 主要子元素
topicMap 文档根元素,包含整个主题地图 1(必选) topic, association, mergeMap
topic 定义一个主题(概念、实体) 0..* name, occurrence, subjectIdentifier, subjectLocator
name 为主题指定名称,可带作用域 0..*(每个topic) value, variant, scope
association 定义一个关联关系 0..* type, role, scope
occurrence 为主题关联一个资源出现 0..* resourceRef, resourceData, type, scope
subjectIdentifier 通过IRI标识主题 0..5 无子元素,内容为IRI
subjectLocator 引用一个可寻址的符号资源 0..5 无子元素,内容为IRI
role 在关联中指定角色 0..* type(引用主题),subjectIdentifier
scope 定义名称、关联或出现的适用范围 0..1 subjectIdentifier(引用作用域主题)
注意事项:主题标识必须使用绝对IRI,并遵循RFC 3986。不建议使用相对IRI或包含非法字符的IRI,以保证跨系统解析的准确性。

2.3 引用机制与合并暗示

XTM通过 subjectIdentifiersubjectLocator 实现主题的全局标识。同一主题的多个topic元素若使用相同的 subjectIdentifier,则隐含合并语义。标准规定了精确的合并规则,确保在加载多个XTM文档时能够正确合并同一主题。

此外,标准支持通过 <mergeMap> 指示处理器自动合并另一个主题地图文档,实现松耦合的分布地图。

3. 实施与应用要点

3.1 文档验证与模式

本标准提供两种验证机制:

  • XML Schema (XSD):官方schema文件可用于精确验证元素类型和内容模型;
  • DTD:兼容老工具的简单验证方式,但约束力较弱。
强制性要求:任何声称符合CAN/CSA-ISO/IEC 13250-3-15的XTM文档,必须通过对应的XSD验证,否则将不被视为有效文档。应用程序可以拒绝处理无效的XTM输入。

3.2 命名空间的最佳实践

在使用XTM时务必使用正确的命名空间:

  • XTM 2.0 命名空间:http://www.topicmaps.org/xtm/2.0/
  • 推荐使用 xmlns:xtm="http://www.topicmaps.org/xtm/2.0/" 前缀定义;
  • 不要在 topicMap 元素之上使用默认命名空间,以避免低级解析错误。
实施益处:采用本标准格式化主题地图数据,可以无缝利用现有的XML工具链(如XSLT转换、XQuery查询、XML数据库存储),降低开发成本并提高数据流通性。

3.3 与其他版本和格式的互操作

实践中可能遇到XTM 1.0遗留文档。转换时需要映射元素(如XTM 1.0的instanceOf变为type),并更新命名空间。建议使用标准化转换脚本,避免手动修改导致的不一致。

另请注意,XTM与ISO/IEC 13250-6(紧凑语法CTM)可相互转换,CTM更易读,XTM更适合机器处理和数据交换。

4. 与其他标准的关系

本标准不是孤立存在的,它与ISO/IEC 13250系列的其他部分以及若干外部标准紧密关联:

  • ISO/IEC 13250-2 (Topic Maps — Data Model) — 主题地图数据模型(TMDM),XTM是其具体序列化。理解TMDM是正确使用XTM的前提;
  • ISO/IEC 13250-4 (Topic Maps — Canonicalization) — 定义规范化语法(CXTM),用于数字签名和比较;
  • ISO/IEC 13250-6 (Topic Maps — Compact Syntax) — 紧凑语法CTM,与XTM互为补充;
  • ISO/IEC 19763 (Metamodel Framework for Interoperability) — 可用于与主题地图的语义互操作;
  • ISO 639 (Language codes)ISO 3166 (Country codes) — 常被用作主题地图中的作用域主题;
  • W3C XML 1.0XML Namespaces — XTM依赖底层XML标准。

在加拿大,CAN/CSA-ISO/IEC 13250-3-15 实际上取代了早期采纳的CAN/CSA-ISO/IEC 13250-3-07(对应XTM 1.0)。新项目应直接使用本版本。

实践建议:在采用主题地图的系统中,建议搭配使用ISO/IEC 13250-5(参考模型)来保证数据模型的抽象层一致性,从而避免具体语法之间的转换错误。

常见问题 (FAQ)

问:CAN/CSA-ISO/IEC 13250-3-15 与 ISO/IEC 13250-3:2015 有何关系?
答:两者内容完全相同。CAN/CSA版本是加拿大标准协会对国际标准的国家采纳,原文翻译或采用英文原版,并在加拿大国内作为国家标准发布。技术上不存在差异。
问:XTM 2.0 与旧版本 XTM 1.0 的主要区别是什么?
答:XTM 2.0 完全基于 ISO/IEC 13250-2 数据模型,摒弃了与模型不一致的旧语法。核心变化包括:去掉 instanceOf 改为 type,引入 subjectIdentifier 统一标识,支持多命名空间,以及更严格的合并规则。两者不直接兼容,须通过转换工具迁移。
问:如何验证一个XTM文档符合本标准?
答:可以使用标准的XML Schema文件(xtm2.xsd)进行Schema验证。许多XML编辑器(如XMLSpy、oxygen)和开源库(如XMLSchemaValidator)支持此项检查。此外,也可使用专门的主题地图引擎(如Ontopia、Topic Maps Lab)进行加载验证,它们会同时检查数据模型层的约束。
问:XTM与RDF/OWL相比有什么优势?
答:主题地图更强调主体的标识(PSI)和合并能力,非常适合需要综合多来源知识的跨域场景。XTM是标准化的XML语法,便于与传统XML技术栈集成。而RDF/OWL更适合语义网推理和开放世界模型。两者可以互补,且存在转换途径(如ISO/IEC 13250-5定义的参考模型可作为桥梁)。

📥 标准文件下载

🔒
请等待 10 秒,广告加载完成后将自动显示下载链接

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注