“content”: “
国际标准ISO/IEC 11179-5:2016(及其加拿大采纳版CAN CSA ISO IEC 11179-5-16)定义了信息技术领域中元数据注册系统(Metadata Registry, MDR)中数据元的命名和标识原则。该部分规定了如何为数据元赋予一致的名称、明确的定义以及全局唯一的标识符,是构建高质量元数据系统、实现跨系统数据共享与互操作的核心基础。
”
1. 标准概况与适用范围
ISO/IEC 11179 系列由六大技术部分组成,第5部分专门聚焦于数据元的命名机制与标识体系。它适用于任何需要管理元数据的组织,尤其是政府部门、大型企业、医疗健康、科研机构及数据密集型行业。
该标准的主要目的是确保数据元的名称、定义和标识符无歧义、可理解、可映射,从而支持跨注册系统、跨领域甚至跨国家的数据交换。CAN CSA ISO IEC 11179-5-16 是加拿大标准委员会采纳的等同国际标准版本,完全保留了 ISO/IEC 11179-5:2016 的技术内容,仅在编辑格式上按加拿大国家标准要求做了调整。
提示:本标准的核心价值在于提供了一套通用的“语言规则”——即使系统使用不同数据库,只要数据元按同一原则命名和标识,元数据即可自动对齐,极大减少数据整合成本。
2. 主要技术内容与要求
2.1 数据元命名原则
标准要求数据元名称必须由以下组件按顺序构成:
- 对象类(Object Class) — 数据元素所描述的现实实体,如“客户”“订单”“患者”。
- 特性(Property) — 该实体被观察或测量的属性,如“出生日期”“总额”。
- 表示(Representation) — 特性的数据形式,如“日期”“金额”。
- 限定词(Qualifier) — 可选的、用于进一步细化上述组件的修饰语,如“当前”“法定”。
一个合法的数据元名称示例:“患者出生日期”——对象类=患者,特性=出生日期,表示=日期(无限定词)。标准强调命名必须简练且避免冗余,同一系统内不得出现不同含义却名称相同的数据元。
| 组件 | 必选 / 可选 | 示例 |
| 对象类 | 必选 | 客户 |
| 特性 | 必选 | 信用额度 |
| 表示 | 必选 | 金额 |
| 限定词 | 可选 | 剩余 |
| 完整名称示例:客户剩余信用额度金额 |
注意:对象类、特性、表示的次序在不同语言环境中可以调整,但同一注册系统必须采用一致的次序。中文环境下通常按“对象类+特性+表示”顺序,建议完全遵照标准附录中的语言模板。
2.2 唯一标识符结构
ISO/IEC 11179-5 规定每个数据元必须分配一个全局唯一的标识符,其结构为:
注册机构标识符 + 数据标识符 + 版本标识符
- 注册机构标识符(Registration Authority Identifier) — 例如“ISO”或组织代码。
- 数据标识符(Data Identifier) — 在注册机构内唯一的内部编码。
- 版本标识符(Version Identifier) — 反映标准演进,如“1.0”。
完整标识符示例:ISO/IEC 11179:2026::Customer.CreditLimit.Amount#1.0(样式可因系统而异,但必须保证在全局范围内唯一)。
| 标识符部分 | 说明 | 要求 |
| 注册机构标识符 | 分配该数据元的权威机构 | 由ISO 11179全球注册机构管理 |
| 数据标识符 | 机构内为数据元指派的唯一代码 | 固定长度或结构化编码 |
| 版本标识符 | 标识数据元版本演变 | 语义版本号或日期戳 |
强制性要求:标识符一旦分配,绝对不允许重复使用。即使数据元被废弃,其标识符也必须永久保留(可标记为“已弃用”),绝不可回收分配给其他数据元。这是确保元数据长期追溯性的底线。
2.3 数据元定义要求
标准对数据元的定义(Definition)提出了具体的语言学质量要求:
- 唯一性:一个定义只能对应一个数据元。
- 无循环性:定义中不能出现被定义术语本身。
- 充分性:必须明确描述所表示的事实、范围及任何约束。
- 一致性:使用标准术语体系,避免同义词歧义。
例如,数据元“患者血型编码”的定义应清晰说明“用于表示患者ABO血型及Rh因子的代码,取值范围参照ISO 11238标准”,而非简单说“血型”。
3. 实施与应用要点
在实施 ISO/IEC 11179-5 时,组织需建立元数据管理政策并将其嵌入数据治理流程。典型实施步骤包括:
- 成立注册机构(或指定现有机构),为组织分配注册机构标识符。
- 建立命名与标识的规范化模板,覆盖所有业务域。
- 部署元数据注册软件(如MDR工具或基于规范的自建数据库),严格校验命名/标识规则。
- 对历史数据元进行清洗与重命名,确保符合标准。
- 与外部系统交互时,通过统一标识符实现数据元的自动匹配。
实施效益:某跨国金融机构采用本法后,数据元重复率下降超过65%,跨系统数据映射时间由数周缩短至数小时。标准化的命名与标识使元数据成为真正的组织级资产。
常见陷阱包括:机械照搬命名结构导致名称过长(可借助限定词精简)、忽视跨语言命名冲突(中文与英文对应关系需显式记录)、版本管理不当(建议参照标准附录的版本策略)。
常见误区:认为标识符只是“代号”而忽略其语义。事实上,ISO/IEC 11179-5 鼓励在标识符中包含指向元数据的解析机制(如URI),使其成为数据元的永久定位符。
4. 与其他标准的关系
ISO/IEC 11179-5 是整个11179系列的有机组成部分,与其他部分紧密关联:
- ISO/IEC 11179-3(元数据注册系统基本结构)——提供了元数据项的组成模型,第5部分的命名和标识基于该模型中的“数据元”类。
- ISO/IEC 11179-6(注册管理)——定义了数据元注册的过程与角色,确保标识符的分配规范。
- ISO 8000 系列(数据质量)——要求数据元必须具有规范的标识和定义,直接引用11179-5的原则。
- ISO 10303-210(工业自动化系统与集成)——使用11179-5的命名方法构建产品数据元字典。
- DCAT(数据目录词汇) ——在开放数据目录场景中,推荐采用11179-5的标识符体系。
截至2026年,ISO/IEC JTC 1/SC 32工作组仍在持续更新该系列,以支持大数据、AI等新技术对元数据类型(如机器学习特征、数据集变量)的扩展需求。
常见问题 (FAQ)
问:ISO/IEC 11179-5 与 CAN CSA ISO IEC 11179-5-16 有什么区别?
答:二者技术内容完全相同。CAN CSA版本是加拿大标准委员会根据本国程序对ISO/IEC 11179-5:2016的采纳,仅在封面、版权声明和内部引用术语上进行了本地化编辑。在中国实施时可直接参考国际标准原文或采用ISO/IEC 11179-5:2016的中文翻译版。
问:一个数据元可以有多个名称吗?标准是否允许别名?
答:标准要求每个数据元只允许一个正式名称(Enumerated Name),但可以记录多个同义名称(Synonymous Name)用于不同语境或语言。不过标识符必须唯一且始终对应同一个正式名称。同义名称需要明确标注语境属性。
问:我们已经在使用其他元数据标准(如Dublin Core),如何转换到ISO/IEC 11179-5?
答:推荐采用映射表方式。首先将现有元数据元素按照11179-5的对象类、特性、表示进行语义拆解,再生成符合规范的名称和标识符。这种映射可以在元数据注册系统中保持双向转换能力,逐步迁移。Dublin Core的dcterms:title可以映射为“资源标题文本”(对象类=资源,特性=标题,表示=文本)。
问:版本标识符是否必须使用数字?如何管理频繁变动的数据元?
答:版本标识符推荐采用语义版本号(如1.2.3),但也可以使用日期戳(如2026-03-01)。标准强调版本标识符不能用于区分不同含义的数据元——如果定义发生实质变化,应产生一个新的数据标识符,而非仅升级版本。版本修订应遵循ISO/IEC 11179-6定义的注册状态机。