CAN/CSA-ISO/IEC 11179-4:05 信息技术 元数据注册系统(MDR)第4部分:数据定义形成规范详解

深度解析数据定义的标准规则、实施要点及与其他元数据标准的关系(2026参考)

标准编号:CAN/CSA-ISO/IEC 11179-4:05(等同 ISO/IEC 11179-4:2004)
所属系列:信息技术 — 元数据注册系统(MDR)
制定机构:加拿大标准协会(CSA)采纳 IEC 和 ISO 联合标准

一、标准概况与适用范围

1.1 标准背景

ISO/IEC 11179系列标准为元数据注册系统(MDR)提供了统一的框架和方法论。第4部分专门关注数据定义的形成(Formulation of Data Definitions),旨在确保数据注册中每个数据元(data element)的定义都具有清晰性、一致性和无歧义性。CAN/CSA-ISO/IEC 11179-4:05是加拿大采纳的等同版本,与ISO/IEC 11179-4:2004在技术上完全相同。截至2026年,该标准仍然是全球数据治理和元数据管理的重要基石,尤其适用于需要跨系统交换数据的组织。

1.2 适用范围

本标准适用于所有参与元数据注册活动的人员,包括:数据管理者、数据标准化专家、系统分析师、数据库设计者以及信息管理政策的制定者。标准所定义的规则适用于任何领域的元数据注册,无论其技术实现平台如何。特别适用于以下场景:

  • 创建新的数据元定义并注册到元数据注册库;
  • 审核或修订已有数据定义的清晰性和合规性;
  • 跨系统或跨组织数据交换时防止定义歧义;
  • 培训数据定义编写人员。

二、主要技术内容与要求

2.1 数据定义的结构

标准规定一个完整的数据定义应包含以下必要成分:

组成部分 说明 示例
术语(Term) 被定义的数据元的名称 客户标识符
定义(Definiens) 使用陈述句准确解释术语的概念 分配给每个客户以唯一标识其身份的一组字符
概念表示(Conceptual Representation) 如需要,给出该数据元的值域或数据类型 字母数字字符串,最多20字符
示例(Example) 可选的非规范性说明 例如:CUST-12345
附加信息(Additional Information) 来源、引用、备注等 参考ISO 3166-1 alpha-2国家代码

2.2 数据定义的基本原则

标准提出了若干必须遵循的规则(以“应(shall)”表示的要求)和推荐做法(以“宜(should)”表示)。核心要求包括:

  • 独特性:在同一注册系统中,每个术语只能对应一个定义;
    强制性要求:定义不能包含歧义,不得在同一语境下为同一术语赋予不同含义。
  • 非循环性:定义不得直接或间接引用自身;
  • 使用通用词汇:应使用目标用户熟悉的常见词汇,避免不必要的专属术语;
  • 单义性:定义必须只表达一个含义,避免使用“和/或”、“等等”等模糊连接;
    常见误区:编写者常使用“包括但不限于”来扩展范围,这会损害定义的精确性,应使用明确列举或定义更大的概念。
  • 肯定表述:定义应以肯定形式陈述(如“是……”而不是“不是……”)。
遵循标准的好处:合规的数据定义能显著提升数据元在跨系统映射时的准确性,减少因释义不同导致的集成错误,是数据质量从源头治理的有效手段。

2.3 数据定义的语言风格

标准要求定义使用陈述句、现在时态、主动语态。定义开头通常为“<术语>是……”。例如正确的定义为:“交货日期是货物实际交付给承运人的日期。”而错误定义为:“交货日期就是发货日(忽略‘就是’模糊、同义重复)。”标准还禁止使用反义词否定形式作为定义。

实用技巧:在编写定义后,可以尝试从定义中反向判断是否只有一个术语能满足该描述。如果可能有多个概念,则说明定义需要收紧。

三、实施与应用要点

3.1 在元数据注册系统中的应用

在基于ISO/IEC 11179的元数据注册系统中,第4部分为数据元定义提供了质量准则。实施时建议:

  1. 组建定义审核小组,确保每条定义符合第4部分的要求;
  2. 建立定义模板,强制包含必要成分;
  3. 将合规性检查嵌入注册流程。

3.2 常见错误与改进

许多组织在初次实施时容易犯以下错误:

  • 定义过于宽泛(例如“记录客户信息”);
  • 使用同义词循环定义(例如“产品编号是产品的编号”);
  • 忽略概念表示或示例不足。
注意:元数据注册有效性依赖定义质量,如果定义不合格,后续整个元数据治理效果将打折扣。

3.3 标准对齐与审核

组织可以定期开展内部审核,参照CAN/CSA-ISO/IEC 11179-4:05对现有定义进行清理。建议引入自动化工具检查定义语句中的模糊词汇。对于新系统开发,应在数据建模阶段即引用本标准。

四、与其他标准的关系

本标准属于ISO/IEC 11179系列的重要组成部分。第1部分(框架与概念)定义了MDR的整体结构,第2部分(分类)规定了数据元的分类方案,第3部分(元数据基础)描述了元数据的基本属性,第5部分(命名原则)指导如何为数据元和数据概念命名,第6部分(注册)规定了将数据元纳入注册系统的程序。第4部分则为数据定义本身提供了形成规则。

集成提示:为了完全实现元数据互操作性,应将第4部分与第5部分(命名)结合使用,确保定义和命名一致。
此外,该标准可补充ISO 8000-110(数据质量:数据交换)中关于数据定义的清晰度要求。在语义互操作性领域,它与Dublin Core等通用元数据标准并无冲突,但提供了更具形式化的定义规则。

常见问题(FAQ)

问:CAN/CSA-ISO/IEC 11179-4:05与之后修订的版本有何异同?
答:加拿大采纳的05版基于2004年的ISO标准。后续ISO虽然对该系列进行了多次修订,但第4部分关于数据定义的基本原则与05版基本一致。使用05版仍能满足基本的数据定义质量要求,但建议结合最新国际版了解增补内容。本文以2026年视角回顾,该标准核心原则依然有效。
问:数据定义中是否允许出现厂商特定术语?
答:尽量避免。标准要求使用通用语言,如果必须使用特定术语,应在定义中附带解释或引用外部定义。否则可能破坏互操作性。
问:该标准是否适用于企业级的内部数据定义?
答:完全适用。虽然标准最初用于元数据注册系统,但其定义规则适用于任何需要精确数据定义的场景,包括数据字典、业务词汇表、API定义等。

©2026 本技术文章仅供学习参考。标准正式文本以CSA及ISO/IEC官方出版物为准。

📥 标准文件下载

🔒
请等待 10 秒,广告加载完成后将自动显示下载链接

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注