Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
ISO/IEC 26925:2013为信息技术系统建立了一个全面的数据质量模型,提供了一个标准化框架,用于在数据的整个生命周期中定义、测量和管理数据质量。随着组织越来越依赖数据驱动的决策制定,评估和确保数据质量的能力已成为一项关键的业务能力。该标准通过规定一组质量特征并提供如何在实际环境中测量和评估这些特征的指导来满足这一需求。
该模型建立在ISO/IEC 25012(软件产品质量的数据质量模型)的成熟概念之上,并以更广阔的视角进行扩展,涵盖了数据管理过程、数据治理框架和组织职责。标准定义了三个主要类别的数据质量特征分类法:固有数据质量、系统相关数据质量和数据质量管理能力。
| 质量类别 | 特征 | 关注点 |
|---|---|---|
| 固有数据质量 | 准确性、完整性、一致性、可信度、时效性 | 数据本身,与处理数据的系统无关 |
| 系统相关数据质量 | 可用性、可移植性、可恢复性 | 系统保持和交付数据质量的能力 |
| 数据质量管理能力 | 监控能力、执行能力、改进能力 | 组织管理数据质量的过程 |
固有数据质量特征代表了数据质量的基础属性。准确性衡量数据正确描述其所代表的现实世界实体或事件的程度——例如,数据库中客户的地址是否与其实际物理地址一致。完整性评估所有必需的数据元素是否都存在,同时考虑必填字段和提供上下文的可选元素。一致性验证数据在不同记录、数据库或时间点之间是否包含矛盾。可信度评价数据源和数据收集方法的可靠性。时效性衡量数据是否在可接受的时间窗口内反映了现实世界实体的当前状态。
系统相关数据质量特征解决了信息系统在保持数据质量方面的作用。可用性衡量在需要时数据可访问的程度,包括系统正常运行时间和数据检索性能。可移植性评估数据在不同系统或格式之间传输而不损失质量的难易程度。可恢复性评价系统在故障或损坏事件后将数据恢复到正确状态的能力,包括备份和灾难恢复能力。
数据质量管理能力特征定义了维持数据质量随时间的持续性所需的管理过程。监控能力指持续跟踪数据质量水平是否符合定义目标的能力。执行能力衡量组织通过验证规则、访问控制和流程控制防止质量下降的能力。改进能力评估解决数据质量问题的纠正措施和根本原因分析过程的有效性。
| 维度 | 测量方法 | 典型指标 |
|---|---|---|
| 准确性 | 与权威来源比对或物理验证 | 与参考匹配的记录百分比 |
| 完整性 | 已填充字段与预期字段的比例 | 必填字段已填充的百分比 |
| 一致性 | 跨记录和跨系统比较 | 每1000条记录中的矛盾数 |
| 时效性 | 上次更新至今时间与所需新鲜度的比较 | 在可接受时限内的记录百分比 |
| 可用性 | 系统正常运行时间和查询响应时间 | 99.9%正常运行时间,<500 ms平均查询时间 |
在实践中实施ISO/IEC 26925要求组织将抽象的质量模型转化为针对其特定数据资产的具体、可测量的质量要求。推荐的方法始于数据质量评估,以建立所有相关维度的基线质量水平,然后定义与业务需求一致的质量目标。这些目标应具体、可测量、可实现、相关且有时间限制(SMART原则),并应反映每个数据资产对业务运营的关键性。
标准中规定的测量框架提供灵活指导而非刚性规定。组织可以使用自动数据剖析工具来测量完整性和一致性,使用人工抽样和验证过程进行准确性评估,以及使用系统监控工具进行可用性和可恢复性测量。关键原则是测量方法应被记录、可重复,并自身接受质量保证——符合计量学原则,即测量系统必须至少与被测量的数据一样准确。
该标准还涉及数据质量管理的组织方面,包括数据管理责任的分配、数据质量审查委员会的建立,以及将数据质量指标纳入绩效管理系统。这些治理机制确保数据质量不被视为一次性项目,而是作为需要持续投资和管理关注的持续组织能力。