Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
ISO/IEC 25642:2023 定义了主数据管理(MDM)的参考架构——这是一套集成的流程、治理结构和技术能力,用于将企业的核心业务实体(客户、产品、供应商、位置、资产)作为可信、权威和可共享的资产进行管理。该标准提供了一个供应商中立的架构蓝图,组织可以使用它来设计、评估或提升其 MDM 能力。作为 ISO/IEC 数据管理标准家族(与关于数据质量的 25389、关于来源的 25422 和关于参考数据的 25434 并列)的顶峰,25642 将这些关注点整合到一个内聚的架构中。
参考架构分为五个层次:(L1)数据源层——创建和消费主数据的运营系统(CRM、ERP、SCM);(L2)MDM 中心层——摄入、清洗、匹配、合并和发布主数据的核心处理引擎;(L3)数据消费层——消费主数据的分析系统(数据仓库、BI、AI/ML)和运营系统;(L4)治理与管理层的——用于数据治理、质量监控和异常处理的工具和工作流;(L5)基础设施与安全层——身份管理、访问控制、加密和审计日志。
MDM 中心层(L2)进一步分解为七个功能组件:(1)数据摄入和解析、(2)数据清洗和标准化、(3)身份解析(匹配/合并/幸存)、(4)黄金记录创建和版本管理、(5)关系管理(层级结构和跨实体链接)、(6)数据分发和同步、(7)中心管理和监控。
| 层次 | 组件 | 关键工程考量 |
|---|---|---|
| L1 — 数据源 | CRM、ERP、SCM、遗留系统 | API 版本管理、变更数据捕获(CDC)、源头数据质量 |
| L2 — MDM 中心 | 摄入、清洗、匹配、合并、黄金记录 | 可扩展性(水平)、匹配算法准确性、延迟 |
| L3 — 消费 | 数据仓库、BI、运营应用 | 数据新鲜度 SLA、双向同步冲突 |
| L4 — 治理 | 管理控制台、质量仪表板、工作流 | 基于角色的访问、审计追踪、异常处理 |
| L5 — 基础设施 | IAM、加密、日志记录、监控 | GDPR 合规、数据驻留、静态/传输中加密 |
标准识别了五种 MDM 实施模式:(P1)注册表——仅存储标识符和指向源记录指针的轻量级索引;(P2)共存——中心与源记录并排存储黄金记录并通过 API 发布;(P3)交易中心——中心成为主数据交易的权威系统,源系统通过它转发写操作;(P4)复合——混合方法,某些实体使用注册表,其他实体使用交易中心;(P5)数据联邦——无中央存储;通过查询路由即时组装主数据。
对于大多数大型企业,复合模式(P4)最为实用。客户主数据因合规和隐私要求可能需要交易中心,而供应商主数据可能通过共存模式就能满足。标准提供了选择每种实体类型适当模式的决策标准(数据量、更新频率、一致性要求、监管约束)。
身份解析——确定两条记录是否指向同一现实世界实体的过程——是任何 MDM 系统中技术挑战最大的组件。标准推荐使用概率匹配方法(基于 Fellegi-Sunter 模型或机器学习分类器),而不是确定性匹配,除非是最简单的用例。匹配引擎应考虑多个属性并赋予权重、优雅处理缺失值,并生成匹配置信度分数。
黄金记录构建过程(幸存)定义了如何将来自多个源记录的冲突属性值协调为单个权威值。标准定义了五种幸存规则:(1)最近更新获胜、(2)最可信源获胜、(3)最长值获胜(针对字符串属性)、(4)特定源优先级(例如客户姓名以 CRM 优于 ERP)、(5)人工管理员覆盖。这些规则应为每个属性和每个源系统可配置。
暂无下载文件