Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
ISO 25018:2026 提供了用于规划、实施和评估软件质量测量程序的测量参考模型和实践指南。作为 ISO/IEC 25000 SQuaRE 系列的一部分,它聚焦于 2502n 测量部分,并以 ISO 25020(测量参考模型与指南)的基础概念为基础,扩展了针对现代软件开发环境的具体测量过程、质量度量定义和报告模板。
ISO 25020 中定义的 SQuaRE 测量框架建立了三层架构:顶层为质量模型元素,中间层为质量度量,底层为测量函数。ISO 25018:2026 通过为 ISO 25010 中定义的每个质量子特性提供即用型度量定义,使这一架构可操作化。对于每个度量,标准规定了测量方法、测量标度、计量单位和解释指南。
2026 修订版引入了重要更新,以应对云原生和 AI 辅助软件系统中新出现的质量关注点。新的度量覆盖了模型准确度漂移、推理延迟变异性和容器编排可靠性等方面。这些新增内容反映了在机器学习运营(MLOps)和平台工程时代软件质量范围的持续扩展。
| 质量子特性 | 度量名称 | 测量函数 | 标度类型 |
|---|---|---|---|
| 时间行为 | 响应时间比 | 实测响应时间 / 规定响应时间 | 比率 |
| 容错性 | 故障避免有效性 | 1 -(运行期间故障数 / 总故障暴露数) | 序数 |
| 可分析性 | 诊断功能完整性 | 已实现的诊断功能 / 规定的诊断功能 | 比率 |
| 可修改性 | 变更周期效率 | 实施变更的平均时间 / 计划时间 | 间隔 |
| 共存性 | 资源冲突频率 | 每1000小时共存期的资源冲突次数 | 绝对 |
| 可信性(新增) | 预测置信区间 | 模型置信分数与真实值一致率 | 比率 |
ISO 25018:2026 的一个核心工程洞见是测量目的对齐的概念。标准强调每个质量度量必须明确关联到特定的决策上下文。没有明确决策目的而收集的度量是组织浪费。因此,标准将度量分为三个决策层级:战略级(用于组合级质量投资决策)、战术级(用于项目级质量控制)和操作级(用于团队级质量改进)。
标准还引入了测量信息模型,定义了原始数据如何转化为可操作信息。该模型规定:(1)直接从软件制品或过程中捕获的基础度量;(2)由两个或多个基础度量计算得出的派生度量;(3)根据预定义决策准则解释派生度量的指标。该模型防止了一种常见的反模式,即团队收集原始数据但未能将其转化为与决策相关的信息。
另一个关键设计洞见是测量重复性与再现性(R&R)要求。ISO 25018:2026 要求所有质量度量必须包含在规定条件下预期测量误差的说明。对于自动化度量(例如静态分析结果),误差来自工具配置的可变性。对于人工度量(例如可用性专家评分),必须记录评分者间信度。如果没有明确的 R&R 文档,测量结果无法跨时间段或组织边界进行比较。
基于 ISO 25018 实施测量程序涉及四个阶段。第一,规划——确定质量目标,从标准的目录中选择相关质量度量,并定义数据收集机制。第二,部署——将测量探针集成到 CI/CD 流水线中,配置仪表板,并培训团队数据收集流程。第三,运行——按预定义节奏收集基础度量、计算派生度量并生成指标报告。第四,评估——评估测量程序本身的有效性,识别不再服务于决策目的的度量并将其淘汰。
在数据质量保证方面,ISO 25018:2026 提供了重要指导。测量数据在被用于决策之前必须经过验证。常见的数据质量问题包括缺失值、来自仪器故障的异常测量值以及来自非代表性抽样的系统偏差。标准提供了数据验证程序的指南,包括范围检查、相关度量间的一致性检查以及统计异常值检测。组织应在其测量流水线中实施自动化数据质量检查,以便在可疑数据点传播到指标计算之前标记它们。