ISO 25018:2026 — 软件质量测量参考模型

规划与实施软件质量测量程序的实用指南

ISO 25018:2026 提供了用于规划、实施和评估软件质量测量程序的测量参考模型和实践指南。作为 ISO/IEC 25000 SQuaRE 系列的一部分,它聚焦于 2502n 测量部分,并以 ISO 25020(测量参考模型与指南)的基础概念为基础,扩展了针对现代软件开发环境的具体测量过程、质量度量定义和报告模板。

ISO 25018:2026 设计为与 ISO 25010(质量模型)和 ISO 25003(质量需求)配合使用。这三个标准共同构成了用于规范、测量和评估软件质量的完整质量工程工具包。

ISO 25018 在 SQuaRE 测量框架中的角色

ISO 25020 中定义的 SQuaRE 测量框架建立了三层架构:顶层为质量模型元素,中间层为质量度量,底层为测量函数。ISO 25018:2026 通过为 ISO 25010 中定义的每个质量子特性提供即用型度量定义,使这一架构可操作化。对于每个度量,标准规定了测量方法、测量标度、计量单位和解释指南。

2026 修订版引入了重要更新,以应对云原生和 AI 辅助软件系统中新出现的质量关注点。新的度量覆盖了模型准确度漂移、推理延迟变异性和容器编排可靠性等方面。这些新增内容反映了在机器学习运营(MLOps)和平台工程时代软件质量范围的持续扩展。

质量子特性 度量名称 测量函数 标度类型
时间行为 响应时间比 实测响应时间 / 规定响应时间 比率
容错性 故障避免有效性 1 -(运行期间故障数 / 总故障暴露数) 序数
可分析性 诊断功能完整性 已实现的诊断功能 / 规定的诊断功能 比率
可修改性 变更周期效率 实施变更的平均时间 / 计划时间 间隔
共存性 资源冲突频率 每1000小时共存期的资源冲突次数 绝对
可信性(新增) 预测置信区间 模型置信分数与真实值一致率 比率

测量程序设计的工程设计洞见

ISO 25018:2026 的一个核心工程洞见是测量目的对齐的概念。标准强调每个质量度量必须明确关联到特定的决策上下文。没有明确决策目的而收集的度量是组织浪费。因此,标准将度量分为三个决策层级:战略级(用于组合级质量投资决策)、战术级(用于项目级质量控制)和操作级(用于团队级质量改进)。

应用 ISO 25018 的三级度量分类法可帮助组织将测量开销减少 30-50%,方法是将不服务于实际决策过程的度量指标剔除。每个度量应回答一个特定问题;如果没有问题需要回答,就不需要度量。

标准还引入了测量信息模型,定义了原始数据如何转化为可操作信息。该模型规定:(1)直接从软件制品或过程中捕获的基础度量;(2)由两个或多个基础度量计算得出的派生度量;(3)根据预定义决策准则解释派生度量的指标。该模型防止了一种常见的反模式,即团队收集原始数据但未能将其转化为与决策相关的信息。

另一个关键设计洞见是测量重复性与再现性(R&R)要求。ISO 25018:2026 要求所有质量度量必须包含在规定条件下预期测量误差的说明。对于自动化度量(例如静态分析结果),误差来自工具配置的可变性。对于人工度量(例如可用性专家评分),必须记录评分者间信度。如果没有明确的 R&R 文档,测量结果无法跨时间段或组织边界进行比较。

实际实施:部署测量程序

基于 ISO 25018 实施测量程序涉及四个阶段。第一,规划——确定质量目标,从标准的目录中选择相关质量度量,并定义数据收集机制。第二,部署——将测量探针集成到 CI/CD 流水线中,配置仪表板,并培训团队数据收集流程。第三,运行——按预定义节奏收集基础度量、计算派生度量并生成指标报告。第四,评估——评估测量程序本身的有效性,识别不再服务于决策目的的度量并将其淘汰。

警惕测量功能失调:当团队以特定指标被衡量时,他们倾向于以牺牲更广泛的质量目标为代价来优化该指标。ISO 25018:2026 建议在多个质量特性之间维持平衡的度量组合,以防止对个别指标的游戏化操作。

在数据质量保证方面,ISO 25018:2026 提供了重要指导。测量数据在被用于决策之前必须经过验证。常见的数据质量问题包括缺失值、来自仪器故障的异常测量值以及来自非代表性抽样的系统偏差。标准提供了数据验证程序的指南,包括范围检查、相关度量间的一致性检查以及统计异常值检测。组织应在其测量流水线中实施自动化数据质量检查,以便在可疑数据点传播到指标计算之前标记它们。

问题1:ISO 25018 与 ISO 25020 有何不同?
A:ISO 25020 提供了基础的测量参考模型和概念,而 ISO 25018 提供了实用的、面向过程的指南,包含在 25020 框架基础上构建的具体度量定义、模板和实施工作流程。
问题2:ISO 25018 的度量能否在 CI/CD 流水线中自动化?
A:可以。ISO 25018 中定义的许多基础度量可以使用 SonarQube(可维护性)、JMeter(性能)和 OWASP ZAP(安全性)等工具实现自动化。派生度量和指标可能需要自定义脚本集成。
问题3:2026 版在 AI/ML 系统方面有哪些新增内容?
A:2026 版增加了针对 AI/ML 质量属性的特定度量,包括模型准确度漂移、预测置信度、训练数据偏差指标和负载下的推理延迟变异性。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注