ISO/IEC 26136:2023 定义了 AI 系统的全面生命周期过程集,提供了一个从概念构思到退役的结构化框架。如同 ISO/IEC 12207 定义软件生命周期过程和 ISO/IEC 15288 定义系统生命周期过程一样,该标准调整并扩展了这些已建立的框架,以解决 AI 系统的独特特征——包括以数据为中心的开发、模型训练和评估、持续学习以及 AI 系统验证、部署和监控的特殊挑战。该标准认识到 AI 系统具有传统软件中不存在的独特生命周期阶段,例如数据收集和准备、模型训练和模型验证。
AI生命周期不是线性的,而是固有的迭代性。数据准备影响模型设计,进而揭示需要重新准备的数据质量问题。规划您的流程以容纳阶段之间的多个反馈循环。
与传统软件不同,AI系统可以在没有任何代码变更的情况下性能下降——通过数据分布偏移。您的生命周期过程必须包括对此独特故障模式的监控。
该标准将’退役’阶段确定为AI系统的特别重要阶段,因为即使在部署停止后,模型仍可能继续影响决策。正确的退役包括管理模型输出对依赖系统的下游影响。
结合MLOps实践考虑AI生命周期。该标准的过程结构自然映射到ML的CI/CD/CT流水线,其中’CT’(持续训练)是传统DevOps中独特的AI新增内容。
1. 生命周期过程分类
该标准将 AI 系统生命周期过程分为四类:协议过程(获取和供应)、组织项目使能过程(生命周期模型管理、基础设施管理、组合管理、人力资源管理、质量管理、知识管理)、技术管理过程(项目规划、项目评估和控制、决策管理、风险管理、配置管理、信息管理、质量保证、测量)和技术过程(利益相关者需求定义、需求分析、架构定义、设计定义、系统分析、实施、集成、验证、移交、确认、运行、维护、处置)。每个过程包括目的、成果和活动,并为 AI 特定方面提供了明确的裁剪指导。
特别关注AI系统的’利益相关者需求定义’过程。非技术利益相关者通常对AI能力抱有不切实际的期望。该标准通过迭代需求细化提供了管理这些期望的指导。
AI中的’验证’过程与传统软件不同,因为模型行为无法完全预先规定。该标准通过数据验证、模型验证和行为验证活动来解决这一问题。
AI系统的’配置管理’必须不仅跟踪代码,还要跟踪数据版本、模型版本、超参数、训练配置和评估结果。该标准建议将ML模型视为配置项。
‘维护’过程包括模型重新训练和微调,这在传统软件维护中没有直接模拟。该标准规定了模型性能监控和基于触发器重新训练的具体活动。
2. AI系统的关键技术过程
ISO/IEC 26136 中的几个技术过程与 AI 系统工程特别相关。实施过程包括数据工程(收集、准备、标注、增强)、模型工程(算法选择、架构设计、超参数优化)和模型训练(训练执行、检查点、收敛验证)。集成过程解决了将训练好的模型集成到更大的软件系统中的独特挑战,包括模型服务基础设施、推理 API、预处理和后处理流水线以及人机交互界面。确认过程超越了传统的验收测试,包括数据集验证、针对多个指标的模型性能验证、偏差和公平性评估、鲁棒性测试和可解释性验证。
| 技术过程 |
AI特定活动 |
传统类比 |
关键区别 |
| 实施 |
数据工程、模型训练、超参数调优 |
软件编码 |
以数据为中心、非确定性输出 |
| 集成 |
模型服务、推理API、预处理流水线 |
组件集成 |
模型版本管理、延迟约束 |
| 确认 |
数据集验证、偏差审计、鲁棒性测试 |
验收测试 |
统计性能、多指标评估 |
| 运行 |
模型监控、漂移检测、基于触发器的重训练 |
系统运行 |
无需代码变更的性能下降 |
| 维护 |
模型重训练、微调、迁移学习 |
软件维护 |
数据依赖、持续学习 |
| 处置 |
模型退役、数据治理、下游影响 |
系统停用 |
模型影响力持久性、数据血缘 |
该标准还介绍了 AI 特有或具有显著不同重点的过程。数据管理过程涵盖数据治理、数据质量管理、数据版本管理、数据溯源和数据权利管理——反映了数据在 AI 系统中的核心作用。AI 特定风险管理过程与 ISO/IEC 26135 集成,以解决模型特定风险,包括对抗性漏洞、数据投毒和反馈循环效应。该标准明确涉及人机交互设计过程,涵盖诸如自动化程度的适当水平、人工监督机制、AI 系统用户界面设计和用户培训要求等主题。
成功:实施 ISO/IEC 26136 的组织报告了 AI 系统质量、开发时间线可预测性和利益相关者满意度的显著改善。结构化生命周期方法通过早期发现数据和模型问题来减少返工,提供清晰的治理检查点,并通过定义的过程里程碑促进技术和非技术利益相关者之间的沟通。
3. 实施指导与裁剪
该标准认识到一刀切的方法不适用于所有 AI 系统,并提供了广泛的裁剪指导。对于低风险 AI 系统(例如内部分析工具),可能只需要最小的过程集,侧重于实施、基本验证和运行。对于高风险 AI 系统(例如医疗设备、自动驾驶车辆),则需要具有严格验证和确认活动的完整过程集。裁剪指导考虑了系统关键性、组织成熟度、项目规模、法规要求和技术成熟度等因素。该标准还提供了与其他相关标准的映射指导,包括 ISO/IEC 12207(软件生命周期)、ISO/IEC 15288(系统生命周期)、ISO/IEC 33001(过程评估)和 ISO/IEC 26135(AI 风险管理)。
从最小可行过程集开始,根据需要扩展。试图同时实施所有过程是压倒性的且适得其反。该标准的裁剪指导基于AI系统的风险分类提供了实用的起点。
过程测量对改进至关重要。定义过程度量(例如每次迭代的周期时间、模型验证通过率、数据质量分数),并使用它们推动持续过程改进。
尽早投资于工具基础设施。数据版本控制、实验跟踪、模型注册表和监控平台不是可选的奢侈品——它们是实施本标准定义的过程所必需的基础设施。
培训您的团队了解AI生命周期过程。习惯于传统软件开发的工程师需要理解AI开发的独特方面,特别是AI工作的实验性和以数据为中心的特性。
常见问题
Q: ISO/IEC 26136 与 ISO/IEC 12207(软件生命周期过程)有何关系?
A: ISO/IEC 26136 扩展并调整了 ISO/IEC 12207 以适用于 AI 系统。已经使用 12207 的组织会发现熟悉的过程结构,并增加了额外的 AI 特定活动和成果。这两个标准设计为一起使用,26136 为通用软件生命周期框架提供 AI 特定补充。
Q: ISO/IEC 26136 和 ISO/IEC 26137(验证)之间有什么区别?
A: ISO/IEC 26136 定义了从概念到退役的总体生命周期框架,包括所有过程。ISO/IEC 26137 特别关注验证过程——其方法、指标和验收标准。26136 在更广泛的生命周期上下文中引用 26137 以获取详细的验证要求。
Q: 该标准是否适用于更大非 AI 系统中的 AI 组件?
A: 是的。该标准提供了将其过程应用于混合系统中 AI 组件的指导。裁剪指导包括 AI 特定过程与宿主系统生命周期过程之间接口的考虑。
Q: 该标准如何解决持续学习系统?
A: 该标准明确涉及部署后持续学习的系统。它定义了这些系统所需的额外监控、数据管理和模型更新过程,包括防止灾难性遗忘和分布偏移的保护措施。
Q: 哪个过程成熟度模型适用于该标准?
A: 该标准与 ISO/IEC 33001(过程评估)框架保持一致。组织可以使用 26136 中定义的过程成果作为使用 ISO/IEC 330xx 系列标准进行过程能力评估和改进的基础。
Q: 该标准是否适用于使用 AutoML 或 AI 平台服务的组织?
A: 是的。裁剪指导包括使用自动化 ML 平台时减少过程集的规定,但强调监督和验证责任不能完全委托给自动化工具。