IEC 62740:2015 — 根本原因分析(RCA)原则与流程

标准:IEC 62740 | 第1版 (2015-02) | ICS: 03.120.01
💡 核心观点:RCA的核心在于区分症状与原因。该标准提供了一个结构化框架,系统地将焦点事件追溯至其根本原因,实现预防性措施而非临时修补。

1. 范围与原则

IEC 62740 描述了根本原因分析(RCA)的基本原则,并规定了RCA过程应包含的步骤。标准确定了RCA技术的一系列属性,有助于选择合适的技术,并描述了每种技术及其相对优势和局限性。RCA用于分析具有积极和消极结果的焦点事件,但最常见于故障和事故分析。标准强调RCA本质上是事后分析——它调查已经发生的事件。事件的原因可能涉及设计过程、组织特征、人为因素和外部事件。

标准明确区分了直接因果因素(表面触发因素)和根本原因(分析目的相关的、没有前因的因果因素)。标准明确指出RCA的目的是系统改进,而非分配责任或追究过失。

✅ 核心理念:处理事件应基于理解根本原因,而非直接明显的症状。仅处理症状而不识别根本原因会导致故障反复发生和资源浪费。

2. 五步RCA流程

2.1 启动

RCA流程首先根据以下标准评估分析需求:影响重大的事件、多个类似的异常事件、参数超出公差范围,或涉及关键设备的故障。描述焦点事件,确定分析的目的和范围。关键要素是定义”停止规则”——即可以定义措施或不再需要额外因果证明的时间点。

2.2 事实确认

数据收集必须在证据消失之前完成。来源包括物理证据(故障组件)、照片/视频、来自监控系统的运行数据以及通过访谈获得的个人证词。标准强调访谈应侧重于数据收集而非过早讨论原因,且证据保存至关重要。

2.3 分析

此步骤通过组织收集的数据以系统地推导根本原因,确定焦点事件”如何”和”为什么”发生。分析包括组织证据、使用因果模型(屏障分析、Reason的瑞士奶酪模型、系统模型)寻找解释,并持续进行直至触发停止规则。标准指出因果因素可能涉及技术问题、人为因素和环境因素。

RCA技术 最佳应用场景 主要优势
事件与因果因素(ECF)图表 涉及时间序列的复杂事件 可视化因果时间线
故障树分析(FTA) 安全关键系统故障 演绎逻辑,定量概率
鱼骨图(石川图) 制造质量问题 直观,几乎不需培训
5Why分析法 简单、单一原因事件 快速,无需工具支持
屏障分析 安全/事故调查 识别缺失/不充分的控制措施

2.4 验证

全过程中的审查活动测试已识别的原因是否可以得到证实。独立评审评估完整性和正确性。在适当情况下,通过实验、模拟或统计方法确认因果假设。

2.5 纠正措施

推荐的措施必须评估有效性和现实可行性。纠正措施旨在改变焦点事件的可能性或后果,且不会引入新的不可接受风险。标准强调监测事件是否再次发生以评估措施有效性。

⚠️ 工程陷阱:常见的错误是在第一个貌似合理的原因处停止分析(”5Why陷阱”)。标准对停止规则的强调可防止在真正根本原因被识别之前过早终止分析。

3. RCA模型与技术

3.1 屏障分析

基于以下假设:焦点事件是由于危害源与目标之间的屏障缺失、失效或无效所致。屏障分为物理屏障(工程安全特性、防护罩、报警装置)和管理屏障(程序、培训、监督)。屏障分析工作表系统地记录了不良后果、危害源、本应阻止事件的屏障以及屏障失效机制。

3.2 Reason的瑞士奶酪模型

该模型将组织的防御层视为带有孔洞(弱点)的瑞士奶酪片。当所有层的孔洞对齐时——即潜在失效(隐藏的系统弱点)和主动失效(直接操作人员错误)的汇合——事件就会发生。该模型鼓励将因果因素的探索扩展至操作人员错误之外,包含组织和系统性问题。

3.3 系统模型

系统理论方法(包括STAMP/CAST)考虑人类在复杂社会结构中与技术的交互,受组织目标、政策、文化和外部压力的影响。这些模型特别适用于分析高度复杂的社会技术系统中的事件,传统的线性因果模型在此类场景中往往不够充分。

模型 核心假设 典型输出
屏障分析 屏障缺失/失效导致事件 屏障分析工作表
瑞士奶酪模型 潜在+主动失效对齐 因果因素层级结构
系统理论(STAMP) 控制约束不充分 社会技术控制结构

4. 工程设计要点

💡 工程师实用建议:

  • 技术选择至关重要:标准提供了全面的属性矩阵(表A.3),对12种技术在9项标准上进行评分。利用该矩阵选择最匹配事件复杂性、可用专业知识和所需严谨性的技术。
  • 人为因素整合:附录E提供了分析人员绩效的分类体系(TRACEr, HFACS)。据经验,70-80%的工业事件涉及人为因素——这些工具将主观归因转变为客观的因果分析。
  • 数据挖掘潜力:标准强调使用现代聚类分析识别跨多维数据集的偏差数据(离群点)。对于拥有大量运行数据的组织,这可以在重大事件发生前揭示新兴的故障模式。
  • 文档记录很重要:标准强调结论必须有文件化的证据支持。具有清晰因果链、证据引用和可追溯结论的结构化RCA报告既可辩护又可操作。

5. 常见问题解答

Q1: IEC 62740 与 ISO 31010 风险评估标准有何不同?

IEC 62740 专注于事后分析——调查已经发生的事件。ISO 31010 和风险评估标准侧重于事件发生前的前瞻性识别和评估。RCA技术识别过去事件的根本原因以防止未来发生,而风险评估评估潜在的未来事件及其后果。

Q2: RCA能否应用于积极事件(成功)?

可以。标准明确指出RCA可以分析具有积极和消极结果的焦点事件。分析成功结果有助于识别哪些做法正确,以便复制成功经验。这在项目管理和过程优化中尤为宝贵。

Q3: RCA推荐的团队组成是什么?

标准建议任命一名团队负责人,负责准备工作(技术选择、分析计划、场地设施)。团队成员应带来涵盖技术、人为因素和组织方面的多样化专业知识。与被调查事件的独立性对避免偏见至关重要。

Q4: 如何确定何时停止分析(停止规则)?

停止规则定义了在达到无法影响的因素(如天气、政府政策)之前可以确定纠正措施的时间点。应在启动阶段定义,并在整个分析的评审点进行细化。关键标准是:我们是否已经到达可以采取有意义的措施来防止再次发生的地步?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注