Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
FMEA的核心思想源自一个简单却强大的问题:“什么可能出错?出错了会怎样?我们如何预防?”这是一种自底向上的归纳分析方法,从最底层的元器件或过程步骤出发,逐步向上推演其失效后果,最终形成一份完整的风险地图。
IEC 60812:2018 明确了 FMEA 的七个核心步骤:
(1) 界定分析范围 — 确定系统边界、假设条件和分析粒度。这一步至关重要,因为“分析范围定义不清”是导致 FMEA 会议无限延长的头号原因。
(2) 结构分解 — 将系统分解为元器件、子组件或功能块。设计 FMEA 使用功能块图和BOM;过程 FMEA 使用流程图。
(3) 功能描述 — 对每个元素明确其设计意图和功能要求。
(4) 失效模式识别 — 列举所有可能的失效模式,考虑全生命周期条件(环境、负载、老化等)。
(5) 失效影响评估 — 评估每种失效对本地、中间和最终用户的影响。
(6) 控制措施识别 — 记录现有的预防性和探测性控制措施。
(7) 风险优先级确定 — 通过 RPN 或其他风险矩阵排序,确定优先改进项。
下表展示了一个标准的 FMEA 工作表结构,这是每个可靠性工程师必须熟练掌握的核心工具:
| 元器件/功能 | 失效模式 | 失效影响 | S | 失效原因 | O | 现行控制 | D | RPN | 建议措施 |
|---|---|---|---|---|---|---|---|---|---|
| 冷却液泵 | 轴承卡滞 | 电池包过热,车辆降功 | 8 | 润滑油衰变/污染 | 3 | 泵速传感器反馈 | 4 | 96 | 双泵冗余设计,增加油品检测 |
| IGBT 功率模块 | 短路 | 冷却系统失效,停机 | 9 | 过电压/热失控 | 2 | 电压监测+过温保护 | 3 | 54 | 增加 DESAT 保护电路 |
| 散热器芯体 | 堵塞 | 效率下降,逐步过温 | 6 | 沉淀物端壁结垢 | 5 | 温差传感器告警 | 7 | 210 | 增加过滤器,定期清洗维护 |
IEC 60812:2018 将 FMEA 分为两大主流类型,它们的关注点和分析单元截然不同:
分析对象:产品的物理设计(零部件、子系统、软件架构、材料选型等)。
核心问题:“这个设计可能以什么方式失效?”
典型场景:一家电动汽车公司的电池包设计团队在新款模组开发时,针对电芯、散热结构、BDU、BMS 主控等层级逐一开展 DFMEA,确保单点失效不会导致灾难性后果。
分析对象:制造、装配、测试、维护等过程步骤。
核心问题:“这个工序可能怎样出错?”
典型场景:SMT 贴片线的回流焊接工序,分析焊膏印刷偏移、温区设置异常、板卡变形等失效模式对焊点质量的影响。
RPN (Risk Priority Number) 是 FMEA 中最常用的风险排序指标,计算公式为:
RPN = S × O × D
其中 S = 严重度 (Severity),O = 发生频度 (Occurrence),D = 探测度 (Detection),每项通常取 1~10 分。
| 评分 | 严重度 (S) | 发生频度 (O) | 探测度 (D) |
|---|---|---|---|
| 1-2 | 微乎其微,用户无感知 | 极为罕见 (<1 ppm) | 几乎肯定探测 |
| 3-4 | 轻微,用户略感不便 | 很低 (10~100 ppm) | 高概率探测 |
| 5-6 | 中等,性能降级但可用 | 中等 (0.1%~1%) | 中等概率探测 |
| 7-8 | 严重,主功能丧失,安全风险 | 较高 (1%~5%) | 低概率探测 |
| 9-10 | 灾难性,人身安全或法规违规 | 很高 (>5%) | 几乎无法探测 |
IEC 60812:2018 在附录中明确指出了 RPN 方法的四大局限性:
① 乘积敏感性问题:RPN 是三个序数值的乘积,一个组合 10×2×5=100 和 5×5×4=100 得到完全相同的 RPN,但它们的工程含义截然不同——前者是灾难性但极罕见,后者是中等失效。
② 评分主观性:S/O/D 评分依赖团队经验,不同团队对同一失效模式的评分可能相差 30%以上。
③ “不均匀”分布:1~1000 的理论范围中,实际可用的取值只占少数离散点,大量组合在数学上永远不可能出现。
④ 阈值陷阱:设定一个“RPN阈值”(如 RPN > 100 必须改进)是危险的,团队可能为了“过审”而人为压低评分。
这是很多工程师容易混淆的一对概念。简单来说:
FMEA = 失效模式 + 失效影响
FMECA = FMEA + C (Criticality Analysis, 关键性分析)
关键性分析引入了两个额外维度:严重度等级和失效概率等级,并将它们投射到一张关键性矩阵中。这种方法源自美军标准 MIL-STD-1629A,在航空航天和军用领域仍然是必须要求。
| 维度 | FMEA | FMECA |
|---|---|---|
| 分析深度 | 失效模式+影响+RPN排序 | FMEA全部 + 关键性矩阵 |
| 风险表征 | 为主 (RPN) | 定量风险 + 定性关键性 |
| 典型应用 | 汽车 (AIAG-VDA), 通用工业 | 航空航天, 军用, 核电 |
| 输出核心 | 优先改进清单 | 关键项目列表 + 风险可接受性判决 |
| 标准体系 | IEC 60812, AIAG-VDA FMEA | MIL-STD-1629A, IEC 60812 (附录) |
IEC 60812 明确要求 FMEA 团队必须是跨功能的,至少包含:设计工程师、制造工程师、质量/可靠性工程师、测试工程师。最好还包括售后服务代表(提供现场失效数据)和供应商代表(提供元器件失效数据)。
一个合格的 FMEA 引导者(Facilitator)必须做到:
在 FMEA 会议中,最常见的对话之一是:“这个失效模式不会发生,因为我们设计已经考虑到了XXX。”这种“设计假设免疫”是 FMEA 失效的头号原因。优秀的引导者会反问:“请证明你的保护措施是独立于这个失效模式的。”