💡 标准概览:IEC 61124 由 IEC TC 56(可信性技术委员会)制定,是国际范围内最核心的恒定失效率/恒定失效强度合规性试验标准。它提供了基于指数分布(不可修产品)或齐次泊松过程 HPP(可修产品)的完整试验方案,覆盖序贯检验(SPRT)和定时截尾两大类方法,广泛用于国防、航空航天、工业控制、通信和交通运输领域中对 MTBF/MTTF 指标的统计验证。
1️⃣ 标准适用范围与恒定失效率假设
IEC 61124 的全称为 “Reliability testing — Compliance tests for constant failure rate and constant failure intensity”,中文译名为《可靠性试验——恒定失效率与恒定失效强度合规测试》,1997 年首次发布,最新版本为 IEC 61124:2024。该标准整合并取代了早期的 IEC 60605-7(定时截尾方案)和 IEC 61123(原序贯方案部分),将两类方法统一纳入同一规范性框架。该标准回答了一个可靠性工程中最基本的问题:给定 MTBF 指标要求,需要多少试验时间和多少故障次数,才能做出具有统计有效性的”接收/拒收”判定?
IEC 61124 的数学基础是:对于不可修产品,寿命服从指数分布,具有恒定失效率 λ(failure rate),其可靠度函数为 R(t) = e-λt,MTTF = 1/λ;对于可修产品,失效过程服从齐次泊松过程(HPP),具有恒定失效强度 λ(failure intensity),MTBF = 1/λ。标准将这两类对象统一处理——累计试验时间 T 和累计故障次数 r 是充分的统计量,决策规则完全一致。
⚠️ 前提条件审查:恒定失效率假设仅在浴盆曲线的”偶然失效期”(useful life period)成立——早期失效已被剔除、耗损失效尚未到来。将 IEC 61124 的试验方案应用于仍在发生早期失效或已进入耗损期的产品,会产生严重的误导性结果。在对可修系统应用本方案前,务必通过 Nelson-Aalen 累积风险图或 Laplace 趋势检验验证恒定失效强度假设是否成立。
标准明确区分两类产品:
- A 类(不可修产品):以 MTTF(平均失效前时间)或失效率 λ 为特征参数。每个样品试验至失效或指定的截尾时间。典型示例包括密封继电器、固态功率模块、电解电容器、火工品等。
- B 类(可修产品):以 MTBF(平均故障间隔时间)或失效强度 λ 为特征参数。失效后修复并重新投入使用,失效过程以 HPP 建模。典型示例包括雷达系统、工业机器人、数控机床、通信基站电源等。
无论是 A 类还是 B 类,累计试验时间 T 的解释方式有所不同(A 类为”样品数 × 试验时长”,B 类为”单台设备累计运行时间”),但统计决策规则完全一致——这是 IEC 61124 统一框架的核心优势。
2️⃣ 统计框架:风险、鉴别比与 OC 曲线
2.1 核心参数体系
IEC 61124 中每个试验方案由四个输入参数定义:
- θ₀(下试验 MTBF — LTR):生产方期望以高概率被接受的 MTBF 下限值。当真实 MTBF θ ≥ θ₀ 时,拒收概率应 ≤ α。
- θ₁(上试验 MTBF — UTR):使用方期望以高概率被拒收的 MTBF 上限值。当 θ ≤ θ₁ 时,接收概率应 ≤ β。
- α(生产方风险):真实 MTBF 合格时被误判拒收的概率。
- β(使用方风险):真实 MTBF 不合格时被误判接收的概率。
由此导出的鉴别比(discrimination ratio) d = θ₀ / θ₁ 是衡量试验方案分辨力的核心指标。d 越接近 1,分辨力越高,但所需的试验时间也越长。
✅ 工程洞察:IEC 61124 所有试验方案的底层数学关系可归结为卡方分布:对于给定接收数 c 的定时截尾方案,所需试验时长 T 必须满足 χ²2c+2, β / (2θ₁) ≤ T ≤ χ²2c+2, 1-α / (2θ₀)。这一关系是 IEC 61124 所有试验方案表背后的统计算法,每位可靠性工程师都应牢记。实际工程中,θ₁ × T 的乘积是方案设计的最关键驱动量。
2.2 决策规则
定时截尾方案的基本决策规则可表述为:在预定的累计试验时间 T 内,观测到的故障数记录为 r,若 r 不超过预定的接收数 c,则判定为”接收”;否则判定为”拒收”。其数学基础是 2r/θ 服从自由度为 2r 的卡方分布。对于序贯(SPRT)方案,判定边界由 Wald 序贯概率比检验导出,每次故障后实时更新累计试验时间与判定边界进行比较。
2.3 OC 曲线与方案比较
操作特性曲线(Operating Characteristic Curve, OC 曲线)L(θ) = P(接收 | θ) 是评估和比较试验方案最核心的工具。OC 曲线是 θ 的单调递增函数:L(θ₀) ≥ 1-α,L(θ₁) ≤ β。在相同 (α, β, d) 条件下,接收数 c 越大、试验时长 T 越长,OC 曲线越陡峭(鉴别力越强),但试验成本也越高。
| 鉴别比 d = θ₀/θ₁ |
生产方风险 α |
使用方风险 β |
接收数 c |
所需试验时间 (×θ₁) |
OC 曲线陡峭度 |
| 1.5 |
0.10 |
0.10 |
7 |
12.6 |
很高 |
| 2.0 |
0.10 |
0.10 |
5 |
8.2 |
高 |
| 2.0 |
0.20 |
0.20 |
2 |
3.9 |
中等 |
| 3.0 |
0.10 |
0.10 |
3 |
5.6 |
中等 |
| 3.0 |
0.20 |
0.20 |
1 |
2.8 |
较低 |
| 5.0 |
0.10 |
0.10 |
1 |
3.3 |
中等 |
🛑 关键陷阱:c = 0(零故障接收)方案看似诱人——试验时间短、成本低,但其 OC 曲线极为平缓。当 c = 0、T = 2θ₁、d = 2.0 时,在真实 MTBF 恰好等于 θ₀ 时的接收概率 L(θ₀) = 1 – e-T/θ₀ ≈ 0.63,远低于期望的 1-α = 0.90。这说明零故障方案虽然试验时间短,但鉴别力极差。选择方案前务必检查 OC 曲线,切勿被”短平快”的表象所迷惑。
3️⃣ 试验方案类型:工程选择与权衡
3.1 定时截尾方案(Fixed-Duration / Time-Truncated Plan)
定时截尾方案是工业界最常用的方案类型。累计试验时间 T 预先确定,试验在达到 T 时自动终止,根据期间观测到的故障数 r 与接收数 c 的比较做出判定。这种方案的最大优点是进度可预测——试验室可以精确安排资源、人员和交付日期。
标准附录为常见的 (α, β, d) 组合提供了预计算表。以 α = β = 0.10 的常见情况为例:
| 鉴别比 d |
接收数 c |
所需 T/θ₁ |
约 50% 接收概率处的 MTBF (θ₅₀) |
| 1.5 |
6 |
11.8 |
1.85 × θ₁ |
| 2.0 |
4 |
7.1 |
2.25 × θ₁ |
| 3.0 |
2 |
4.3 |
3.30 × θ₁ |
| 5.0 |
1 |
3.3 |
5.00 × θ₁ |
典型算例:某电源模块要求验证 MTBF ≥ 10,000 h(θ₀),使用方不接受 MTBF ≤ 5,000 h(θ₁ = 5,000 h,d = 2.0)。取 α = β = 0.10,从表中查到 c = 4,T = 7.1 × θ₁ = 35,500 台时。若同时试验 10 个样品,日历时长为 3,550 小时(约 148 天)。这个算例清楚地说明了高可靠性验证面临的现实——统计上有说服力的 MTBF 验证需要投入大量的试验时间。
3.2 序贯概率比检验方案(SPRT)
序贯方案在试验过程中实时监测故障数据,一旦累计证据足以做出统计结论就立即终止试验——无论是接收还是拒收。决策边界由 Wald 的 SPRT 理论基于指数分布推导得出:
判定边界方程(以累计试验时间 T 和故障次数 r 表示):
上边界(拒收线):T ≥ …(由 θ₀, θ₁, α, β 确定的线性函数)
下边界(接收线):T ≤ …(由 θ₀, θ₁, α, β 确定的线性函数)
每次发生故障时:
– 若累计 T(r) ≥ 上边界(r) → 拒收(MTBF 不达标)
– 若累计 T(r) ≤ 下边界(r) → 接收(MTBF 达标)
– 若位于两条边界之间 → 继续试验至下次故障或截尾点
平均样本量(ASN,以期望试验时间表示)是 SPRT 的核心优势。当真实 MTBF 恰好等于 θ₀ 或 θ₁ 时,ASN 通常仅为对应定时方案所需时间的 40%~60%。当真实 MTBF 显著好于 θ₀ 或显著差于 θ₁ 时,节省更加可观。
✅ 工程建议:SPRT 方案最适合以下场景——① 生产验收试验,生产方对产品质量有充分信心,期望快速通过;② 高价值系统试验,每小时的试验成本极高(如热真空舱内的卫星寿命试验);③ 试验进度灵活可调的情况。但 SPRT 需要试验团队在每个故障发生时实时跟踪累计时间和判定边界,对组织的可靠性数据管理能力有较高要求。
3.3 截尾序贯方案与方案选择策略
IEC 61124 提供了截尾序贯方案(truncated sequential plans),将最大试验时间设定在对应定时方案的 1.2~1.5 倍,避免最坏情况(真实 MTBF 落入模糊区)下试验无限期持续。
定时方案与序贯方案的工程权衡要点:
- 进度确定性:定时方案有精确的结束日期,合同约束下常为必需;序贯方案无法提前预知结束时间。
- 成本结构:试验成本以准备/搭建为主时,定时方案更易预算;以小时运行成本为主时,SPRT 的期望时间节省具有实际效益。
- 组织能力:SPRT 需要实时数据跟踪和即时决策能力,缺乏成熟可靠性数据管理的组织可能难以正确执行。
- 监管要求:部分受监管行业(如航空航天、核安全)的质量保证程序中明确要求使用定时截尾方案。
3.4 可修系统(B 类)的特殊考量
对于以 HPP 建模的可修系统,关键前提是每次修复必须将系统恢复到”与新无异”(as-good-as-new)的状态。如果修复不彻底——例如仅更换故障模块而相邻模块持续老化——失效强度可能不再恒定,试验方案的统计风险计算将失效。工程实践中建议:在更换 LRU(现场可更换单元)后记录替换部件的累计使用时间,并定期进行趋势检验以确认恒定失效强度假设仍然成立。
⚠️ 现场现实:完全”如新”的修复几乎无法实现。常见的工程折中是仅更换故障的 LRU,而不更换未故障部分。如果被更换部分占系统失效率的主导地位(如机柜中的电源模块),HPP 近似是合理的;如果未更换部分的衰老效应显著(如齿轮箱的机械磨损),则应质疑 HPP 假设的适用性。在后一种情况下,建议改用非齐次泊松过程(NHPP)模型或 IEC 60605-4 中的 Weibull 试验方案。
4️⃣ 工程实践经验与典型误区
基于 IEC 61124 在全球各行业数十年来的工程实践,以下是对试验方案设计和执行产生重大影响的几类典型误区与最佳实践:
- 混淆生产方风险与使用方风险:许多组织在制定试验方案时指定 α = 0.10,但实际将 β 隐含设定为 0.50 甚至更高。这意味着使用方有 50% 的概率接收一批真实 MTBF 低于 θ₁ 的产品——对于安全关键系统而言极为危险。两个风险必须同时明确约定。
- 忽略鉴别比:仅指定 θ₀ 而不指定 θ₁(或仅指定 α 而不指定 β),会导致试验方案的实际鉴别力完全未知。合同中必须同时约定 θ₀、θ₁、α、β 四个参数。
- 错误计算累计试验时间:对于同时试验的多台不可修产品,T = n × t(n 为样品数,t 为日历试验时长)。常见错误是将日历时间直接当作 T 使用,导致试验严重不足。对于 10 个样品同时试验 1,000 小时,累计试验时间是 10,000 台时而非 1,000 小时。
- 忽略试验环境代表性:加速试验条件改变了产品的实际失效率。除非加速模型(如阿伦尼乌斯模型、逆幂律模型)经过验证并得到各方认可,否则加速条件下的试验结果不能直接与规定的 MTBF 要求进行比较。
- 序贯试验未设截尾点:运行 SPRT 而不设置截尾点是常见的管理漏洞。当真实 MTBF 恰好落入鉴别比的模糊区时,试验可能无限期持续。截尾点必须在试验开始前以合同形式约定。
💡 实用经验规则:对于大多数工业应用,鉴别比 d = 2.0、α = β = 0.10(c = 4, T = 7.1 × θ₁)的方案提供了试验成本与统计严谨性的合理平衡。该方案在真实 MTBF 等于 θ₀ 时有约 80% 的接收概率,在真实 MTBF 等于 θ₁ 时有约 90% 的拒收概率。如果这一试验时长超出预算限制,优先考虑适当放宽风险水平(如 α = β = 0.20)而非缩小鉴别比——缩小鉴别比会在模糊区制造过大的仲裁空间,极易引发合同纠纷。
❓ 常见问题(FAQ)
❓ Q1:IEC 61124 与 IEC 61070(可用性符合性测试)有何区别?
IEC 61070 针对的是稳态可用度 A = MTBF / (MTBF + MTTR),同时涉及可靠性(MTBF)和维修性(MTTR)两个维度。IEC 61124 则纯粹聚焦于可靠性侧——仅验证恒定失效率或 MTBF 是否满足规定要求,不涉及维修时间。简言之:当合同要求为”MTBF ≥ X 小时”时使用 IEC 61124,当要求为”可用度 ≥ A₀”时使用 IEC 61070。若 MTBF 和可用度同时被指定,两个标准需要配合使用。
❓ Q2:IEC 61124 的试验方案能否应用于非指数分布?
不能直接应用。IEC 61124 的所有决策规则背后的卡方关系严格依赖于指数分布(或 HPP)假设。如果失效分布为威布尔分布(形状参数 β ≠ 1)、对数正态分布或其他非指数形式,直接套用本标准的方案会得出错误的 α 和 β 值。此时有以下选择:① 对产品进行充分的老炼筛选(burn-in),使工作期失效率近似恒定后再试验;② 使用适用于威布尔分布的专用试验方案(如 IEC 60605-4 或 MIL-HDBK-781 中的方法);③ 采用贝叶斯方法以适应任意失效分布。
❓ Q3:现场使用数据如何与 IEC 61124 试验方案结合?
现场数据可通过两种方式融入。第一种是作为先验信息引入贝叶斯框架:将现场观测到的 MTBF 估计值作为先验分布,正式试验数据更新得到后验分布。虽然 IEC 61124 的规范性文本未涉及贝叶斯方法,但这一做法在工程实践中已被广泛接受。第二种是作为正式试验的替代:如果已积累足够的现场运行小时数且运行条件已知,可以将现场数据视为等效试验,同样使用卡方框架进行 MTBF 下限估计。关键要求是现场条件必须与规定的运行剖面一致——过严或过松的现场条件都会导致可靠性估计偏差。
❓ Q4:如果试验因非技术原因(预算削减、设施问题)提前终止,数据如何处理?
提前终止而未能做出接收/拒收判定称为截尾试验(censored test)。如果终止原因是非信息性的(即与失效过程无关,如预算重新分配),截尾前累积的数据仍可用于计算 MTBF 的置信下限:单侧 100(1-α)% 置信下限为 θ_L = 2T / χ²(α, 2r+2)。但原定的接收/拒收判定无法做出——因为计划试验时长未能达到。如果终止原因是信息性的(如因故障率过高而叫停,或因故障率过低而提前结束),则截尾本身引入了估计偏倚,必须咨询专业的统计顾问进行处理。