Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
现代社会依赖通信网络来承载关键服务,涵盖电信、工业自动化、电网管理、交通和应急响应等领域。确保这些网络在所有条件下都能提供一致、可靠的服务,需要系统化的可靠性评估与保证方法。IEC 62673 为通信网络的可靠性评估与保证提供了标准化的方法论,涵盖了可靠性、可用性、可维护性和服务完整性等维度。本文探讨该标准的框架、关键参数和实际工程应用。
IEC 62673 将可靠性定义为一个集合术语,描述可用性性能及其影响因素:可靠性性能、可维护性性能和维护支持性能。对于通信网络,这一定义被扩展以涵盖网络特有的属性,包括连通性、吞吐量、时延和安全性:
| 参数 | 定义 | 测量方法 | 典型目标 |
|---|---|---|---|
| 连接可用性 | 请求时网络连接可用的概率 | 每5分钟端到端探测 | 99.999%(运营商级) |
| 平均服务中断间隔时间 | 影响服务的故障之间的平均间隔 | 网管系统事件关联 | >4,000小时 |
| 平均服务恢复时间 | 故障后恢复全部服务的平均时间 | 工单分析 | <2小时 |
| 数据包丢失率 | 丢失与传输数据包之比 | 使用测试流的主动测量 | <0.1% |
| 呼叫完成率 | 成功完成的呼叫尝试百分比 | 按ITU-T E.411的交换测量 | >99% |
| 服务恢复成功率 | 成功的恢复尝试百分比 | 自动保护切换计数器 | >99.9% |
IEC 62673 规定了涵盖六个阶段的全面方法论,适用于从规划到退役的整个网络生命周期:
IEC 62673 通过架构设计、运营实践和定量管理的组合,为在通信网络中实施可靠性提供了工程指导:
| 设计策略 | 实施方式 | 可靠性效益 |
|---|---|---|
| 物理多样性 | 冗余链路的独立物理路径 | 消除光缆中断导致的单点故障 |
| 地理冗余 | 相距>50公里的灾备站点 | 抵御区域性事件 |
| 协议多样性 | 使用多种路由协议 | 缓解特定协议的软件缺陷 |
| 自动保护切换 | 环网拓扑50ms恢复 | 满足运营商级可用性要求 |
| 负载分担与限流 | MPLS-TE流量工程 | 防止拥塞相关故障 |
| 优雅降级 | 基于优先级的呼叫准入控制 | 过载时保护关键服务 |
IEC 62673 补充了 ITU-T E.800系列关于服务质量的建议。ITU-T 主要关注服务级性能测量,而 IEC 62673 提供系统级的可靠性评估方法论,将可靠性工程原理与网络特定特性相结合。这两个框架应结合使用以实现全面的网络可靠性管理。
可以,该标准的方法论与技术无关,适用于所有通信网络类型,包括移动网络、无线局域网、卫星和固网。但无线网络引入了额外的可靠性挑战,包括无线电传播变异性、切换失败和频谱干扰,这些必须纳入故障模式与影响分析和建模阶段。
IEC 62673 建议网络级可靠性评估的最短数据收集周期为12个月,但对于高可靠性目标的系统,24–36个月更为理想。较短的周期可能适用于组件级评估或识别即时运营问题。
SDN引入了独特的可靠性挑战,包括控制器冗余、流表一致性和控制信道可靠性。标准的分层评估框架非常适合SDN:控制层和数据层可以分别评估,特别关注作为关键可靠性点的控制-数据接口。考虑到SDN控制器作为潜在的单点故障,标准建议对其实施扩展的故障模式与影响分析。