ISO/IEC 10164-7:1995 信息技术 开放系统互连 系统管理 第7部分:告警报告功能

统一网络告警管理的国际标准——解析告警类型、服务定义与实施要点

标准概况与适用范围

ISO/IEC 10164-7:1995(等同 ITU-T X.736)是开放系统互连(OSI)系统管理领域的重要标准,专门定义了告警报告功能(Alarm Reporting Function)。该标准是 OSI 系统管理功能集(ISO/IEC 10164 系列)不可或缺的部分,为不同厂商的网络管理系统提供统一的告警表示、报告与控制机制。自 1995 年首次发布,历经 2004 年确认,至今仍是许多专用网络(如电信管理网络 TMN、SDH、ATM)故障管理的基础参考模型。从 2026 年的技术演进视角来看,该标准的核心框架仍具指导意义,尤其适用于需要标准化告警互操作的异构环境。

本标准适用于所有基于 OSI 管理框架(ISO 7498-4)的系统,包括使用 CMIP 协议的管理域。同时,通过 CMOT(TCP/IP 上的 CMIP)等技术,也可用于 TCP/IP 网络。标准为管理应用提供了定义告警类型、严重性级别以及报告流程的通用语义,使得不同管理域能够交换一致的故障事件。

主要技术内容与要求

告警报告服务定义

告警报告服务基于 CMISE(ISO/IEC 9595-1)的 M-EVENT-REPORT 服务原语,支持被管对象向管理者主动发出告警通知。服务可分为确认型(confirmed)与非确认型(unconfirmed),前者要求接收方回送响应以保证可靠性。标准详细规定了服务参数,包括告警类型、严重性级别、检测时间、告警源对象实例等。

告警类型

标准定义了五大类告警,每类包含若干具体问题类型,覆盖通信、服务质量、处理、环境和设备领域。下表总结了各类型的描述与典型示例:

告警类型描述示例
通信告警(Communication)与通信过程相关的问题连接建立失败、协议错误、链路中断
服务质量告警(Quality of Service)性能下降或服务质量越限响应时间超过阈值、丢包率过高
处理告警(Processing)软件或处理逻辑错误进程异常终止、内存溢出、看门狗超时
环境告警(Environmental)设备环境条件异常温度过高、湿度超标、电源故障
设备告警(Equipment)硬件设备故障或退化磁盘坏道、接口卡失效、风扇停转

每大类下还细分了具体的问题类型(problem),如“通信告警”下包括“建立失败”“释放失败”“协议错误”等。

严重性级别

告警严重性级别(perceived severity)用于描述故障的影响程度,标准定义了五个级别:

  • 不确定(Indeterminate) —— 无法判定严重程度
  • 严重(Critical) —— 影响基本服务,需要立即采取行动
  • 主要(Major) —— 严重影响服务,需紧急处理
  • 次要(Minor) —— 局部或轻量影响,仍需关注
  • 警告(Warning) —— 潜在问题或非关键条件

标准要求每次告警报告必须包含一个严重性级别,以支持管理者按优先级处理。

管理对象类

为承载告警信息,标准定义了 alarmRecord 管理对象类及其相关包。该类包含以下关键属性:

  • alarmId —— 告警实例的唯一标识
  • alarmType —— 告警类型(通信/服务质量/处理/环境/设备)
  • probableCause —— 可能的原因限定符(如“连接建立失败”)
  • perceivedSeverity —— 感知严重性
  • eventTime —— 检测告警的时间戳
  • notifyObjName —— 发出告警的被管对象名称
  • additionalText —— 补充描述文本

此外,alarmSummaryControl 对象类提供对告警报告行为的控制,如是否允许自动报告、过滤条件等。

注意: 尽管实现可能扩展附加属性,但符合标准时必须保证上述核心属性(尤其是 alarmType、perceivedSeverity、eventTime)的完整性,以确表面向 CMIP 的互操作性。

实施与应用要点

符合性要求

声称符合 ISO/IEC 10164-7 的系统,必须支持告警报告服务并至少实现 alarmRecord 对象类的某个包。通常建议同时支持告警类型分类和严重性级别,以便管理者进行有效的事件关联。实施时可以参考 GDMO 模板(ISO/IEC 10165-4)对管理对象进行定义。

与 CMIP/X.700 系列的集成

告警报告直接利用 CMIS/CMIP 的 M-EVENT-REPORT 服务。开发者需确保被管代理(agent)中的被管对象能够构造符合标准语义的通知参数,并正确编码传输。常见的集成模式包括:

  • 在 TMN 网元中,利用告警报告向上层操作系统(OS)传递故障信息;
  • 在 SDH 设备管理中,将告警映射为标准通信和设备类告警;
  • 在综合运维平台中,将不同厂商的告警规范化为标准 alarmRecord 格式。
实用提示: 在实现告警抑制(alarm suppression)机制时,可利用 alarmSummaryControl 动态修改告警报告的门限与条件,有效防止告警风暴。
强制性要求: 告警严重性级别的选择必须基于故障对服务影响的真实评估,错误分类将导致高层管理者无法正确判定故障优先级,可能延误关键处理。标准明确要求不得以任意方式篡改严重性级别。
标准实施效益: 采用统一的告警报告功能标准,网络管理系统可无障碍交换故障信息,降低集成成本,提升运营故障响应效率,为自动化运维提供了可靠的数据基础。

与其他标准的关系

ISO/IEC 10164-7 是 OSI 系统管理功能集(Systems Management Functions)的一部分,与其他标准密切相关:

  • ISO/IEC 10164-5(事件报告管理) —— 定义事件报告转发与存储策略,告警可作为事件类型之一被传递至日志。
  • ISO/IEC 10164-6(日志控制) —— 提供记录告警事件的日志管理功能,可实现告警历史查询。
  • ISO/IEC 10164-1(对象管理) —— 管理对象生命周期的基本操作,告警受管对象本身遵循对象管理规范。
  • ISO/IEC 9595 / 9596(CMIS/CMIP) —— 告警报告依赖这些协议进行通信。
  • ITU-T X.733 —— 与 ISO/IEC 10164-7 内容等同,广泛用于电信领域。

此外,该标准定义的告警分类被许多后续标准引用,如 ITU-T M.3100(TMN 信息模型)采用其告警类型定义。

常见问题

问:ISO/IEC 10164-7:1995 主要解决了什么问题?
答: 该标准解决了异构网络管理系统中告警信息表示不统一的问题,通过对告警类型、严重性级别以及报告机制的标准化,使得不同厂商的网管系统可以理解彼此发出的故障事件,实现互操作与集中故障管理。
问:告警严重性级别是如何划分的?
答: 标准定义了五个级别:不确定、严重、主要、次要、警告。严重性级别通常由被管对象根据故障影响程度设定。管理者可利用这些级别进行告警优先级排序和自动处置。
问:本标准与 CMIP 的关系是什么?
答: 告警报告服务基于 CMIP 的 M-EVENT-REPORT 服务原语实现。CMIP 提供通用的管理通信机制,而 ISO/IEC 10164-7 在其上定义了具体的告警语义和对象类,两者结合构成完整的告警功能。
问:该标准在 2026 年还有实际价值吗?
答: 虽然已发布多年,但其告警分类、严重性模型及管理对象定义仍被大量现有网络设备所遵循,特别是在 SDH、ATM、Tetra 等传统领域。对于需要与遗留系统集成的现代管理平台,理解这一标准依然十分必要。

📥 标准文件下载

🔒
请等待 10 秒,广告加载完成后将自动显示下载链接

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注