论文摘要
移动通信网络中网络设备类型繁多,使大数据量告警产生问题成为了影响网管系统稳定性的关键,因此,故障诊断与定位便成为网络管理的核心。当网络发生故障时,要求及时找到网络发生故障的位置和原因,以便快速地排除故障,恢复网络的功能。移动通信网络是由大量设备与链路互连组成的,其中一个部件的故障可能关联多个设备和链路,从而引发大量衍生的告警。因此,为保证快速、准确的发现、定位并处理故障,必须研究告警相关性分析机制,通过告警相关性分析生成告警树,快速、准确地分析出衍生告警和根告警。因此,告警相关性分析在网络故障管理中占据着重要的地位,是故障诊断的重要手段之一。本课题从实际项目需要出发,基于市场需求,应用数据挖掘技术,采用目前居于主流的基于规则的方法解决了移动通信网络中最急需解决的告警相关性分析问题。通过告警关联分析对告警震荡、告警闪断、告警风暴等方面进行控制和过滤,达到压缩或删除无关冗余告警和定位故障的目的。其中详细阐述了告警采集和处理的过程,尤其是与网络设备接口的部分。同时研究了各种相关性分析方法,并在理论模型的基础上设计出了告警关联分析平台,在原有告警系统的基础上增加了新的处理手段,使告警通过规则过滤器、规则维度分析器和规则归纳引擎进行解析,最终生成关联后的告警。结果证明能够减少60%到70%的告警量,有效地满足实际需要,减少工作量。