包文仁
甘肃省永靖县刘家峡水电厂甘肃永靖731600
摘要:程控数字交换机是电力系统交换网的核心,对电网安全稳定运行起强大技术支撑作用,确保程控交换机可靠运行,是每一个程控交换机运维人员的神圣职责,本文就程控交换机故障处理方法做深入探讨。
关键词:程控数字交换机;故障;处理方法
引言
程控数字交换机是电力系统交换网的核心设备,涵盖行政交换网和调度交换网领域,为电力系统稳定运行的起技术支撑作用。程控数字交换机故障的定位和排除,作为运维人员首先应该掌握程控数字交换理论;其次应该熟练掌握所辖交换机的配置、告警机制等;最后应该熟练掌握交换机与其他外部设备的通信接口、规约等。
下面就依美国哈里斯程控数字交换机为例对程控数字交换机故障处理原则及常用故障处理方法作深入探讨。
1故障处理原则
1.1先外部,后内部。即先排除外部设备故障,再处理交换机侧故障。
1.2先大告警,后小告警。即先处理当前告警级别最高的故障,再处理级别低的故障。
1.3先全局,后局部。即先处理系统性的故障,再处理单板性的局部故障。
1.4先硬件,后软件。即先排除硬件故障,再处理软件故障。
2故障处理方法
2.1根据维护终端及电路板所提供告警信息判断故障性质
程控数字交换机均提供了非常丰富的告警开销,通过对这些信息的分析,可基本上判断出故障的类型和相应的位置。使用这种方法的关键是要熟练掌握各种告警信息、面板指示灯的含义,以达到及时、真实、准确地获取故障信息。
2.2仪表测试法判断故障
仪表测试法对排除交换机故障比较适用,比如怀疑交换机供电电压不稳或接地电阻有问题,可使用万用表进行测试。如果怀疑交换机某个2Mbit/s中继性能不好,可使用2Mbit/s误码测试仪进行挂表测试。如怀疑交换机中继接口码型不好,可用示码器对接口码型进行实时观测。仪表测试法判断故障范围,说服力强、直观,尤其在处理与外部设备对接故障时,能快速将故障定位到传输设备侧或交换设备侧。
2.3环回法判断中继故障
环回法在传输设备的故障定位中应用最为广泛,对于交换机而言,使用环回法可以快速定位是交换机侧故障还是传输侧故障。比如对数字2M中继,通过对该中继板进行自环,如果交换机告警消失,则说明是传输故障(如误码、闪断等),如果告警仍然存在,则说明是交换机或中继接口存在问题(如中继板性能不稳,2M背板转换器接触不良,端口板坏等)。该方法操作简单,易于掌握,能够快速将交换设备与传输设备对接时的故障区分出来。但是该方法的最大缺点就是势必造成中继电路的中断,所以该方法在局间单一路由或通话高峰时不宜使用,只有在话务空闲或中继电路已经中断时才使用。
2.4利用硬件替换法排除故障
替换法就是利用一块正常的电路板去替换被怀疑不正常的电路板,从而达到快速定位和排除故障的目的。
替换法适用于中继接口,服务接口和用户接口及调度台故障的快速判断。如怀疑某一2M中继板性能不良时,可用备用2M板进行替换检查。如果某一调度台出现功能紊乱,摘不了机,甚至常振铃时,可用备用调度台进行替换检查。在做以上替换时,如果故障消失,则说明是单板或调度台有问题,如故障仍存在,则说明被怀疑单板或调度台没有问题,需要进行进一步判断检查。
采用替换法可使系统快速恢复正常,但对设备备品备件有一定的要求,所以要做好关键电路板的备品备件。对于同系列交换机而言,同型号电路板可互为备用。
2.5复位法
所谓复位法就是对系统进行重新初始化,让软件重新加载。对于交换机操作系统而言,复位可使系统硬盘上的软件重新加载进内存中。对于单板而言,复位法可使板载CPU重新初始化。通过复位法可以快速排除诸如软件紊乱、系统阻塞、死机等故障。复位法有硬件复位和软件复位两种方法,其中硬件复位有使用复位按钮复位和断电复位(拔插法)两种。其中以断电复位法使用的尤为广泛,但断电复位法的使用是在可允许带电拔插的板件中,其它板件不允许用此法。比如某一调度台出现手柄摘不了机,拨不到其他电话,但同组的另一个调度台却使用正常,这时将两调度台现场替换,故障依旧,交换机的相关数据未曾做过改动,此时可将该组调度台所接2B+D接口板BRI板拔插复位,调度台恢复正常。分析是由该板CPU数据阻塞引起。又比如交换机出现大范围功能紊乱时,可使用切换机架或关、开公共控制机架电源,以排除一些不明原因的故障。
2.6数据库恢复法
哈里斯交换机有两个完全独立的数据库,一个用来呼叫处理,另一个用于工作库的完全备份。在日常维护中要做到A、B两库的数据完全一样,且做好备份工作。备份法有两种,一种是硬盘备份法,即在硬盘上对A库或B库做硬拷贝。另一种是软盘备份,即将数据库和杂项文件拷贝到软盘上。如果交换机出现因误操作导致严重故障时,可迅速激活备份数据库以使系统尽快恢复。如果出现系统瘫痪需重敲数据库时,可用软盘恢复系统,免除重敲数据库之苦,缩短故障时间。因此在日常维护中,要求维护人员及时做好数据库的打印和备份,尤其是在重大修改前一定要养成对正常数据库的备份习惯。
2.7改变配置法
改变配置是指改变硬件配置和软件参数配置,硬件配置改变,主要是指电路槽位的改变。比如某一2M中继背板连接器出现问题时,可将该2M板所在的槽位修改到其他槽位,使该2M尽快畅通。软件配置改动是指将出局路由相关控制数据进行修改。比如出现某中继吊死或经常掉线时,可修改该中继相应的控制器服务级别,使其拆线方式为“N”,可排除中继掉死故障。
2.8经验法
有时候交换机在运行中会莫名其妙出现一些故障,故障出现前维护人员未做任何操作。这些故障的出现,可能是由于瞬间供电异常,强电干扰或者软件BUG引起,造成公共控制系统功能紊乱或某些单板进入异常工作状态。此时可能有告警信息,也可能没有任何告警信息,检查数据库又完全正常。此时可综合利用积累的经验,通过掉电重启、切换机架、更换电路板、单板复位、恢复相关数据等及时排除故障。
2.9数据库呼叫流程分析法
在某些情况下,由于维护人员误做数据,导致系统出现问题,不能正常呼叫处理。此时按照局内电话、局间电话呼叫流程,通过对交换机数据库的分析,可找出有错误的地方,进行正确修改。该方法要求维护人员要熟练掌握交换机数据库表的编辑及呼叫信号在各表的流转过程。
2.10断开负载法
如果交换机某层机架电源损坏,而又无备件更换,且该机架所带负载为重要负载(如重要中继,调度电话等)时,此时可将损坏机架电源模块断开,而将该机架供电端子并接到正常机架的供电电源上。为防止过负荷,可将正常机架的一部分次要负载断开,以确保重要电话畅通。该方法可做为应急之需,但要及时修复电源模块或购置换新,并尽快恢复原接线方式。
2.11厂家技术支持法
交换机厂家拥有较强的技术支持能力,碰到疑难故障时,可利用服务热线寻求厂家技术支持,结合现场实际情况利用厂家技术指导快速排除故障。
2.12电话诊断程序法
利用交换机自带的诊断程序,对用户电路,中继电路进行内、外部测试,可对用户电路、中继电路进行强拆、置忙等处理。
以上各种故障处理方法各有其特点,在实际使用中,运维人员要因地制宜,结合实际故障现象,综合运用各种方法,完成故障的定位和排除。。
参考文献:
[1]《程控交换原理》陈锡生编著人民邮电出版社
[2]叶敏.《程控数字交换与交换网》北京:北京邮电大学出版社,2001
作者简介:
作者简介:包文仁;男,1968年9月出生,通信工程专业毕业,工程师,从事电力系统通信管理工作。