(国网安徽省电力公司安庆供电公司安徽安庆246001)
摘要:随着供电公司信息化建设的不断推进,电力信息网络规模迅速扩大,各类业务应用进一步普及,主机的运行状态监测、性能监测和网络运行维护也愈发重要。通过对主机的监控数据的采集来实现对主机设备的实时监控,并对采集的多有日志、事件和告警信息统一完整存储,帮助企业和组织建立一个集中日志数据库,为故障排除和信息取证提高可靠性的来源和依据。
关键字:主机安全、性能监控、网络运行、预警
分类号:文献标志码:
1.引言
随着供电公司信息化建设的不断推进,电力信息网络规模迅速扩大,各类业务应用进一步普及,主机的运行状态监测、性能监测和网络运行维护也愈发重要。目前,公司主机服务器主要是Windows服务器,对主机的服务、进程、事件日志、性能、存储、网络流量、应用系统、基本配置等对象的运行监控基本上采用人工巡检和手工监测的方式,既耗费大量人力时间,又很难及时准确有效地发现主机的潜在隐患和故障,难以适应对信息网络运行维护一体化、自动化、精细化管理的需要。
因此,通过研制一个对主机设备综合监控的平台,实现主机设备及应用系统的监控、日志的集中收集及日志的分析与审计。通过对主机的监控数据的采集来实现对主机设备的实时监控,并对采集的多有日志、事件和告警信息统一完整存储,帮助企业和组织建立一个集中日志数据库,为故障排除和信息取证提高可靠性的来源和依据。进而保证设备与信息系统的安全稳定的运行。
2.工具原理及功能
工具原理如下:
工具采用B/S及监控服务相结合的模式,主要包括客户端(监控程序)、管理端,部署简单,集中部署,无需更改网络配置,不影响网络的正常运行。其中管理平台采用WEB架构,部署在应用服务器中。监控服务程序通过主动方式来实现网络的流量、延迟率、丢包率、主机服务、进程、事件日志、性能变化、硬盘可用空间、指定文件使用概况、WEB服务器、数据库服务器、数据库空间使用等来实时掌握主机的运行情况,确保主机和网络的正常运行。
工具具体功能如下:
(1)主机监控
主机监控主要通过WMI来获取主机的服务、进程、事件日志、性能变化、硬盘可用空间、指定文件使用概况、目录容量,随时跟踪了解主机的使用情况,达到对主机的实时监控
(2)主机网络监控
网络监控主要通过SNMP获取网络的流量,通过Ping指定目标地址的来获取网络的丢包率和延迟率
(3)主机应用监控
应用监控主要通过客户端对WEB服务器、数据库服务器、数据库空间使用进行实时监测来保证应用系统的正常运行。
(4)主机台账管理
主要是针对信通机房中的主机设备信息进行可视化展示,并支持基本信息的维护,同时根据设备信息进行主机网络监控维护。
(5)策略管理
主要是针对数据采集频率进行配置,监控服务可通过已制定的策略以定点或定频率实现对设备的监控。
(6)报警管理
设置报警的上下限显示报警数据包括CPU使用超过上限、内存使用超过上限、网络Ping不通。针对报警信息发送方式支持手机短消息、邮件等方式。
(7)报表管理
记录所有监测情况,包括异常发生时间、异常持续时间、异常类型等,最后以日报和月报的形式进行可视化展示,并将结果提交于运维人员。
3.技术路线
(1)通过Snmp协议对Windows服务器监测,检测Windows进程、Windows主机磁盘剩余容量和接口信息;
(2)编写WMI脚本实现自动任务管理,通过C++程序接口、.Net类等方法获取Windows操作系统的对象信息;
(3)通过WMI获取远程主机的Windows机基本信息;
(4)在web管理界面设置策略的基本信息并通过后台服务将策略推送到代理客户端,让其执行策略采集数据并反馈给后台服务;
(5)采用代理的方式,通过代理采集主机的对象信息,然后通过Socket或Webservice将数据发送给后台服务解析并存储到数据库,最后通过Web界面呈现给用户;
(6)采用平均值算法计算网络的流量、网络的延迟率和网络的丢包率。
4.总结
通过该项目的研究和成功应用,解决了运维人员通过人工巡检和手工监测的方式进行设备安全检测问题,实现了机房设备的智能化、自动化监控和管理,提高了运维人员工作效率,降低运维维护成本,减轻运行维护人员的劳动强度,实现科学、高效监控,确保机房设备的安全运行。同时也提高企业与组织对机房设备的安全运行的知识有了系统性学习,并对今后出现问题做到精准把控,处理故障的应急能力得到提升,体现良好的经济效益和社会效益。
参考文献:
[1]佘健,窦丽华,陈杰.基于SNMP协议的网络主机综合监控方法研究[J];北京理工大学学;2002,03
[2]王裕,终端安全检查系统终端信息和流量监测设计和实现[J],西安电子科技大学,2015
[3]刘广辉.计算机网络通信安全问题与防范策略探讨[J].信息安全与技术.2012(06).