Internet服务故障管理

Internet服务故障管理

论文摘要

随着Internet逐渐向面向服务体系架构(SOA)演化,服务提供商(SP)开始发现Internet服务能带来潜在的高额利润,因此,近年来出现了各种各样的Internet服务,如IP电话、IP电视、视频点播、网络游戏、VPN等。为了维持已有顾客群并吸引更多新用户,SP需要保证所提供服务的服务质量(QoS)。 故障管理对于服务QoS保证非常重要,服务的不可用或性能降级都会引起SLA(Service Level Agreement,服务等级协定)违约,影响SP的信誉,并造成经济损失。因此,SP需要面向服务的故障管理机制,在服务发生故障时能迅速定位故障并采取相应措施,以缩短服务宕机时间和性能降级时间。本文围绕着Internet服务的故障管理体系及其相关算法进行了研究,研究的侧重点在于基于图论技术的服务故障诊断,服务故障传播模型建立,故障定位算法的分析和改进,跨多个自治域的服务故障管理框架、以及基于资源规划的服务性能降级故障处理。论文的主要工作包含以下几个方面: (1) 分析造成服务故障的复杂原因,比较了现有的故障诊断技术,选择图论技术作为本文研究的理论工具,采用二分图作为服务的故障传播模型,提出了分层的故障传播模型,并提出了建模方法。分层模型通过将故障管理任务划分到多个独立的层次,简化了故障诊断过程。 (2) 将二分图故障传播模型的故障诊断问题转化为集合覆盖问题,借鉴启发式贪婪算法,设计了最大覆盖算法MCA和MCA+。MCA和MCA+算法是基于时间窗口的,其中MCA+算法是MCA算法的扩展版本,综合考虑了丢失和虚假症状对故障诊断造成的影响。仿真结果证明了MCA和MCA+算法能够获得比现有算法更高的故障检测率和更低的误判率,并且算法稳定,计算复杂度较低。 (3) 为了改进基于时间窗口算法在时间窗口设置不合适的情况下的性能,提出了多时间窗口故障诊断算法MFD。基于时间窗口的算法存在着固有缺陷,即算法的准确度依赖于时间窗口的设置值。MFD算法在MCA+算法的基础上增加了相邻时间窗口关联关系分析,能在一定程度上克服时间窗口设置不准确对算法造成的影响。仿真结果表明,MFD在时间窗口设置准确的情况下能获得与MCA+类似的性能;而在时间窗口设置不准确(包括大窗口和小窗口)的情况下,MFD算法能获得比MCA+算法更高的故障检测率和更低的误判率,并且其算法复杂度与MCA+相同。 (4) 分析了在多域异构网络环境中服务故障管理存在的问题,提出了基于PDB

论文目录

  • 中文摘要
  • ABSTRACT
  • 目录
  • 图目录
  • 第一章 绪论
  • 1.1 引言
  • 1.2 基本概念
  • 1.3 国内外发展动态
  • 1.3.1 工业界发布的服务故障管理产品
  • 1.3.2 服务故障管理相关研究组的研究工作
  • 1.3.3 症状数据的收集以及对故障特性的研究
  • 1.3.4 故障诊断
  • 1.3.5 故障恢复
  • 1.3.6 移动网络的故障管理
  • 1.4 本文的主要贡献
  • 1.5 本文的结构和安排
  • 1.6 本章参考文献
  • 第二章 分层故障管理模型
  • 2.1 服务故障成因
  • 2.2 INTERNET服务分层故障管理模型
  • 2.2.1 为什么要分层?
  • 2.2.2 分层故障管理模型
  • 2.3 各层故障管理场景建模
  • 2.3.1 故障诊断的常用技术
  • 2.3.2 理论方法和故障传播模型的选择
  • 2.3.3 服务故障管理场景建模方法
  • 2.4 小结
  • 2.5 本章参考文献
  • 第三章 最大覆盖算法MCA和MCA+
  • 3.1 引言
  • 3.2 故障定位算法的形式化定义
  • 3.3 二分覆盖问题
  • 3.4 最大覆盖算法
  • 3.4.1 MCA
  • 3.4.2 MCA+
  • 3.4.3 算法复杂度
  • 3.5 仿真与结果分析
  • 3.6 本章小结
  • 3.7 本章参考文献
  • 第四章 多窗口故障诊断算法MFD
  • 4.1 引言
  • 4.2 时间窗口设置不准确造成的影响
  • 4.3 多时间窗口故障诊断算法MFD
  • 4.4 计算复杂度
  • 4.5 仿真结果和分析
  • 4.5.1 仿真模型
  • 4.5.2 结果和分析
  • 4.6 结论
  • 4.7 本章参考文献
  • 第五章 多域环境下的服务故障管理框架
  • 5.1 引言
  • 5.2 相关研究工作
  • 5.3 多域故障管理器MDFM
  • 5.3.1 SLS分解器
  • 5.3.2 监测任务产生器
  • 5.3.3 SLS监测器
  • 5.3.4 服务器和客户端代理
  • 5.3.5 告警收集器
  • 5.3.6 故障诊断工具箱
  • 5.4 原型系统与实验结果
  • 5.5 结论
  • 5.6 本章参考文献:
  • 第六章 基于资源规划的软性故障处理
  • 6.1 引言
  • 6.2 资源管理层
  • 6.3 最大流算法
  • 6.3.1 最大流问题
  • 6.3.2 经典最大流算法的不足
  • 6.4 资源规划算法
  • 6.4.1 基本概念
  • 6.4.2 算法描述
  • 6.4.3 算法复杂度
  • 6.5 原型系统和实验结果
  • 6.6 结论
  • 6.7 本章参考文献
  • 结束语
  • 略缩词
  • 致谢
  • 个人简历及参加的科研工作
  • 附录:在攻博期间录用、发表的文章
  • 相关论文文献

    • [1].集中故障管理系统的建设和应用[J]. 通信企业管理 2016(02)
    • [2].对天然气压缩机全面故障管理的研究[J]. 设备管理与维修 2013(02)
    • [3].零故障管理在大型泵站的应用[J]. 设备管理与维修 2014(08)
    • [4].GSM-R故障管理[J]. 科技传播 2012(20)
    • [5].基于风险预控的零故障管理模式在烟企的应用[J]. 设备管理与维修 2019(04)
    • [6].综合航空电子系统故障管理研究[J]. 黑龙江科学 2019(20)
    • [7].工程机械故障管理在设备维修中的应用[J]. 露天采矿技术 2017(07)
    • [8].基于组织、流程、IT的集中故障管理改革创新实践[J]. 山东通信技术 2015(01)
    • [9].软交换故障管理实施中的问题及其改进[J]. 软件导刊 2008(12)
    • [10].基于自主计算的集群故障管理系统结构[J]. 清华大学学报(自然科学版) 2011(S1)
    • [11].浅谈故障管理在维护计算机信息系统中的应用[J]. 吉林交通科技 2010(02)
    • [12].工业机器人的自主维修及故障管理策略[J]. 科技风 2017(10)
    • [13].网络虚拟化环境下的故障管理[J]. 电信科学 2013(08)
    • [14].集中故障管理系统的建设和应用[J]. 信息技术与信息化 2015(06)
    • [15].顺势而为积极推动集中故障管理改革[J]. 世界电信 2014(06)
    • [16].主动网络的安全体系及故障管理[J]. 中国教育网络 2009(03)
    • [17].光网络中的分布式故障管理[J]. 光通信研究 2008(01)
    • [18].浅议地铁车站设备设施故障管理[J]. 技术与市场 2019(03)
    • [19].地铁车辆故障管理分析系统设计与实现[J]. 都市快轨交通 2015(02)
    • [20].开展零故障管理全面提升设备保障能力[J]. 设备管理与维修 2014(04)
    • [21].计算机网络故障管理技术的智能化研究[J]. 软件导刊 2008(01)
    • [22].机房故障管理系统的设计与实现[J]. 东南传播 2017(10)
    • [23].机载嵌入式设备中故障管理机制的研究与实现[J]. 微电子学与计算机 2018(01)
    • [24].浅谈橡胶厂设备零故障管理[J]. 化学工程与装备 2013(09)
    • [25].神华铁路大型养路机械设备零故障管理研究[J]. 铁道建筑 2014(06)
    • [26].基于CMDB的银行故障管理优化实现[J]. 黑龙江科技信息 2010(06)
    • [27].降低ZJ17型卷接机故障停机次数的方法探究[J]. 设备管理与维修 2017(19)
    • [28].高炉电气设备的零故障管理[J]. 河北冶金 2011(10)
    • [29].可视化技术在起重机结构故障管理中的应用[J]. 科技传播 2011(02)
    • [30].LTE下基于故障管理的跨专业健康检查系统研究[J]. 信息通信 2013(09)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    Internet服务故障管理
    下载Doc文档

    猜你喜欢