计算系统的自恢复模型构建和自愈策略的研究

计算系统的自恢复模型构建和自愈策略的研究

论文摘要

软件老化现象,是由于软件的错误随着时间和负载而累积,并最终导致了系统的不可用。在对可靠性和可用性要求较高的系统里,软件的老化会使系统失效从而产生较大的损失。研究表明软件的多样性设计不是解决这类错误的有效方法。软件失效具有暂时性的特质,软件的设计错误能引起暂时性的软件失效,软件在操作系统环境中运行时由于错误的累积而进入不可接受的错误状态。因此,系统的重启,作为软件运行环境更新的一种策略,作为一种有效的、成本开销较低的软件性能恢复技术被提了出来。其基本的思想就是改变运行进程的操作环境从而达到避免软件失效的发生。这种主动性能恢复的思想就是自恢复理论。 本文就软件自恢复理论展开研究,主要研究内容和工作如下: 首先建立了以半马尔可夫过程为基础的多级(系统级、应用级和进程级)分析模型来考虑自恢复理论。分析以半马尔可夫过程建立的多级模型,得到在分析不同情况下的稳定状态最大可用性概率和优化的软件自恢复时间。研究结果表明了:细粒度下的自恢复策略能够进一步降低自愈成本,提高系统的可用性,采取哪一级自恢复策略主要是由系统自身的参数决定的。 本文发展了基于统计学的算法来估计优化的软件自恢复时间阈值,在得到系统失效时间的统计完备样品数据的假设基础上。优化的软件自恢复时间阈值计算算法是在满足单位时间自恢复成本最小或者满足系统可用性最大的情况下通过统计的TTT变换推导而得到的。研究结果表明这类算法具有很好的一致性和稳定性,能够在系统失效分布未知的情况下通过检测系统参数加以修正而得到最佳最恢复时间阈值的近似值。 另外本文通过随机模型来评价自恢复技术在运行系统中的效应以及在考虑到负载情况下的所执行的最佳自恢复时间阈值的确定。特别的讨论了基于测量的方法来检测系统的软件老化以及这种效应对各种系统资源的影响。通过系统负载和资源的使用情况的数据来建立模型,这些数据来自于UNIX操作系统下经过一段时间的观察而得到。基于测量的模型有助于发展基于实际系统进行测量的软件自恢复策略。 最后,总结了本篇论文的主要结论以及下一步深入研究的方向和研究展望,其中

论文目录

  • 摘要
  • Abstract
  • 目录
  • 1 绪论
  • 1.1 论文的背景和意义
  • 1.1.1 软件系统错误存在的必然性
  • 1.1.2 软件错误分类分析
  • 1.1.3 软件容错技术
  • 1.1.4 软件自恢复-主动容错技术的提出
  • 1.1.5 软件失效的暂时性本质
  • 1.1.6 软件老化
  • 1.1.7 软件自恢复技术
  • 1.2 研究现状
  • 1.2.1 基于测量的方法
  • 1.2.2 基于模型分析的方法
  • 1.3 论文的结构组织和主要研究工作
  • 2 自恢复软件系统的三层模型构建和分析
  • 2.1 引言
  • 2.2 预备知识
  • 2.2.1 马尔可夫链
  • 2.2.2 转移概率距阵
  • 2.2.3 离散时间马尔可夫链
  • 2.2.4 连续时间马尔可夫链
  • 2.2.5 更新过程
  • 2.2.6 马尔可夫更新过程与半马尔可夫过程
  • 2.2.7 半马尔可夫链过程
  • 2.3 模型描述
  • 2.4 仿真实验结果及分析
  • 2.5 结论
  • 3 基于 TTT变换的计算系统自恢复时间阈值计算算法
  • 3.1 引言
  • 3.2 模型描述
  • 3.3 可用性概率和自恢复成本概率计算公式推导和分析
  • 3.4 基于统计成本最小化的自恢复时间阈值算法推导
  • 3.5 统计的算法实现
  • 3.5.1 TTT变换
  • 3.6 仿真试验结果
  • 3.7 基于统计系统可用性最大的自恢复时间阈值计算算法推导
  • 3.7.1 可用性概率计算
  • 3.7.2 统计的算法实现
  • 3.7.3 仿真试验结果
  • 3.8 结束语
  • 4 事务处理系统中自愈策略的理论分析和实例测试研究
  • 4.1 介绍
  • 4.2 分析模型
  • 4.2.1 基于事务处理的软件系统的自愈模型
  • 4.2.2 检测评估
  • 4.2.3 数值实验
  • 4.3 基于时间的估计
  • 4.3.1 软件系统性能参数量化分析和估计
  • 4.4 基于测量的估计分析
  • 4.4.1 相关的工作介绍
  • 4.4.2 时间和负载的估计
  • 4.4.3 实验的建立和数据的收集
  • 4.4.4 集类分析
  • 4.4.5 状态转换模型的建立
  • 4.4.6 驻留的时间分布
  • 4.4.7 模型的检验
  • 4.4.8 资源使用情况建模
  • 4.4.9 斜率(变化率)的计算
  • 4.4.10 模型的解决方法
  • 4.5 扩展基于测量的方法
  • 4.6 结论
  • 5 结论和展望
  • 5.1 结论
  • 5.2 展望
  • 致谢
  • 参考文献
  • 攻读博士学位期间发表的论文(第一作者)
  • 相关论文文献

    • [1].分区软件失效模式和效果研究[J]. 计算机应用研究 2017(08)
    • [2].软件失效模式危害性评定方法[J]. 电子产品可靠性与环境试验 2012(S1)
    • [3].基于关联维计算的软件失效混沌识别研究[J]. 山东理工大学学报(自然科学版) 2018(01)
    • [4].软件失效模式的自动生成方法研究[J]. 计算机科学与探索 2018(11)
    • [5].基于拟似然估计方法的软件失效预测模型[J]. 计算机科学 2016(S2)
    • [6].基于缺陷数据的雷达软件失效模式分析与应用[J]. 现代雷达 2018(06)
    • [7].面向黑盒测试的软件失效特征分析[J]. 价值工程 2012(27)
    • [8].基于可配置特征单元的软件失效数据检测仿真[J]. 计算机仿真 2020(09)
    • [9].软件失效时序数据的灰色拟合及多步预测算法[J]. 智能计算机与应用 2017(06)
    • [10].软件失效时间数据相关性研究[J]. 计算机应用 2010(03)
    • [11].巧用组策略锁定系统时间[J]. 电脑知识与技术(经验技巧) 2008(09)
    • [12].基于用户要求并考虑软件失效的费用模型[J]. 计算机技术与发展 2011(07)
    • [13].基于统计的软件失效模式研究[J]. 航空计算技术 2018(05)
    • [14].改进的AUV软件失效模式风险评估方法[J]. 华中科技大学学报(自然科学版) 2011(S2)
    • [15].基于软硬系统综合方法的软件失效问题分析[J]. 计算机科学 2018(S2)
    • [16].非请勿过 探索验证码背后的秘密[J]. 电脑爱好者 2015(08)
    • [17].基于软件失效链的软件错误行为分类研究[J]. 计算机技术与发展 2015(04)
    • [18].软件FMEA失效模式库管理系统的研究与实现[J]. 科技信息 2009(03)
    • [19].引信软件失效模式影响分析研究[J]. 装备环境工程 2012(05)
    • [20].网络化软件的复杂特性分析[J]. 信息技术与信息化 2020(07)
    • [21].基于需求建模的软件安全性分析方法研究[J]. 航空标准化与质量 2017(04)
    • [22].软件失效模式与影响分析在武器火控软件中的应用研究[J]. 科技与创新 2017(15)
    • [23].系统级软件FMEA计算机辅助设计研究[J]. 计算机科学 2009(09)
    • [24].硬软件交互的可靠性建模及其应用[J]. 微型机与应用 2011(05)
    • [25].基于最大Lyapunov指数的软件失效预测[J]. 计算机应用与软件 2013(03)
    • [26].软件缺陷及其对软件可靠性的影响分析[J]. 计算机应用与软件 2011(01)
    • [27].云安全对垒“极虎”[J]. 微电脑世界 2010(03)
    • [28].软件详细级FMEA分析和研究[J]. 科技信息 2009(03)
    • [29].软件失效原因分析[J]. 电子产品可靠性与环境试验 2009(03)
    • [30].容灾就像买保险[J]. 软件世界 2008(07)

    标签:;  ;  ;  ;  ;  ;  

    计算系统的自恢复模型构建和自愈策略的研究
    下载Doc文档

    猜你喜欢