容灾存储系统故障检测技术研究

容灾存储系统故障检测技术研究

论文摘要

随着存储系统与网络技术的不断发展,存储系统在存储容量、性能、可扩展性等方面己取得了飞速的发展,但不可预计的故障、甚至是不可抗拒的故障现象也越来越多,因此提高存储系统的可靠性,保证业务的正常运行己经势在必行。而容灾存储系统也存在一些局限性,比如容灾主要是针对数据备份而言,确保应用不因为意外事件而带来重大损失,但不能保证应用不因为故障的发生而被中断;不能快速反映系统视图的变化。针对容灾存储系统的局限性,在研究故障检测技术的基础上,结合层次式设计,提出基于容灾存储系统的故障检测系统。故障检测系统是实现系统容灾的基础,他能保证当节点故障时应用会继续运行,并能使各节点间通组间通讯过快速生成统一视图。快速、高效、准确的故障检测是能否实现有效容灾的前提和保障。当前,故障检测仍存在一些需求尚未解决,如信息丢失、可扩展性、灵活性和动态性等。因此,有必要寻找一种能有效解决上述需求的故障检测方法。为了建立故障检测系统,在故障检测模型、故障检测系统的性能评价指标、故障检测系统构架和故障检测器等方面作了以下几方面的研究:1.随着容灾存储系统规模的不断扩大,故障检测服务也在向大规模的方向发展。针对大规模故障检测所遇到的问题,分析了大规模故障检测服务应该满足的特性和新的要求;研究了现有的实现大规模故障检测服务的方法;针对故障检测器需要解决的基本问题,对现有的实现方式进行了研究,并比较不同方法之间的差异及各种故障检测协议的优缺点。2.设计了一种基于容灾存储系统故障检测机制,有效缓解了负载对故障检测的影响,实现了快速、灵活的故障检测。当节点的加入、退出和崩溃时各控制节点可以通过组间通知方式生成一个统一的全局视图。3.设计了一种自适应故障检测算法——dAFD。dAFD通过估计预期到达时间来提供一个检测时间,动态地估算心跳消息超时时限,以适应系统状态的变化,减少故障检测服务的错误,并按照给出的QoS参数分析其性能。4.设计了一种权故障检测算法WFDA。WFDA输出一个权值,假如被检测的节点崩溃了,这个权值会随着时间的流逝而单调增长。如果这个被检测节点又恢复可用了,这个权值又要被初始化,应用程序会询问故障检测模块以获得相应节点的权值。每个应用程序都有自己的阈值,这些阈值反映了每个应用程序的需求。当应用程序的阈值大于权值时,故障检测器会认为被检测节点失效,反之则认为节点可用。这种故障检测算法的优点是能按照网络状态和应用程序的需要自动调整。5.对权故障检测算法进行了改进,将其称为QWFD故障检测算法,它能解决权故障检测算法需要消息行为符合正态分布的假设,以及权故障检测算法不能对服务质量做出定量的需求,应用范围也更加广泛。在权故障检测算法的实现中,应用程序设定的可信度阈值只能定性地刻画其QoS要求,但在实际应用中,大多数分布式应用程序都存在一些较为严格的时间上的约束,故更加需要故障检测器可以按照QoS评价指标支持准确的定量的QoS需求。权故障检测算法的实现,往往需要假设消息行为符合正态分布。但在复杂的大规模存储系统中,存在复杂的异步性、较长的传输延时、较高的消息丢失率,而且其基础结构是动态可配置的,大量的组件及其分布也是动态的,在这样的环境下,消息行为不可能一直符合某种特定的分布特性。因此,作为一个通用组件来设计的故障检测器不应对此作出任何假设。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 容灾系统
  • 1.2 故障检测
  • 1.3 本文的研究内容及组织结构
  • 2 故障检测技术的研究与发展
  • 2.1 分布式系统模型
  • 2.2 故障检测系统的级别和分类
  • 2.3 基于容灾存储系统故障检测的特点
  • 2.4 性能的评价指标
  • 2.5 故障检测技术的研究现状及存在的问题
  • 2.6 检测协议的分类
  • 2.7 本章小结
  • 3 dAFD故障检测算法的设计
  • 3.1 dAFD故障检测器
  • 3.2 dAFD的设计
  • 3.3 dAFD算法的实现
  • 3.4 检测算法的证明
  • 3.5 实验结果及其分析
  • 3.6 本章小结
  • 4 权故障检测算法的设计
  • 4.1 WFDA障检测器
  • 4.2 WFDA的设计
  • 4.3 WFDA的实现
  • 4.4 WFDA性能测试实验及其结果分析
  • 4.5 QWFD故障检测算法
  • 4.6 QWFD算法的设计
  • 4.7 算法证明
  • 4.8 QWFD性能测试实验及结果分析
  • 4.9 本章小结
  • 5 容灾存储系统的故障检测技术研究
  • 5.1 容灾存储系统故障检测模型的建立
  • 5.2 检测机制的构架
  • 5.3 检测服务的过程
  • 5.4 故障检测算法
  • 5.5 故障检测器的设计
  • 5.6 系统实验及分析
  • 5.7 本章小结
  • 6 总结与展望
  • 6.1 全文总结
  • 6.2 研究展望
  • 致谢
  • 参考文献
  • 附录 攻读博士学位期间的学术论文
  • 相关论文文献

    • [1].基于集中式架构的高速率大容量测量存储系统设计[J]. 电子技术与软件工程 2020(07)
    • [2].试议存储系统安全[J]. 电脑编程技巧与维护 2020(06)
    • [3].大数据环境下的存储系统构建:挑战、方法和趋势[J]. 大数据 2019(04)
    • [4].密集存储系统及其市场需求分析[J]. 物流技术与应用 2018(09)
    • [5].数据中心存储系统故障了怎么办[J]. 计算机与网络 2018(21)
    • [6].网络编码云存储系统差分数据更新方案[J]. 通信学报 2017(03)
    • [7].基于磁盘和固态硬盘的混合存储系统研究综述[J]. 计算机应用 2017(05)
    • [8].公有云存储系统性能评测方法研究[J]. 计算机应用 2017(05)
    • [9].安全云存储系统综述[J]. 科技视界 2017(05)
    • [10].移动云存储系统的关键问题与技术方案[J]. 福建电脑 2017(08)
    • [11].一种云存储系统分层性能监测和采集方法[J]. 西北工业大学学报 2016(03)
    • [12].基于开放云存储协议的云存储系统性能评测方法研究[J]. 电子设计工程 2016(19)
    • [13].一种云存储系统安全扩展框架设计[J]. 黑龙江科技信息 2014(31)
    • [14].云存储系统的分析与应用[J]. 信息技术与信息化 2014(07)
    • [15].云存储系统性能评测技术研究[J]. 计算机研究与发展 2014(S1)
    • [16].网络化存储系统在大数据时代应用与探讨[J]. 网络安全技术与应用 2015(05)
    • [17].分布式的电力云存储系统的优势分析和可行性研究[J]. 通讯世界 2015(12)
    • [18].医院PACS云存储系统建设途径[J]. 数码世界 2020(01)
    • [19].企业级蓝光归档存储系统[J]. 湖北画报(上旬) 2017(03)
    • [20].高端存储系统专题(之一) 高端存储系统发展展望[J]. 科技浪潮 2014(01)
    • [21].能源存储系统的类型和特点[J]. 信息技术与标准化 2013(09)
    • [22].虚拟化环境下存储系统的改进方法探索[J]. 成都航空职业技术学院学报 2013(04)
    • [23].云存储系统的分析与应用研究[J]. 计算机光盘软件与应用 2013(24)
    • [24].云存储系统的分析与应用探讨[J]. 数字技术与应用 2013(10)
    • [25].基于融合存储系统的数据容灾[J]. 现代计算机(专业版) 2013(34)
    • [26].融媒体云中心存储系统设计[J]. 广播电视信息 2020(05)
    • [27].子母穿梭车密集存储系统货位分配研究[J]. 制造业自动化 2020(06)
    • [28].面向大数据异构系统的神威并行存储系统[J]. 大数据 2020(04)
    • [29].密集存储技术及其应用[J]. 物流技术与应用 2018(09)
    • [30].基于块的分级存储系统多样性机制设计与研究[J]. 计算机工程 2016(12)

    标签:;  ;  ;  ;  

    容灾存储系统故障检测技术研究
    下载Doc文档

    猜你喜欢