机群容错系统的设计与实现

机群容错系统的设计与实现

论文摘要

在高可用计算机的研究当中,如何保证系统的可用性和应用可靠性一直是需要首先考虑的问题。机群以其高性价比和高扩展性成为构造高性能计算机的一种主要方法,而节点间松散耦合的结构也使得机群系统更易于保证系统的性能。但是随着机群系统规模的增大,节点数目的增多,也带来了许多的问题。因此本系统以提高机群系统的可用性为目的,设计并实现了基于Linux的机群容错系统。系统由4个模块组成:用户模块、中心模块、进程模块和心跳模块。各个模块之间相互协作实现系统功能。本文对各个模块以及模块之间的关系进行了介绍。系统采用分布式的松散耦合体系结构来组织节点,使系统具有良好的可扩展性和更好的容错性。尽可能地避免因故障导致的停机和服务的中断。服务节点可以随时的加入或离开监控关系并且不会对服务造成影响。本文设计为具有二级容错功能,利用机群系统普遍应用的心跳协议来实现节点间的检测。为了避免任务调度因素对检测的影响和完成对节点失效快速准确的检测,设计和实现了专用心跳检测协议。使其作为网络协议实体运行在操作系统核心态,使得检测器运行更加稳定,从而大大提高了检测速度。对于服务级别的检测采用进程事件连接器来主动的检测服务的行为变化。对于受监控的服务只有系统撤销对其的监控才可以看作正常退出,否则就会对其进行容错处理。对于容错,本文选择由分布式选举算法选出的代理节点保证失效节点上的服务得到有效处理,采用简单的服务迁移来保证服务的不间断性,从而提高系统的可用性。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题背景
  • 1.2 国内外的研究现状
  • 1.3 本文研究的主要内容
  • 2 机群高可用系统概述
  • 2.1 机群系统
  • 2.1.1 机群系统的特征
  • 2.1.2 机群系统的优点
  • 2.1.3 典型的机群系统
  • 2.2 高可用性系统
  • 2.2.1 高可用系统的概念
  • 2.2.2 提高可用性的途径
  • 2.2.3 高可用系统研究和开发的现状
  • 2.3 容错技术
  • 2.3.1 容错技术介绍
  • 2.3.2 双机热备系统
  • 2.3.3 机群容错系统
  • 3 机群容错系统的设计
  • 3.1 系统设计目标和设计内容
  • 3.2 系统硬件体系结构
  • 3.2.1 双层通信链路
  • 3.2.2 节点管理模型
  • 3.3 系统软件体系和功能模块
  • 3.3.1 系统采用的核心数据结构的设计
  • 3.3.2 用户模块
  • 3.3.3 进程监控模块
  • 3.3.4 中心控制模块
  • 4 检错和容错的实现
  • 4.1 节点失效检测
  • 4.2 服务失效检测
  • 4.2.1 服务失效的标准
  • 4.2.2 进程异常检测方法的选取
  • 4.3 容错实现
  • 4.3.1 任务接管
  • 4.3.2 故障节点接管
  • 4.4 小结
  • 5 系统运行结果
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].交互式两阶段评估演化策略在容错系统中的应用[J]. 激光杂志 2017(07)
    • [2].软件容错系统评估策略研究[J]. 武汉大学学报(信息科学版) 2008(10)
    • [3].设置进程检查点的嵌入式容错系统设计[J]. 单片机与嵌入式系统应用 2014(08)
    • [4].图书馆Web服务器的多层入侵容错系统[J]. 河北科技图苑 2011(02)
    • [5].CAN总线在高可用容错系统中的应用[J]. 计算机光盘软件与应用 2014(12)
    • [6].分布式Byzantine容错系统研究进展[J]. 网络新媒体技术 2013(01)
    • [7].完全自校验四余度容错系统设计[J]. 微处理机 2008(03)
    • [8].HAServer群集容错系统方案[J]. 网络安全和信息化 2017(09)
    • [9].一种基于服务器的存储及容错系统的研究[J]. 办公自动化 2008(06)
    • [10].面向云存储容错系统的RS再生码[J]. 通信学报 2016(10)
    • [11].可重构容错系统探析[J]. 内蒙古民族大学学报(自然科学版) 2015(04)
    • [12].面向办公应用的容错系统[J]. 办公自动化 2017(02)
    • [13].容错系统与双机热备系统比较分析[J]. 中国交通信息化 2011(07)
    • [14].中小型网络容错系统的研究与应用[J]. 福建电脑 2008(05)
    • [15].仿生容错系统演化修复能力研究[J]. 计算机工程 2012(10)
    • [16].实时双机嵌入式容错系统实现与可调度性研究[J]. 计算机工程与设计 2008(12)
    • [17].一种高可用异构容错系统的混合可用性模型[J]. 科学技术与工程 2015(30)
    • [18].容错技术在直升机可靠性设计中的应用与研究[J]. 直升机技术 2014(02)
    • [19].面向高端容错计算机的进程容错系统设计与实现[J]. 计算机应用与软件 2013(04)
    • [20].三模冗余容错系统管理板[J]. 清华大学学报(自然科学版) 2011(S1)
    • [21].一种液位流量互容错控制方法[J]. 冶金自动化 2008(06)
    • [22].基于模糊滑模控制的容错系统伺服控制器设计[J]. 电测与仪表 2009(11)
    • [23].一种自适应的企业级容错系统的建构[J]. 电脑知识与技术 2009(09)
    • [24].MBR膜污水装置复杂控制策略设计与程序实现[J]. 中国仪器仪表 2019(03)
    • [25].基于Markov链的容错系统可靠性评估[J]. 清华大学学报(自然科学版) 2011(S1)
    • [26].计算机系统容错技术研究[J]. 无线互联科技 2015(07)
    • [27].基于VxWorks的高可用容错系统的设计与实现[J]. 计算机技术与发展 2012(04)
    • [28].基于约束软化的满意容错控制-输出反馈情形[J]. 上海应用技术学院学报(自然科学版) 2015(03)
    • [29].AADL软件容错系统建模与评估[J]. 计算机测量与控制 2009(04)
    • [30].双机容错系统中基于FPGA容错控制器的设计[J]. 科学技术与工程 2009(15)

    标签:;  ;  ;  

    机群容错系统的设计与实现
    下载Doc文档

    猜你喜欢