论文摘要
随着Internet技术的飞速发展和广泛应用,一种新的计算模式—网格计算蓬勃发展起来。网格作为基于Internet的协同资源共享和问题求解环境,推动Internet发展到了新的阶段。在网格这种广域分布、普遍异构的计算环境中进行协同资源共享和问题求解需要解决许多挑战性的问题。其中之一就是在资源故障发生较频繁的情况下,如何保证网格的高可用性和高可靠性。本文的研究聚焦于计算网格,在分析计算网格高可用性问题特殊性的基础上,围绕如何在网格中间件GT上为应用提供高可用性和容错性,研究了计算网格高可用关键技术,包括进程迁移和检查点。本文主要创新工作包括:(1)提出了基于GT的高可用服务层体系结构(High Availability Service Layer of Architecture based on Globus Toolkit, HASLA),主要包括进程迁移、检查点数据管理和资源备份。该体系结构是在对计算网格工程与科学计算需求分析的基础上提出的,在兼顾性能及服务质量的同时,力求高可用性和容错性。(2)借鉴了检查点和进程迁移两种高可用技术,提出了基于检查点的进程迁移模型(Process Migration Model based on Checkpoint, PMMC),并且从检查点的设置、进程状态转储、进程状态迁移和进程恢复四个方面详细地阐述了模型的过程。该模型为网格系统的运行提供了高可用性和容错性,有效地平衡了节点负载,提高了节点的利用率和吞吐量。(3)通过分析经典的进程迁移算法,结合了检查点设置策略,改进了一种类似File Server的基于检查点的进程迁移算法,并在网格实验平台上进行性能测试。实验结果表明,该算法有效地减少了迁移的冻结时间,消除了残余依赖,为系统提供了实时性和容错性。
论文目录
中文摘要英文摘要第1章 前言1.1 课题来源及研究背景1.2 关键技术及研究现状1.2.1 检查点1.2.2 进程迁移1.3 论文的研究目标和内容1.4 论文组织与结构安排第2章 网格理论研究2.1 网格计算概述2.1.1 网格的定义2.1.2 网格的特点2.2 网格体系结构2.2.1 网格的五层沙漏结构2.2.2 开放式服务网格体系结构OGSA2.3 网格研究现状2.3.1 美国的网格研究现状2.3.2 欧洲的网格研究现状2.3.3 亚洲的网格研究现状2.4 网格的可用性分析2.5 小结第3章 关键技术研究3.1 检查点3.1.1 检查点概念3.1.2 检查点的实现层次3.1.3 检查点机制原理的分析3.1.4 检查点机制关键问题3.1.5 检查点的优化技术3.2 进程迁移3.2.1 进程的基本概念3.2.2 进程迁移机制3.2.3 进程迁移的状态3.2.4 负载信息的管理3.2.5 进程迁移的代价3.2.6 进程迁移对节点负载状况的影响3.3 基于GT的高可用服务层的体系结构HASLA3.3.1 网格中间件——Globus Toolkit3.3.2 HASLA体系结构3.4 小结第4章 基于检查点的进程迁移设计与实现4.1 设计目标4.2 基于检查点的进程迁移模型PMMC4.3 PMMC选择策略4.3.1 进程选择策略4.3.2 目的节点选择策略4.4 基于检查点的进程迁移设计与实现4.4.1 设置检查点4.4.2 进程状态转储4.4.3 进程状态迁移4.4.4 进程恢复4.5 基于检查点的进程迁移过程4.6 进程迁移算法4.6.1 进程迁移算法分析4.6.2 经典进程迁移算法4.6.3 改进的进程迁移算法4.7 小结第5章 测试与结果分析5.1 测试环境5.1.1 硬件环境5.1.2 软件环境5.1.3 网格拓扑结构5.2 系统性能测试5.2.1 算法性能比较5.2.2 系统性能测试第6章 总结与展望6.1 工作总结6.2 主要创新点6.3 下一步研究方向参考文献致谢个人简历和在学期间的研究成果
相关论文文献
标签:计算网格论文; 进程迁移论文; 检查点论文; 容错论文; 高可用性论文;