云计算环境下的容错存储技术研究

云计算环境下的容错存储技术研究

论文摘要

云计算作为一种新型的计算模式,在科学计算和商业计算领域均发挥着重要作用,受到当前学术界和企业界的广泛关注。数据中心是云计算环境的重要组成部分,所包含节点数目与所支持用户数量日益增多,越来越多的数据存储于数据中心中。海量数据在数据中心中高效、容错的存储成为了企业和研究者所关注的重点。当前,研究者分别从数据中心网络和数据冗余方法等方面对云计算的容错存储进行了研究。随着数据中心节点规模的不断扩大,节点失效成为一种常见的情况。在此情况下,如何提高数据存储的容错性成为了研究的重点。针对上述问题,本文从数据中心网络拓扑构建、纠删码修复技术与数据放置三个方面对如何提高数据容错性进行了深入的研究,取得的主要研究进展如下:首先,针对已有数据中心网络拓扑结构在容错性、可扩展性和吞吐量等方面的不足,提出了一种容错的数据中心网络拓扑结构DCUBE和相应的路由算法。DCUBE中,通过增加服务器之间的直接连接提高了网络中的链路冗余度,结合容错路由算法提高了拓扑结构的容错性;通过模块化设计方式,DCUBE可以以模块方式扩大或缩小节点规模,具有较好的可扩展性;通过服务器之间的并行路径与多条并行路径路由算法,提高了网络吞吐量;理论分析与实验结果表明,与已有的典型方法DCell和BCube相比,DCUBE具有更好的容错性和可扩展性,并且具有较高的吞吐量。其次,针对已有纠删码修复技术修复失效数据时间较长的问题,提出了一种基于树形结构的并行修复算法TPR。TPR中为多个失效节点构建多个生成树,通过并行修复多个失效节点以提高修复速度、减少修复时间;结合生成树结构,充分利用网络的高带宽链路以提高失效数据成功修复概率;通过优化生成树结构,最大化利用网络路径的可用带宽以降低修复过程中新节点的失效概率、提高数据容错性。实验结果表明,与典型的基于串行修复算法和基于协作修复算法方法相比,TPR在修复时间、失效数据成功修复概率以及降低新节点失效概率方面更优。最后,针对已有数据放置算法在容错性方面的不足,提出了一种容错的数据放置算法FDPA。FDPA中根据数据访问频率与节点之间平均访问时间的不同,将访问频率较高的数据放置在平均访问时间较小的节点中,延长了数据的平均无故障时间;通过容量阈值方式,分散地放置数据块,减少了数据之间的影响,降低了同一数据对象多个数据块同时失效的概率,提高访问节点对多个数据块访问的并行性。实验结果表明,与典型的随机放置算法和CRUSH相比,FDPA的平均访问时间更低,平均无故障时间更长。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 数据中心网络
  • 1.2.1 数据中心网络概述
  • 1.2.2 数据中心网络拓扑
  • 1.3 纠删码技术
  • 1.3.1 Reed-Solomon 码
  • 1.3.2 阵列纠删码
  • 1.3.3 低密度奇偶校验码
  • 1.4 数据放置技术
  • 1.4.1 启发式放置算法
  • 1.4.2 随机放置算法
  • 1.4.3 爬山放置算法
  • 1.5 主要研究内容
  • 1.6 论文组织结构
  • 第二章 相关研究
  • 2.1 典型的数据中心网络拓扑
  • 2.1.1 树形结构
  • 2.1.2 胖树结构
  • 2.1.3 DCell 结构
  • 2.1.4 BCube 结构
  • 2.2 低修复成本的纠删码技术
  • 2.2.1 基于度数限制的纠删码技术
  • 2.2.2 基于网络编码的纠删码技术
  • 2.2.3 基于串行修复的纠删码技术
  • 2.2.4 基于协作修复的纠删码技术
  • 2.3 数据放置算法
  • 2.3.1 随机放置算法
  • 2.3.2 贪婪放置算法
  • 2.3.3 哈希放置算法
  • 2.4 本章小结
  • 第三章 容错的数据中心网络拓扑结构研究
  • 3.1 DCUBE 的互连规则
  • 3.2 DCUBE 的路由算法
  • 3.2.1 最短路径路由算法
  • 3.2.2 多条并行路径路由算法
  • 3.2.3 容错路由算法
  • 3.3 理论分析
  • 3.4 实验结果与分析
  • 3.4.1 平均路径长度
  • 3.4.2 带宽吞吐量
  • 3.5 本章小结
  • 第四章 基于树形结构的并行修复算法研究
  • 4.1 生成树修复过程
  • 4.2 基于树形结构的并行修复算法
  • 4.2.1 基于树形结构的单失效节点修复算法
  • 4.2.2 基于树形结构的多失效节点修复算法
  • 4.3 实验结果与分析
  • 4.3.1 修复时间
  • 4.3.2 成功修复的概率
  • 4.3.3 数据可用性
  • 4.4 本章小结
  • 第五章 容错的数据放置算法研究
  • 5.1 容错的数据放置算法
  • 5.2 容错的数据放置算法分析
  • 5.3 实验结果与分析
  • 5.3.1 平均访问时间
  • 5.3.2 平均无故障时间
  • 5.4 本章小结
  • 第六章 结束语
  • 6.1 工作总结
  • 6.2 研究展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 作者在学期间参加的主要科研工作
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    云计算环境下的容错存储技术研究
    下载Doc文档

    猜你喜欢