数据网格中副本一致性维护及选择的研究与实现

数据网格中副本一致性维护及选择的研究与实现

论文摘要

开放的互联网环境中存在容量巨大、形式多样、分散存储的数据资源,对这些数据资源实施有效的管理是一个挑战性问题。数据网格以广域环境下海量、异构的数据资源为处理对象,结合高性能计算设施和大规模存储设备,实现了数据存储、数据传输、数据访问、副本管理、高性能数据处理等功能,为用户提供了一个数据管理与处理的基础设施。为了在数据管理中提高数据可用性、减少网络流量、增强数据访问性能,在数据网格中引入了副本管理技术。针对数据网格的特点,建立恰当的副本管理机制,切实提高数据网格中数据的可用性和改善数据访问性能,已成为数据网格中的一个研究热点。基于数据网格中读访问和写访问的发展需求,我们分析了当前情况下副本一致性维护过程中存在的问题,构建了一种副本一致性维护模型,针对副本更新过程中涉及到的本地的一致性维护、更新冲突的检测和解决等问题进行了研究与讨论,提出了一种新颖的更新传播算法并对其进行模拟实验,验证了本文算法能够比较高效的传播更新。数据更新的频繁发生也致使了用户选择副本标准的更改。由于副本的更新,使得数据网格内副本间的状态存在着不同,致使用户访问副本的需求发生了变化。针对这种情况,我们研究了副本选择的问题,提出了一种价格模型,并通过实验进行了验证,证明了本文的副本选择算法能够达到我们预期的目标。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 网格计算
  • 1.1.2 数据网格
  • 1.2 副本管理
  • 1.2.1 副本管理概述
  • 1.2.2 研究现状
  • 1.2.3 RMS 主要技术
  • 1.3 一致性维护
  • 1.3.1 一致性分类
  • 1.3.2 选择高效副本更新策略的意义
  • 1.3.3 问题分析
  • 1.4 副本选择
  • 1.4.1 预测模型分类
  • 1.4.2 问题分析
  • 1.5 本文所做工作
  • 1.6 论文组织结构
  • 第二章 基于热度和带宽负载的副本一致性维护
  • 2.1 RCS 组件
  • 2.2 本地一致性维护
  • 2.2.1 发布者
  • 2.2.2 发布内容
  • 2.2.3 传播方向
  • 2.3 更新冲突检测
  • 2.3.1 相关工作
  • 2.3.2 冲突检测
  • 2.4 基于热度和带宽负载的更新算法
  • 2.4.1 问题描述及相关定义
  • 2.4.2 单更新流传播算法设计
  • 2.4.3 多更新流副本传播设计
  • 2.4.4 算法相关性能分析
  • 2.5 本章小结
  • 第三章 基于时效性的副本选择
  • 3.1 副本选择的构架
  • 3.2 系统监控服务
  • 3.2.1 相关工作
  • 3.2.2 NWS
  • 3.3 基于时效性的副本选择策略
  • 3.3.1 经济模型的组成
  • 3.3.2 竞拍协议
  • 3.3.3 副本价格模型
  • 3.4 本章小结
  • 第四章 副本一致性与选择的实现与测试
  • 4.1 OPTORSIM 模拟器
  • 4.1.1 组成结构
  • 4.1.2 内核
  • 4.2 具体实现
  • 4.2.1 更新流程
  • 4.2.2 实现框架
  • 4.3 实验配置
  • 4.4 BWP 更新传播算法测试与性能分析
  • 4.4.1 更新延迟
  • 4.4.2 带宽占用比重
  • 4.4.3 读最新数据的比例
  • 4.5 副本选择算法性能测试与分析
  • 4.6 本章小结
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 未来工作展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发布的论文及参加的项目
  • 相关论文文献

    标签:;  ;  ;  ;  

    数据网格中副本一致性维护及选择的研究与实现
    下载Doc文档

    猜你喜欢