论文摘要
开放的互联网环境中存在容量巨大、形式多样、分散存储的数据资源,对这些数据资源实施有效的管理是一个挑战性问题。数据网格以广域环境下海量、异构的数据资源为处理对象,结合高性能计算设施和大规模存储设备,实现了数据存储、数据传输、数据访问、副本管理、高性能数据处理等功能,为用户提供了一个数据管理与处理的基础设施。为了在数据管理中提高数据可用性、减少网络流量、增强数据访问性能,在数据网格中引入了副本管理技术。针对数据网格的特点,建立恰当的副本管理机制,切实提高数据网格中数据的可用性和改善数据访问性能,已成为数据网格中的一个研究热点。基于数据网格中读访问和写访问的发展需求,我们分析了当前情况下副本一致性维护过程中存在的问题,构建了一种副本一致性维护模型,针对副本更新过程中涉及到的本地的一致性维护、更新冲突的检测和解决等问题进行了研究与讨论,提出了一种新颖的更新传播算法并对其进行模拟实验,验证了本文算法能够比较高效的传播更新。数据更新的频繁发生也致使了用户选择副本标准的更改。由于副本的更新,使得数据网格内副本间的状态存在着不同,致使用户访问副本的需求发生了变化。针对这种情况,我们研究了副本选择的问题,提出了一种价格模型,并通过实验进行了验证,证明了本文的副本选择算法能够达到我们预期的目标。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景1.1.1 网格计算1.1.2 数据网格1.2 副本管理1.2.1 副本管理概述1.2.2 研究现状1.2.3 RMS 主要技术1.3 一致性维护1.3.1 一致性分类1.3.2 选择高效副本更新策略的意义1.3.3 问题分析1.4 副本选择1.4.1 预测模型分类1.4.2 问题分析1.5 本文所做工作1.6 论文组织结构第二章 基于热度和带宽负载的副本一致性维护2.1 RCS 组件2.2 本地一致性维护2.2.1 发布者2.2.2 发布内容2.2.3 传播方向2.3 更新冲突检测2.3.1 相关工作2.3.2 冲突检测2.4 基于热度和带宽负载的更新算法2.4.1 问题描述及相关定义2.4.2 单更新流传播算法设计2.4.3 多更新流副本传播设计2.4.4 算法相关性能分析2.5 本章小结第三章 基于时效性的副本选择3.1 副本选择的构架3.2 系统监控服务3.2.1 相关工作3.2.2 NWS3.3 基于时效性的副本选择策略3.3.1 经济模型的组成3.3.2 竞拍协议3.3.3 副本价格模型3.4 本章小结第四章 副本一致性与选择的实现与测试4.1 OPTORSIM 模拟器4.1.1 组成结构4.1.2 内核4.2 具体实现4.2.1 更新流程4.2.2 实现框架4.3 实验配置4.4 BWP 更新传播算法测试与性能分析4.4.1 更新延迟4.4.2 带宽占用比重4.4.3 读最新数据的比例4.5 副本选择算法性能测试与分析4.6 本章小结第五章 总结与展望5.1 总结5.2 未来工作展望致谢参考文献攻读硕士学位期间发布的论文及参加的项目
相关论文文献
标签:数据网格论文; 副本管理论文; 副本一致性论文; 副本选择论文;