基于可扩展对象的海量存储系统研究

基于可扩展对象的海量存储系统研究

论文摘要

信息存储是人类社会永恒的需求。随着计算机技术的发展和应用的普及,信息存储容量成爆炸性地增长,现有网络存储系统已无法满足人们对于存储的需要。基于对象存储(Object-Based Storage,OBS)技术逢时崛起,利用现有的存储组件、处理技术和网络技术,通过简单方式来获得前所未有的高吞吐量,成为下一代网络存储的主流。它采用包含数据和属性的“对象”作为接口,既有了“块”接口的快速,又有“文件”接口的便于共享,并分离了存储数据的逻辑视图和物理视图,将存储数据的逻辑视图保留在元数据服务器中,而物理数据存放在基于对象存储设备(Object-Based Storage Device,OSD)中。同时,它将传统文件分解为系列数据对象,分发到一个或多个OSD中。虽然对象给存储系统带来了一种新的理念,但现有的与对象相关的存储系统中对象都仅定义为非定长的数据单位,束缚了“对象”这个有着丰富内涵的词汇。基于可扩展对象的海量存储系统(Based on Scalable Object Mass Storage System,BSO-MSS)吸取了OBS的优点,在“对象”现有的含义基础上扩充,使它不仅只包括用户数据,还将目录、文件、存储设备管理等纳入对象之中,形成层次结构的对象体系结构,实现对象的分布存储、层次管理的模式,并建立基于存储对象统一访问模式,将块、对象和文件三种存储接口进行融合与统一。这样不仅具有统一逻辑视图、数据共享、主动服务、并行访问、统一存储和易管理等特点,而且有着其他存储结构难以达到的高可扩展性和高性能。通过建立系统广义随机Petri网模型,对BSO-MSS进行性能评价,模拟结果显示无论增加存储对象(Storage Object,SO)还是客户端,系统性能都随之增加。并采用测试工具iozone对系统原型与Lustre系统作对比测试,测试结果表明写性能超过Lustre,读性能略比Lustre好,并验证了BSO-MSS的广义随机Petri网模型。首次将存储系统与元胞自动机相结合,利用元胞自动机的原理,解析BSO-MSS动力演变规律。构建了一个通用框架的BSO-MSSCA概念模型框架,并在此基础上,分析了两种具体元胞自动机模型。基于存储对象负载分配模型是将SO解析为元胞,模拟了一个简单的负载均衡分配的动态变化,高度概括了BSO-MSS的演变过程。基于数据对象访问行为模型则分析数据对象的访问频率对系统的影响,结合数据对象访问的特征和主动性,通过机械学习适当调整数据对象的访问行为频率,使系统朝着稳定方向发展。通过分析基于存储对象的负载分配模型和基于数据对象的访问行为模型的演变过程,可以看出系统具有主动性、共享性、并行性、相关性等特性,是一个自组织管理的对象存储系统。大规模分布式存储系统中,元数据高性能服务、负载均衡以及扩展性已成为一个重要的研究热点。在元数据服务器中,将元数据分解为目录对象和文件对象,目录对象为定位性元数据,提供文件所在位置和访问控制;文件对象为描述性元数据,描述文件的数据特性。每一个元数据服务器(Metadata Server,MDS)负责所有目录对象和自身的文件对象,这样充分利用MDS中Cache,提高Cache的命中率,减少磁盘I/O次数,而且能够动态扩展MDS。同时,以目录对象ID和文件名为关键字的哈希值作为局部元数据查找表(Local Metadata Lookup Table,LMLT)的索引,获得相应的MDSID。一旦目录权限改变、更名、移动目录、修改权限等都不会造成元数据的迁移。通过Bloom Filter算法将每个MDS的LMLT压缩成一个摘要,能够实现快速的元数据查找。同时采用主从备三重链式结构的MDS服务,不仅在未提高硬件成本下能够保证系统高可靠性和可用性,而且根据热点访问进行迁移,实现负载均衡。SO是BSO-MSS重要组成单位,它与OSD不同之处是本身具有“接口”与“状态”标识,由数据、属性和方法组成,这样对现有的T10 OSD标准进行了扩充。由于数据对象是通常在一维空间中命名,传统文件系统管理大量数据对象的效率是极其低,采用线性哈希查找算法,由负载因子控制分裂和合并,与传统文件系统的树结构查找相比,哈希法查找时间复杂度为O(1)。同时,针对Ext2文件系统中数据访问至少需两次以上的磁盘操作特性,将数据的块地址和长度链接在一起,作为对象的扩展属性,连同数据对象一起存储到磁盘中,这样无论数据对象大小为多少,磁盘访问次数仅为两次。在BSO-MSS中,负载与众多因素相关,如请求队列长度、CPU处理能力、内存大小、网络带宽、磁盘带宽和磁盘容量等。负载柔性放置策略不仅考虑网络的影响,而且考虑SO之间存在差异,并设置权重,权重大的SO担负较多的负载。依据SO属性中信息统计出负载特征,以系统响应时间为代价,自适应选择SO数目,采用不同大小的分条进行存储,使BSO-MSS具有更高的性能、可扩展性和自适应负载均衡能力。

论文目录

  • 摘要
  • Abstract
  • 1 概论
  • 1.1 海量存储系统
  • 1.2 下一代互联网对存储系统的影响
  • 1.3 海量存储系统面临的挑战
  • 1.4 相关研究工作
  • 1.5 本文研究的主要内容及意义
  • 2 基于可扩展对象的海量存储系统体系结构
  • 2.1 BSO-MSS体系结构
  • 2.2 对象的层次结构
  • 2.3 控制软件
  • 2.4 统一访问模式
  • 2.5 BSO-MSS主要特点
  • 2.6 BSO-MSS性能评测
  • 2.7 小结
  • 3 基于可扩展对象的海量存储系统的元胞自动机模型
  • 3.1 元胞自动机
  • 3.2 BSO-MSS元胞自动机框架模型
  • 3.3 BSO-MSS元胞自动机的自组织模型
  • 3.4 小结
  • 4 基于层次结构的元数据动态管理
  • 4.1 元数据共享方式
  • 4.2 元数据的层次结构与分布
  • 4.3 元数据动态管理
  • 4.4 高可靠性的元数据服务方法
  • 4.5 综合分析比较
  • 4.6 小结
  • 5 存储对象的访问方法与调度策略
  • 5.1 存储对象
  • 5.2 数据对象的组织形式
  • 5.3 基于属性的对象访问方法
  • 5.4 基于Qos的自适应调度策略
  • 5.5 小结
  • 6 基于柔性放置的负载平衡策略
  • 6.1 负载特征的描述
  • 6.2 静态负载平衡算法
  • 6.3 负载柔性放置策略
  • 6.4 小结
  • 7 全文总结
  • 致谢
  • 参考文献
  • 附录1 攻读学位期间发表的学术论文目录
  • 附录2 攻读学位期间申请专利
  • 相关论文文献

    • [1].由浪潮牵头 中国电子标准化技术协会海量存储标准工作委员会在京成立[J]. 科技浪潮 2009(04)
    • [2].变电站视频监控中海量存储技术的应用探析[J]. 通信电源技术 2015(05)
    • [3].解密浪潮海量存储系统平台架构[J]. 科技浪潮 2010(03)
    • [4].海量存储系统的部署方案设计[J]. 计算机应用与软件 2012(08)
    • [5].海量存储系统安全方案设计[J]. 网络安全技术与应用 2012(08)
    • [6].海量存储系统的层次化体系结构[J]. 小型微型计算机系统 2010(06)
    • [7].高安全海量存储卡设计[J]. 中外企业家 2016(03)
    • [8].基于云计算的煤炭生产数据海量存储技术研究[J]. 煤炭技术 2014(03)
    • [9].海量存储系统的数据分布策略研究[J]. 计算机工程与应用 2014(10)
    • [10].海量存储系统评测体系的研究[J]. 电子设计工程 2011(07)
    • [11].秸秆资源海量存储系统的设计与实现[J]. 计算机研究与发展 2011(S1)
    • [12].数字示波器中海量存储的实现[J]. 电子测量技术 2008(08)
    • [13].珍藏高清影像,先锋蓝光海量存储[J]. 信息记录材料 2008(05)
    • [14].测绘数据档案海量存储模式的选择[J]. 测绘技术装备 2009(03)
    • [15].863“海量存储系统关键技术”重大项目签约浪潮经费逾2亿[J]. 电脑与电信 2009(10)
    • [16].提高存储产业竞争力 增强标准制定话语权 海量存储标准工作委员会主任、浪潮集团高级副总裁王恩东就海量存储委员会成立答记者问[J]. 科技浪潮 2009(04)
    • [17].浪潮新品提高数据存储价值[J]. 中国教育网络 2009(07)
    • [18].我国本土企业亮剑海量存储领域[J]. 数字通信世界 2012(07)
    • [19].海量存储系统可用性静态测试评估方案[J]. 网络安全技术与应用 2011(04)
    • [20].基于闪存的高速海量存储模块设计[J]. 计算机工程 2011(07)
    • [21].存储技术的新突破——进化海量存储系统[J]. 光学与光电技术 2009(02)
    • [22].海纳百川——人人网海量存储系统Nuclear开发手记[J]. 程序员 2010(09)
    • [23].海量存储系统可用性建模与分析[J]. 计算机工程与设计 2017(01)
    • [24].数据、大数据及其本质[J]. 中国共青团 2015(10)
    • [25].浪潮新一代AS3000 云环境中的海量数据存储系统[J]. 科技浪潮 2013(03)
    • [26].海量存储系统元数据服务器的设计及性能优化[J]. 计算机工程 2012(02)
    • [27].海量存储系统能耗评测模型的研究[J]. 计算机应用研究 2013(05)
    • [28].基于嵌入式数据库的海量存储技术分析研究[J]. 数字技术与应用 2013(04)
    • [29].海量存储测试平台监控系统的设计与实现[J]. 计算机研究与发展 2011(S1)
    • [30].海量存储 HTC Advantage X7510[J]. 数字通信 2008(05)

    标签:;  ;  ;  ;  ;  ;  

    基于可扩展对象的海量存储系统研究
    下载Doc文档

    猜你喜欢