集群环境下海量数据存储管理技术的研究

集群环境下海量数据存储管理技术的研究

论文摘要

在石油勘探、遥感等领域中,海量数据文件经常以TB数量级别出现。在存储的过程中,时常由于单一存储设备的容量不足而导致海量数据文件无法存储,只能通过添加新的存储设备解决问题。当前许多技术都提供了将多个盘阵处理为一个虚拟盘的功能,以适应对TB级数据的存储。但这仍然不能避免多个存储系统中的“边缘”数据存储的问题,即一个磁盘系统剩余容量只能存储地震数据的一部分。其次,多种存储设备(例如磁带机)存储方法不同,造成在存储海量数据时不能统一有效的进行存储,而是需要通过转录等形式,降低了存储设备的存储效率,极大的影响了企业的工作效率。集群环境下,海量数据的存储还依赖于节点间高效的任务调度,资源的使用越平衡,作业响应时间就越短。所以一个适合的节点间任务调度算法对于缩短作业平均响应时间,提高节点资源平均使用效率进而提高海量数据存储性能有着非常重要的作用。由于以上的原因,相关领域中亟需要一种在集群环境下能够对海量数据进行存储管理的模型机制。在这种模型机制中,各种介质存储设备将进行统一存储、海量数据将跨盘跨介质存储并且采用高效的任务调度算法以缩短作业平均响应时间,提高存储效率。提出相应的跨盘存储方法和调度算法测试方案,并实现一个原型。主要研究内容:多介质存储设备统一存储机制。通过分析磁带机等多介质存储设备的存储特性,采用管道技术、进程机制以及底层IO系统调用等,屏蔽了存储设备的异构性,提出二套存储设备统一存储访问接口,最终实现了多介质存储设备的统一存储,并对一套解决方案在数据安全性和缓冲区大小等方面进行了对比。海量数据跨盘存储机制。分析了海量数据跨盘存储研究现状,采用底层文件IO存储访问接口,提出了海量数据跨盘存储访问机制,包括一套底层的文件跨盘读写接口,以及相应的配置跨盘操作系统原型,实现了海量数据的跨盘存储,并对相应存储接口进行了测试。集群环境下负载平衡调度算法。分析了基本的动态负载平衡算法,采用其中轮转法与加权法相结合的方法,提出了一种负载平衡调度算法,通过对实验算法的性能对比,该算法具有响应时间短、负载平衡次数少、额外开销少等特点,最终实现了工作效率的提高。

论文目录

  • 摘要
  • ABSTRACT
  • 创新点摘要
  • 目录
  • 第一章 绪论
  • 1.1 海量数据存储机制的意义
  • 1.2 课题研究现状
  • 1.2.1 海量数据跨盘存储研究现状
  • 1.2.2 集群环境下负载平衡算法研究现状
  • 1.3 本文的研究任务
  • 1.3.1 研究目标
  • 1.3.2 研究任务
  • 1.3.3 论文结构
  • 1.4 本章小结
  • 第二章 多介质存储设备统一存储机制
  • 2.1 概述
  • 2.2 多介质存储设备统一存储体系结构
  • 2.3 多介质存储设备统一存储驱动层—管道解决方案
  • 2.3.1 管道和进程介绍
  • 2.3.2 管道驱动解决方案
  • 2.4 多介质存储设备统一存储驱动层—系统调用解决方案
  • 2.4.1 系统调用介绍
  • 2.4.2 系统调用驱动解决方案
  • 2.5 驱动层解决方案的对比
  • 2.5.1 缓冲区
  • 2.5.2 数据安全
  • 2.6 多介质存储设备统一存储方法层
  • 2.7 本章小结
  • 第三章 海量数据跨盘存储机制
  • 3.1 概述
  • 3.2 海量数据跨盘存储机制的体系架构
  • 3.2.1 用户配置跨盘信息模块
  • 3.2.2 跨盘文件信息模块
  • 3.2.3 海量数据跨盘存储策略
  • 3.3 海量数据跨盘存储机制的实现
  • 3.4 本章小结
  • 第四章 集群环境下节点间负载平衡
  • 4.1 概述
  • 4.2 一种存储集群的任务调度算法和负载平衡策略
  • 4.2.1 集群环境概述
  • 4.2.2 负载平衡策略
  • 4.2.3 任务调度算法
  • 4.2.4 任务再分配
  • 4.2.5 性能分析
  • 4.3 本章小结
  • 第五章 原型系统设计与实现
  • 5.1 海量数据跨盘存储机制系统原型
  • 5.2 海量数据跨盘统一存储方法
  • open(打开文件)'>5.2.1 lfopen(打开文件)
  • close(关闭文件)'>5.2.2 lfclose(关闭文件)
  • read(由已打开的文件读取数据)'>5.2.3 lfread(由已打开的文件读取数据)
  • write(将数据写入已打开的文件内)'>5.2.4 lfwrite(将数据写入已打开的文件内)
  • lseek(移动文件的读写位置)'>5.2.5 lflseek(移动文件的读写位置)
  • del(删除文件)'>5.2.6 lfdel(删除文件)
  • 5.3 海量数据跨盘存储方法测试
  • 5.3.1 测试概述
  • 5.3.2 测试方案
  • 5.3.3 测试结果
  • 5.4 集群任务调度算法测试
  • 5.5 本章小结
  • 结论
  • 参考文献
  • 发表文章目录
  • 致谢
  • 详细摘要
  • 相关论文文献

    • [1].基于二维GIS技术对直升机巡检海量数据存储管理[J]. 信息技术 2019(10)
    • [2].高性能海量数据存储模拟器设计[J]. 微型机与应用 2016(22)
    • [3].探析云计算的海量数据存储模型[J]. 电子制作 2015(11)
    • [4].海量数据存储管理方法的研究[J]. 信息化研究 2011(04)
    • [5].海量数据存储管理技术研究[J]. 微计算机应用 2011(10)
    • [6].浅谈海量数据存储中的几个问题[J]. 甘肃科技纵横 2009(01)
    • [7].海量数据存储架构探析[J]. 金融理论与教学 2015(04)
    • [8].基于云计算的海量数据存储[J]. 制造业自动化 2013(13)
    • [9].海量数据存储关键技术浅析[J]. 电脑知识与技术 2010(20)
    • [10].基于云计算的海量数据存储模型[J]. 通信技术 2011(05)
    • [11].海量数据存储模式的研究[J]. 计算机与数字工程 2008(11)
    • [12].云存储与传统海量数据存储技术的比较[J]. 信息通信 2014(09)
    • [13].云存储在安防行业的发展应用分析[J]. 中国公共安全 2013(17)
    • [14].长江河道信息系统海量数据存储机制研究[J]. 人民长江 2008(14)
    • [15].电子商务环境下海量数据存储模型[J]. 情报杂志 2010(S2)
    • [16].海量数据组织与管理研究的现状与展望[J]. 地理空间信息 2014(05)
    • [17].云计算环境下煤矿应急管理海量数据存储技术[J]. 西安科技大学学报 2014(05)
    • [18].飞行器自主保障系统海量数据存储设计与研究[J]. 宇航计测技术 2019(02)
    • [19].基于LabVIEW的海量数据存储系统软件设计[J]. 黄河水利职业技术学院学报 2015(04)
    • [20].海量数据查询优化算法的研究[J]. 计算机光盘软件与应用 2014(06)
    • [21].云环境下MongoDB海量数据存储模型的研究[J]. 高等职业教育(天津职业大学学报) 2014(05)
    • [22].基于Hadoop技术的数字化校园海量数据存储系统研究与设计[J]. 实验技术与管理 2015(09)
    • [23].基于Hadoop的海量数据存储平台设计与开发[J]. 电子技术与软件工程 2017(16)
    • [24].云计算对轨道交通的影响[J]. 中国高新技术企业 2015(03)
    • [25].MongoDB数据库的应用研究和方案优化[J]. 中国科技信息 2011(20)
    • [26].基于IP-SAN的海量数据存储算法研究与实现[J]. 计算机工程与应用 2008(26)
    • [27].基于Hadoop架构的海量数据存储系统设计[J]. 厦门城市职业学院学报 2017(01)
    • [28].基于Hadoop的海量数据存储系统设计[J]. 科技通报 2014(09)
    • [29].海量数据存储系统的高效数据分级机制[J]. 淮海工学院学报(自然科学版) 2012(04)
    • [30].中小企业如何拥抱大数据?[J]. 中国电信业 2017(08)

    标签:;  ;  ;  ;  ;  ;  

    集群环境下海量数据存储管理技术的研究
    下载Doc文档

    猜你喜欢