海量数据压缩、操作和处理方法的研究

海量数据压缩、操作和处理方法的研究

论文摘要

在信息技术高速发展的海量信息时代,海量数据管理技术已经成为社会信息化的迫切任务。如何有效地存储和管理海量数据并高效地支持海量数据上的查询,对数据库管理系统提出了严峻的挑战。海量数据库被广泛地应用于地震监测、天气预报、物理化学实验等实际应用中,如科学与统计数据库,其数据最大的特点是存在大量的数据冗余,即相同的数据在不同的地方多次重复出现。如果对这种类型的关系数据直接进行存储,不仅浪费大量的存储空间,而且降低了查询的效率。另外,这类数据的模式相对稳定,属性值域有限,新产生的数据只追加到当前数据末尾而不更新已有内容;并且在数据上的查询大多只与众多属性中的少数几个相关。数据压缩技术与数据库技术进行结合,对海量数据库的存储与查询进行处理,形成了压缩数据库技术。压缩数据库技术研究的内容主要包括数据压缩方法、数据操作算法和查询处理技术。本文提出了海量数据库中数据的压缩和存储方法、压缩数据上的数据操作算法和查询处理技术。本文提出的压缩算法采用列存储的思想,使用二进制编码、一元编码、K-of-N编码和叠加编码对数据进行压缩,将属性对应的编码数据按照编码位进行扩展游程编码存储。本文提出了压缩数据上无需解压缩的数据操作算法,包括选择操作和投影操作,将对原始数据的查询操作转化为对压缩数据编码位的操作,简化了查询的实现。利用上述思想设计并实现了一个海量数据压缩和查询原型系统。理论分析和初步实验表明,采用列存储思想对海量数据进行压缩和存储可以很好地提高存储空间利用率、降低查询代价和提高查询效率。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 压缩数据库技术的研究现状
  • 1.2.1 数据库中数据压缩方法的研究
  • 1.2.2 压缩数据库中的数据操作算法
  • 1.2.3 压缩数据库中查询处理技术
  • 1.3 本文主要研究工作
  • 1.4 本文主要章节安排
  • 第2章 预备知识
  • 2.1 二进制编码
  • 2.2 一元编码
  • 2.3 K-of-N编码
  • 2.4 叠加编码
  • 2.5 扩展游程编码
  • 2.6 本章小结
  • 第3章 海量数据压缩算法
  • 3.1 集中式数据压缩算法
  • 3.1.1 集中式压缩算法概述
  • 3.1.2 集中式压缩算法的限制条件
  • 3.1.3 集中式压缩算法
  • 3.1.4 集中式解压缩算法
  • 3.2 分布式数据压缩算法
  • 3.2.1 属性级分布式压缩流程
  • 3.2.2 关系级分布式压缩流程
  • 3.3 本章小结
  • 第4章 压缩数据上的数据操作
  • 4.1 选择操作
  • 4.1.1 一元编码数据上的操作
  • 4.1.2 二进制编码数据上的操作
  • 4.1.3 K-of-N编码数据上的操作
  • 4.1.4 叠加编码数据上的操作
  • 4.2 投影操作
  • 4.3 本章小结
  • 第5章 压缩数据上的查询处理
  • 5.1 查询处理流程
  • 5.1.1 查询语言定义
  • 5.1.2 查询处理过程
  • 5.2 查询优化策略
  • 5.3 本章小结
  • 第6章 海量数据压缩和查询原型系统
  • 6.1 CQSS原型系统简介
  • 6.2 实验
  • 6.2.1 数据压缩实验
  • 6.2.2 数据查询实验
  • 6.3 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].基于Java的大数据压缩研究[J]. 数码世界 2017(01)
    • [2].计算机网络传输中有效压缩数据的发放分析[J]. 数码世界 2017(07)
    • [3].基于稀疏编码的体数据压缩[J]. 计算机应用与软件 2014(08)
    • [4].对数据压缩与解压技术的分析与研究[J]. 信息系统工程 2019(07)
    • [5].基于大数据的数据压缩方案[J]. 中国民用航空 2012(12)
    • [6].基于多层前馈神经网络的数据压缩方案[J]. 菏泽学院学报 2012(02)
    • [7].XML数据压缩的现状与展望[J]. 今日科苑 2008(14)
    • [8].数字海图线要素数据压缩优化研究与实现[J]. 海洋测绘 2010(06)
    • [9].贯穿于数据压缩课程的问题教学法[J]. 中国大学教学 2010(11)
    • [10].数据压缩问题[J]. 中国信息技术教育 2020(19)
    • [11].融合传感网络覆盖度的数据压缩采样方法研究[J]. 计算机仿真 2020(09)
    • [12].浅析多媒体数据压缩[J]. 电脑知识与技术 2009(20)
    • [13].基于FPGA的传感器数据采集及数据压缩传输系统的研究[J]. 信息与电脑(理论版) 2010(24)
    • [14].基于工程认证的数据压缩与编码课程建设[J]. 高教学刊 2019(05)
    • [15].网络数据库中海量数据压缩传递方法研究仿真[J]. 计算机仿真 2016(05)
    • [16].过程数据压缩在故障诊断中的应用[J]. 微计算机信息 2010(25)
    • [17].基于Spring AOP分离数据压缩处理方法[J]. 计算机与现代化 2010(02)
    • [18].合成孔径雷达数据压缩算法性能分析[J]. 现代雷达 2009(11)
    • [19].小波包变换在拉曼光谱数据压缩中的应用[J]. 长江大学学报(自然科学版)理工卷 2008(04)
    • [20].基于无线传感器网络的有效数据压缩机制研究[J]. 电子科学技术 2017(05)
    • [21].新书推荐[J]. 电脑编程技巧与维护 2014(02)
    • [22].基于切换字典的林区小气候监测数据压缩感知方法[J]. 农业机械学报 2019(11)
    • [23].离散余弦变换在图像压缩上的应用[J]. 内蒙古民族大学学报(自然科学版) 2010(02)
    • [24].基于有限序列的压缩新算法[J]. 吉林大学学报(工学版) 2018(03)
    • [25].电力调度SCADA系统中历史数据压缩及存储策略[J]. 内燃机与配件 2018(02)
    • [26].应用LZHUF算法对嵌入式针织系统控制数据压缩[J]. 纺织学报 2018(03)
    • [27].一种基于CPRI协议的I/Q数据压缩方案[J]. 光通信技术 2015(07)
    • [28].基于压缩感知的无线传感网络数据压缩[J]. 计算机工程与应用 2014(10)
    • [29].基于压缩感知的SAR海面场景目标数据压缩与重构方法[J]. 现代电子技术 2013(13)
    • [30].基于逻辑运算的折半划分测试数据压缩方法[J]. 系统仿真学报 2015(06)

    标签:;  ;  ;  ;  

    海量数据压缩、操作和处理方法的研究
    下载Doc文档

    猜你喜欢