基于列存储数据库的数据压缩研究与实现

基于列存储数据库的数据压缩研究与实现

论文摘要

本文的主要工作是对列存储技术的研究以及数据压缩在其中的应用。具体内容有:分析和研究了列存储数据库的概念及其核心实现技术;研究主流轻量级压缩算法,提出了频繁段压缩算法,其在某些条件下可能比较优越;研究压缩态数据随机访问技术,并对Int-Packing算法进行改进,提出了Pack2、Pack3和Pack4压缩算法及其相应的压缩态数据访问算法,实验证明Pack3和Pack4极大地提高了压缩态数据访问的效率;研究压缩态匹配问题,对Huffman压缩态数据扫描进行了深入研究,从理论上计算出了在不同数据规模下用超字母表扫描Huffman压缩态数据时的最佳超字母长度,实验结果表明该理论值与实际基本相符,在实践中具有很大的指导意义。

论文目录

  • 提要
  • 第1章 概述
  • 1.1 背景与研究意义
  • 1.2 国内外研究现状
  • 1.2.1 列存储数据库系统
  • 1.2.2 数据压缩在列存储数据库中的应用
  • 1.2.3 压缩态模式匹配
  • 1.3 本文主要工作及组织结构
  • 第2章 列存储数据库核心技术
  • 2.1 基本概念
  • 2.1.1 存储粒度
  • 2.1.2 高效的数据压缩
  • 2.1.3 压缩态数据运算
  • 2.1.4 潜在的高并行性
  • 2.2 数据存储
  • 2.2.1 数据表的存储
  • 2.2.2 其它数据的存储
  • 2.2.3 数据压缩
  • 2.3 查询优化
  • 2.4 物化策略
  • 2.4.1 早期物化和晚期物化
  • 2.4.2 平行物化和流水线物化
  • 2.5 案例分析
  • 2.5.1 MonetDB
  • 2.5.2 CStore
  • 第3章 数据列压缩
  • 3.1 主流压缩算法
  • 3.1.1 Huffman编码
  • 3.1.2 LZ系列压缩
  • 3.2 轻量级数据压缩
  • 3.2.1 行程编码(Run Length Encoding,RLE)
  • 3.2.2 差值压缩(Delta Compression)
  • 3.2.3 粗粒度字典压缩
  • 3.2.4 位图(Bitmap)
  • 3.3 压缩态SQL运算
  • 3.3.1 排序(ORDER BY)
  • 3.3.2 分组(GROUP BY)
  • 3.3.3 链接(JOIN)
  • 3.4 频繁字节压缩
  • 3.4.1 频繁段压缩
  • 3.4.2 RLE与频繁段压缩
  • 3.4.3 Delta-Value与频繁段压缩
  • 3.4.4 Int-Packing与频繁段压缩
  • 3.4.5 频繁段压缩算法的局限性
  • 3.5 总结
  • 第4章 压缩态数据访问
  • 4.1 压缩态数据访问的必要性
  • 4.2 Int-packing压缩态数据随机定位
  • 4.2.1 原始定位算法
  • 4.2.2 对压缩态数据进行双向定位
  • 4.2.3 将标志位聚集到一起
  • 4.2.4 对标志位定长编码
  • 4.2.5 实验结果
  • 4.2.6 结论
  • 4.3 其它轻量级压缩态数据定位
  • 4.3.1 游程编码(RLE)
  • 4.4 总结
  • 第5章 压缩态匹配问题
  • 5.1 问题定义
  • 5.2 一种错误的观点
  • 5.3 常用策略
  • 5.3.1 在压缩态的数据中匹配压缩态的模式
  • 5.3.2 边扫描边匹配
  • 5.4 超字母集
  • 5.4.1 自动机与模式匹配
  • 5.4.2 超字母集在自动机模式匹配中的应用
  • 5.4.3 用超字母集扫描Huffman压缩态数据
  • 5.4.4 最佳超字母长度
  • 5.4.5 对比分析
  • 5.5 总结
  • 第6章 结 论
  • 6.1 总结
  • 6.2 下一步工作
  • 参考文献
  • 致谢
  • 摘要
  • Abstract
  • 相关论文文献

    • [1].叠加相干态与叠加压缩态的相位精度研究[J]. 西北工业大学学报 2015(02)
    • [2].基于列存储数据库的压缩态数据访问算法[J]. 吉林大学学报(理学版) 2009(05)
    • [3].铷原子蒸汽中观测脉冲真空压缩态的建立[J]. 量子光学学报 2017(03)
    • [4].压缩态光源技术[J]. 黑龙江科技信息 2010(30)
    • [5].795 nm真空压缩的实验产生及猫态模拟[J]. 量子光学学报 2019(04)
    • [6].基于压缩态的量子密钥分配技术分析[J]. 公安海警学院学报 2014(01)
    • [7].运动原子与光场依赖强度纠缠下最佳熵压缩态的制备和控制[J]. 物理学报 2010(05)
    • [8].基于双模压缩态的量子投票协议[J]. 物理学报 2009(05)
    • [9].依赖强度耦合三光子过程下运动原子最佳熵压缩态的制备[J]. 原子与分子物理学报 2016(03)
    • [10].Compton散射对光纤中孤子压缩态传输的影响[J]. 量子电子学报 2008(03)
    • [11].一类特殊单模压缩态的Wigner函数[J]. 物理学报 2011(09)
    • [12].利用两能级原子与腔场相互作用实现纠缠压缩态的纠缠浓缩[J]. 原子与分子物理学报 2011(01)
    • [13].利用Mach-Zehnder干涉仪制备自旋压缩态[J]. 量子电子学报 2014(03)
    • [14].自旋压缩态及其在原子钟中的应用前景[J]. 时间频率学报 2013(01)
    • [15].异质量两粒子的纠缠态表象的特性分析与压缩态生成[J]. 中国科学技术大学学报 2018(08)
    • [16].用压缩态理论导出偶-奇数阶厄密多项式的无穷和[J]. 量子光学学报 2014(04)
    • [17].KAGRA引力波探测器中频率相关压缩态实验进展[J]. 天文学进展 2019(01)
    • [18].量子雷达研究新进展[J]. 战术导弹技术 2018(05)
    • [19].量子光频梳产生实验研究[J]. 光学学报 2018(10)
    • [20].连续变量量子通信的研究与展望[J]. 电子测量与仪器学报 2014(01)
    • [21].超微弱生物光子辐射的实验及分析方法研究[J]. 生物医学工程研究 2014(04)
    • [22].损耗对表面等离子体激元压缩态的影响[J]. 物理学报 2011(02)
    • [23].利用纠缠—压缩光脉冲进行定位[J]. 科技信息 2010(12)
    • [24].用平衡零拍来测量噪声的传递特性[J]. 科技视界 2014(05)
    • [25].基于平衡零拍时间测量的位相问题[J]. 量子光学学报 2013(01)
    • [26].光场压缩态与纠缠态的增强及量子信息网络[J]. 山西大学学报(自然科学版) 2012(02)
    • [27].基于压缩态的连续变量量子对话协议[J]. 量子电子学报 2011(03)
    • [28].压缩真空态下耗散腔中的Casimir能量[J]. 白城师范学院学报 2018(12)
    • [29].平面自旋压缩态的产生与原子干涉的机理[J]. 物理学报 2015(16)
    • [30].三类互不等价的压缩算符[J]. 大学物理 2018(08)

    标签:;  ;  ;  ;  

    基于列存储数据库的数据压缩研究与实现
    下载Doc文档

    猜你喜欢