基于维层次数据立方体存储技术的研究

基于维层次数据立方体存储技术的研究

论文摘要

数据立方体是数据仓库和联机分析处理的核心概念。为了加速响应联机分析处理系统中的复杂多维查询,通常需要预先计算并保存数据立方体,然而数据立方体的巨大尺寸却给其计算和存储带来诸多难题。因此,降低磁盘空间成本和提高查询性能成为数据立方体研究两个重要却又相互制约的目标。为了从根本上解决这些问题,需要探索有效的数据立方体组织方法。本文首先改进实现了计算维层次数据立方体的ICODH方法,该算法在给定的维顺序下,自底向上逐层递归计算;当具体到某一个维,是从维的粗粒度层到细粒度层方向循环计算聚集;通过共享排序来减少磁盘的读写操作,以减小维层次数据立方体的计算时间。另一方面研究了维层次编码技术,提出了一种对维表能有效进行层次编码的方法,保存了原有数据立方体的语义信息。通过这两方面来加快数据立方体的计算速度,提高其查询性能。浓缩数据立方是一种有效缩小数据立方尺寸的机制,但仍然存在大量的前缀冗余,如小方内的前缀冗余和小方间的前缀冗余。对此,本文扩展实现了一种基于维层次的数据立方组织结构IDHC,它结合基本单元组的浓缩和小方内的前缀共享技术,利用维层次的特点,将具有相同聚集维集(或单值维集)的立方元组聚簇,同一簇内的元组以共享前缀的形式组织来进一步减小立方体的压缩尺寸。同时在物理存储这些元组时为了减小因共享前缀而进行大量元组之间的比较,又提出了批处理生成元组的算法。该算法消除了仅包含单个聚集维的数据小方内元组间的比较,并以批处理模式计算IDHC。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 近似计算型立方体
  • 1.2.2 特殊存储结构型立方体
  • 1.2.3 实例化视图选择方式
  • 1.2.4 语义压缩型立方体
  • 1.3 课题主要研究内容
  • 第二章 联机分析处理和数据立方体
  • 2.1 联机分析处理
  • 2.2 数据立方体基本概念
  • 2.3 数据立方体的计算
  • 2.4 数据立方体的查询操作
  • 2.5 数据立方体的优化策略
  • 2.6 小结
  • 第三章 维层次数据立方体计算技术的研究
  • 3.1 维的层次特性
  • 3.2 改进的维层次立方体的计算方法
  • 3.2.1 基于BUC算法的维层次计算方法
  • 3.2.2 改进的维层次计算方法
  • 3.3 维层次编码
  • 3.4 小结
  • 第四章 改进的维层次数据立方体
  • 4.1 基本概念
  • 4.2 IDHC数据立方
  • 4.2.1 浓缩数据立方
  • 4.2.2 Prefix数据立方
  • 4.2.3 IDHC生成算法
  • 4.3 实验分析
  • 4.3.1 实验数据集
  • 4.3.2 立方体压缩率
  • 4.3.3 立方体计算时间
  • 4.4 小结
  • 第五章 总结与展望
  • 5.1 本文工作总结
  • 5.2 工作展望
  • 参考文献
  • 致谢
  • 攻读学位期间主要的研究成果
  • 相关论文文献

    • [1].数据立方体格与概念格关系研究[J]. 软件导刊 2018(08)
    • [2].数据立方体技术在电力数据统计分析中的运用与研究[J]. 科技创新导报 2016(31)
    • [3].数据立方体格的图结构特性研究[J]. 计算机工程 2017(02)
    • [4].网络舆情话题的数据立方体模型分析[J]. 图书情报工作 2011(24)
    • [5].面向数字城市多源数据的空间数据立方体分析研究[J]. 计算机应用研究 2008(02)
    • [6].构建高维度数据立方体的有向图方法[J]. 沈阳师范大学学报(自然科学版) 2018(01)
    • [7].基于数据立方体预测针灸相关疾病-基因-药物新关联[J]. 湖南科技学院学报 2019(05)
    • [8].多维数据立方体的分块与压缩设计[J]. 微处理机 2015(04)
    • [9].面向数字城市多源数据的空间数据立方体数据组织研究[J]. 计算机应用研究 2008(05)
    • [10].一种特殊DATA CUBE的技术研究[J]. 乐山师范学院学报 2013(05)
    • [11].基于数据脑的神经图像元数据立方体构建技术[J]. 广西师范大学学报(自然科学版) 2011(01)
    • [12].数据立方体选择的改进遗传算法[J]. 计算机科学 2010(11)
    • [13].集合上封闭立方体的计算[J]. 计算机工程与应用 2011(33)
    • [14].基于MapReduce的封闭数据立方[J]. 计算机研究与发展 2011(S3)
    • [15].大规模多维网络数据分析框架的研究与实现[J]. 计算机科学与探索 2017(12)
    • [16].基于数据立方体的评估特征项生成方法[J]. 指挥控制与仿真 2019(03)
    • [17].空间数据仓库综述[J]. 许昌学院学报 2010(02)
    • [18].政区地图与数据立方体结合的联机可视化方法[J]. 测绘通报 2019(09)
    • [19].基于数据立方体的OLAP技术[J]. 科技资讯 2008(07)
    • [20].PHCC:一种处理稀疏变化的封闭数据立方体算法[J]. 计算机研究与发展 2013(S2)
    • [21].扩展流数据立方体的GIS时空大数据组织方法[J]. 测绘通报 2018(08)
    • [22].高效支持多维网络OLAP的数据立方体模型CI-DCG[J]. 高技术通讯 2013(10)
    • [23].大集中下地方数据返还和报表展现[J]. 金融电子化 2011(06)
    • [24].用户兴趣驱动的冰山数据立方体构建及更新方法研究[J]. 计算机科学 2009(12)
    • [25].OLAP多维数据分析在企业决策管理中的应用[J]. 计算机产品与流通 2019(01)
    • [26].在PC集群上的封闭立方体计算[J]. 计算机科学 2009(06)
    • [27].一种流数据立方体分析挖掘框架[J]. 电信科学 2014(09)
    • [28].干涉型成像光谱仪仿真及评价系统的实现[J]. 光学技术 2008(05)
    • [29].股票数据立方体的构造[J]. 福建电脑 2014(10)
    • [30].一种基于CUBE的语义OLAP的I/O优化算法[J]. 微计算机信息 2010(24)

    标签:;  ;  ;  ;  

    基于维层次数据立方体存储技术的研究
    下载Doc文档

    猜你喜欢