Improving Materialized View Selection under Storage Constraint

Improving Materialized View Selection under Storage Constraint

论文摘要

数据仓库和OLAP:在存储约束条件下改进物化视图选择数据仓库和联机分析处理(OLAP)已经渐渐成为数据库行业的中心,它们的能力和保障大大的提高了公司活动的成功率。数据仓库开发的一个重要的问题是物化视图集的选择,为了加快联机分析处理查询速度,需要限制空间和维护时间。另一方面,物化视图选择问题是一个NP问题,在三维模型中,视图的数目随着属性的增加而爆炸性的增长,并且高存储成本和高计算成本使它对于任何系统来说,要物化所有可能的视图都是不可行的。因此,物化所有的视图成为OLAP研究领域中的一个重要挑战。为了解决视图数目和存储成本的问题,本文提出了一种改进的贪婪算法,该算法在基于权重的情况下,选择最佳的视图进行物化。本文的第一部分首先回顾了数据仓库方面的基本概念,然后介绍联机分析处理的架构以及视图选择策略的处理。第二部分回顾了关于物化视图选择的相关工作,包括数据仓库和OLAP技术领域的许多研究成果,以及OLAP查询优化方面取得的成就,特别是物化视图选择的使用方面。第三部分提出了一种针对视图选择和物化的改进算法,在某些存储限制的情况下,该算法从候选视图集中选择一个最大程度利用单位空间的视图进行物化,一旦达到空间限制约束条件,并得到一个新的查询频率,就把物化视图集中最小花费的视图删除,重复执行该操作直到选择了一个最佳的物化视图集为止。最后,本文给出了该算法的仿真实验和查询结果。为了测试本算法的有效性,本文选择那些来自TPC-H基准查询集的查询作为我们的候选视图,因为这些查询结构都是由该候选视图集的第13次查询(视图)得到,本文添加了顶部视图,从而使其不能进行其他的查询。在本文的测试平台上,我们使用了复杂的SQL标准查询,查询集包含选择、映射、连接、存在或者不存在、外部连接,并且涵盖所有的常规聚合函数。我们在Windows Sever 2003操作系统上进行实验,内存为512兆,利用Microsoft SQL Server 2005查询生成器生成每一个查询结果,然后,利用Harinarayan等人提出的线性成本模型计算出每个查询的成本。根据实验结果的分析可以知道在进行第一次视图选择时,本文的算法和Harinarayan等人以及Chandrashekhar A. Dhote, Dr. M. S. Ali等人提出的经典贪婪算法具有同样的性能,然而,当在物化集中删除和添加新的视图时,本文的算法提高了物化视图选择的效率。

论文目录

  • Abstract
  • LIST OF FIGURES
  • LIST OF TABLES
  • CHAPTER 1:INTRODUCTION
  • 1.1 Decision support Overview
  • 1.2 Data warehouses and OLAP:Basic concepts
  • 1.2.1 Different schema models in Data warehouse
  • 1.2.2 Online Analytical Processing (OLAP)
  • 1.2.3 Data Cube
  • 1.3 Materializing views
  • 1.4 Selection of views to Materialized
  • 1.5 Motivation and Contribution of the Thesis
  • 1.6 Outline of the Thesis
  • CHAPTER 2:LITERATURE REVIEW
  • 2.1 Deterministic Algorithms
  • 2.2 Randomized Algorithm
  • 2.3 Evolutionary Algorithm
  • 2.5 Retrieval Queries in SQL
  • 2.5.1 Basic SQL Queries
  • 2.5.2 More Complex SQL Queries
  • CHAPTER 3:IMPROVING MATERIALIZED VIEW SELECTION UNDER STORAGECONSTRAINT
  • 3.1 The Proposed Strategy
  • 3.2 Problem Formulation
  • 3.3 Improving the BPUS heuristic algorithm
  • 3.4 Limitations of the Proposed Strategy
  • CHAPTER 4:EXPERIMENTAL RESULTS
  • 4.1 TPC-H Benchmark and a Query Set
  • 4.1.1 Queries used for performance evaluation of the algorithm
  • 4.1.2 An OUTER JOIN Operation
  • 4.1.3 The EXISTS and NOT EXISTS Functions in SQL
  • 4.1.4 The IN Operator in SQL
  • 4.2 Implementation of our improved heuristic algorithm
  • ACKNOWLEDGEMENTS
  • 附录A:详细的中文摘要
  • APPENDIX B:FIGURES FROM THE SIMULATION PROCESS
  • 相关论文文献

    • [1].标准视图在装备研制中的应用方法研究[J]. 标准科学 2017(03)
    • [2].物化视图在煤炭税收系统的应用[J]. 物联网技术 2017(03)
    • [3].由视图 求数量──确定堆积几何体中小正方体的个数[J]. 中学数学杂志 2011(06)
    • [4].小议向视图与基本视图的区别[J]. 时代教育 2016(18)
    • [5].孔子五视图[J]. 美术教育研究 2018(08)
    • [6].管理视图分析法在施工图预算中的应用[J]. 建筑经济 2017(09)
    • [7].多媒体直观视图法在建筑教学中的应用[J]. 教师 2015(20)
    • [8].多媒体直观视图法在建筑教学中的应用[J]. 中学时代 2014(04)
    • [9].AutoCAD中实体模型自动生成基本视图的研究[J]. 辽宁石油化工大学学报 2014(05)
    • [10].面向查询集覆盖的物化视图选择算法[J]. 小型微型计算机系统 2013(05)
    • [11].数据仓库中物化视图选择算法的分析和比较[J]. 计算机系统应用 2012(06)
    • [12].一种基于实视图的自适应查询优化系统框架[J]. 武汉大学学报(工学版) 2010(02)
    • [13].数据仓库中物化视图选择算法的分析和比较[J]. 科技风 2010(19)
    • [14].实视图选择研究[J]. 软件学报 2009(02)
    • [15].基于时间段查询的物化视图策略[J]. 计算机应用 2009(10)
    • [16].岗位知识视图构建研究[J]. 辽宁大学学报(自然科学版) 2008(02)
    • [17].一种基于双缓存的高速测控目标视图控制算法[J]. 兵器装备工程学报 2020(10)
    • [18].面向大数据的物化视图选择算法[J]. 计算机应用 2017(S1)
    • [19].基于遗传算法的物化视图选择优化[J]. 电脑知识与技术 2016(03)
    • [20].中考视图面面观[J]. 数理化学习(初中版) 2012(03)
    • [21].浅谈Visual FoxPro6.0查询和视图的区别[J]. 黑龙江教育(理论与实践) 2014(04)
    • [22].浅谈通信行业渠道视图规范管理[J]. 信息通信 2014(07)
    • [23].基于视图树的实视图动态选择[J]. 计算机研究与发展 2012(10)
    • [24].用物化视图实现广播监测数据的同步[J]. 广播电视信息 2011(06)
    • [25].ASP.NET2.0中GridView与FormView的主/详细视图的实现[J]. 福建电脑 2011(06)
    • [26].数据仓库中新型动态实视图选择调整算法[J]. 计算机工程与应用 2010(08)
    • [27].一种改进的物化视图动态批量调整算法[J]. 微计算机应用 2010(08)
    • [28].基于目标视图的数据交换引擎的研究[J]. 华南师范大学学报(自然科学版) 2009(02)
    • [29].零件图视图规范化表达在教学中的重要意义[J]. 职业技术 2009(10)
    • [30].一种基于视图的本体映射模型的构建[J]. 微计算机信息 2008(09)

    标签:;  ;  ;  

    Improving Materialized View Selection under Storage Constraint
    下载Doc文档

    猜你喜欢