数据仓库中物化视图的增量维护研究

数据仓库中物化视图的增量维护研究

论文摘要

数据仓库拥有海量的数据,对其进行复杂查询速度往往较慢。物化视图作为一种有效地手段,通过预计算的方法,能够有效地提高查询速度,及时响应用户请求。为了能保证与数据源的一致性,当数据源发生变化时,物化视图需要进行及时地维护。聚集查询作为数据仓库和联机分析处理中的关键查询,其计算效率直接影响到整个系统的性能。通过将聚集查询的结果保存到物化视图中,可以有效地提高聚集查询的效率。本文着重研究了影响物化视图维护的聚集函数的性质,根据不同函数的特点,分别提出了各自的增量(或近似增量)的维护算法或方案,主要从以下三个部分研究了物化聚集视图的增量维护:第一部分,针对分布性聚集函数和代数性聚集函数,提出的基于工作区函数的模型,利用该模型,可以解决很多复杂的、具有良好工程价值的聚集函数在物化视图中如何实现增量维护,同时对用户自定义的函数提供了良好的支持;第二部分,针对排名函数,通过简单地增加一定地辅助空间,近似实现了增量维护,有效地提高了排名查询的效率;第三部分,针对中值函数,利用辅助度量集字段和移动窗口技术,以空间的代价换来了视图维护效率的提高。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题研究背景及意义
  • 1.2 当前研究现状以及选题依据
  • 1.3 课题的主要研究内容
  • 第二章 数据仓库与物化视图维护
  • 2.1 数据仓库概述
  • 2.2 联机分析处理简介
  • 2.2.1 联机分析处理的定义
  • 2.2.2 多维分析
  • 2.3 物化视图
  • 2.3.1 视图维护
  • 2.3.2 视图同步
  • 2.3.3 视图调整
  • 2.3.4 视图使用
  • 2.3.5 视图选择
  • 2.4 商业智能计算测试
  • 2.5 本章小结
  • 第三章 复杂聚集查询的物化视图维护
  • 3.1 聚集查询
  • 3.1.1 聚集查询与物化视图维护
  • 3.1.2 聚集函数的特性
  • 3.2 聚集函数的增量计算模型
  • 3.2.1 基本函数集
  • 3.2.2 导出函数集
  • 3.3 基于工作区函数维护视图
  • 3.3.1 视图重写
  • 3.3.2 视图增量维护
  • 3.4 立方体计算与工作区函数
  • 3.5 本章小结
  • 第四章 TOP-K 查询的物化视图维护
  • 4.1 TOP-K查询简介
  • 4.1.1 Top-k 查询的概念
  • 4.1.2 Top-k 查询的问题
  • 4.2 TOP-K查询与物化视图
  • 4.3 TOP-K视图增量维护算法
  • 4.3.1 MV′的维护算法
  • 4.3.2 kmax 取值分析
  • 4.3.3 Top-k 视图维护算法改进
  • 4.4 本章小结
  • 第五章 含有中值函数的物化视图增量维护
  • 5.1 中值函数与物化视图维护
  • 5.2 辅助度量集字段
  • 5.3 移动窗口技术
  • 5.3.1 移动窗口
  • 5.3.2 中值函数移动窗口增量维护算法
  • 5.4 本章小结
  • 第六章 实验与分析
  • 6.1 实验环境
  • 6.2 复杂聚集查询的视图维护算法
  • 6.3 TOP-K查询的视图维护算法
  • 6.4 含有中值函数的物化视图的维护算法
  • 第七章 总结
  • 7.1 总结
  • 7.2 进一步工作
  • 参考文献
  • 致谢
  • 在学期间的研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    数据仓库中物化视图的增量维护研究
    下载Doc文档

    猜你喜欢