近似技术在时态计数及求和聚集计算中的应用

近似技术在时态计数及求和聚集计算中的应用

论文摘要

时态数据库是对传统关系型数据库的扩展,因此时态数据库对时态聚集查询的支持是非常重要的。由于时态聚集查询在数据仓库应用中的重要性,时态聚集查询已经成为时态数据库技术中的研究热点之一。现有的时态聚集算法存在着查询内存空间需要较大、处理开销较高、基于复杂的数据结构(不能适用于现有的商业产品中)等缺点。基于这些缺点,本文提出了两种基于有限误差近似技术的改进算法。第一种是基于多版本B树的改进算法,针对查询内存空间占用大和时间开销大的缺点,由于引入了近似技术,该算法的空间开销大大减少,因此在最坏情况下的查询开销为对数级,但该算法并没有解决基于复杂的数据结构,因此并不适合在商业产品中实现;第二种算法采用B-树和R-树相结合的算法,针对现有算法查询内存空间需要较大、处理开销较高、特别是基于复杂的数据结构的缺点,采用现代广泛应用于商业产品中的数据结构B-树和R-树,并结合近似技术来解决这个问题。该算法查询开销也可以达到对数级,因此在现代商业产品中实现的可能性大大提升。本文对于以上两种算法的结果,分别进行了理论证明和实验证明,结果表明这两种算法的确在空间开销上有了数量级上的优化,并且其时间复杂度达在很大程度上得到了提高。以往用户对于历史数据的检索都是基于精确查询的,但是事实上并不需要那么精确,有时仅仅是想了解一个趋势,因此近似技术的应用使用户能够高效的查询历史数据,了解趋势的发展,以便制定发展方向。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 国内外时态数据库研究及时态聚集算法的现状与发展
  • 1.3 课题的意义目的和作者工作内容
  • 1.4 论文的组织
  • 第2章 时态数据库概述
  • 2.1 时态数据库术语
  • 2.2 时态数据库的特点
  • 2.3 时态数据模型
  • 2.3.1 历史关系数据库模型
  • 2.3.2 对象历史模型
  • 2.3.3 TempSQL模型
  • 2.3.4 双时态数据模型
  • 2.4 时态数据库的重要意义
  • 2.5 本章小结
  • 第3章 时态聚集技术
  • 3.1 时态聚集查询的术语
  • 3.1.1 元组排除
  • 3.1.2 元组分组
  • 3.1.3 分组排除
  • 3.1.4 重复消除
  • 3.1.5 聚集变量
  • 3.1.6 聚集函数位置
  • 3.1.7 时态分组
  • 3.2 多版本B树
  • 3.3 聚集处理技术
  • 3.4 强制最近邻查询
  • 3.5 本章小结
  • 第4章 近似技术在时态计数及求和聚集中的应用
  • 4.1 近似问题的提出和查询的简化
  • 4.2 一种基于MVB树近似求解LKST计数查询的算法
  • 4.3 一种基于B-树和R-树近似求解LKST计数查询的算法
  • 4.4 近似时态求和处理
  • 4.5 近似时态聚集算法的总结及性能分析
  • 4.6 本章小结
  • 第5章 实验分析
  • 5.1 空间比较
  • 5.2 MVB树近似求解LKST计数查询的算法分析
  • 5.3 基于B-树和R-树近似求解LKST计数查询算法分析
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    标签:;  ;  

    近似技术在时态计数及求和聚集计算中的应用
    下载Doc文档

    猜你喜欢