论文摘要
时态数据库是对传统关系型数据库的扩展,因此时态数据库对时态聚集查询的支持是非常重要的。由于时态聚集查询在数据仓库应用中的重要性,时态聚集查询已经成为时态数据库技术中的研究热点之一。现有的时态聚集算法存在着查询内存空间需要较大、处理开销较高、基于复杂的数据结构(不能适用于现有的商业产品中)等缺点。基于这些缺点,本文提出了两种基于有限误差近似技术的改进算法。第一种是基于多版本B树的改进算法,针对查询内存空间占用大和时间开销大的缺点,由于引入了近似技术,该算法的空间开销大大减少,因此在最坏情况下的查询开销为对数级,但该算法并没有解决基于复杂的数据结构,因此并不适合在商业产品中实现;第二种算法采用B-树和R-树相结合的算法,针对现有算法查询内存空间需要较大、处理开销较高、特别是基于复杂的数据结构的缺点,采用现代广泛应用于商业产品中的数据结构B-树和R-树,并结合近似技术来解决这个问题。该算法查询开销也可以达到对数级,因此在现代商业产品中实现的可能性大大提升。本文对于以上两种算法的结果,分别进行了理论证明和实验证明,结果表明这两种算法的确在空间开销上有了数量级上的优化,并且其时间复杂度达在很大程度上得到了提高。以往用户对于历史数据的检索都是基于精确查询的,但是事实上并不需要那么精确,有时仅仅是想了解一个趋势,因此近似技术的应用使用户能够高效的查询历史数据,了解趋势的发展,以便制定发展方向。