基于改进蚁群算法的数据仓库查询优化研究

基于改进蚁群算法的数据仓库查询优化研究

论文摘要

随着信息技术和决策支持系统的迅速发展,信息的潜在价值成为企业间竞争的新利器,数据仓库成为企业必然的选择,随着经济的发展和业务环境的变化,用户需求的不断提升,数据仓库已经进入一个快速发展的阶段。联机分析处理作为数据仓库系统的前端分析技术,对海量数据进行大量复杂的运算,并从多个角度以快速、直观的形式将查询结果呈现给决策人员,以便制定正确的方案增加效益。在数据仓库的应用中,用户的查询请求会经常涉及到多连接、聚集计算等操作,随着数据量的不断膨胀,查询请求响应时间已经成为影响数据仓库系统性能的关键性因素。因此,如何缩短用户响应时间成为数据仓库领域的一个研究热点。数据仓库的多连接查询优化属于NP问题,与典型的TSP问题极为相似。数据仓库应用的有效实现需要关系查询技术的支持,OLAP的多维数据模型采用二维关系进行管理,而且数据分析和数据挖掘的实现都是在多维数据或相关数据集上进行的,而这些多维数据或数据集的提取需要经过维表和事实表的连接操作来完成。对于每一个多连接查询都对应多个代价消耗不同的查询执行计划,查询执行计划的个数随关系的个数指数性增长,查询优化器需要能够通过优化算法在庞大的搜索空间中寻找代价消耗最小的查询执行计划。蚁群算法是一种最新发展的模拟蚂蚁群体觅食行为的仿生优化算法,该算法采用正反馈机制,易于与其它优化方法结合,在解决许多复杂优化问题中体现了较好的性能,如机器人路径规划、TSP问题、数据挖掘、图像处理等领域。但传统的蚁群算法在解决数据仓库查询优化的问题时,存在过早收敛、收敛速度慢等缺点,为了提高算法的全局搜索能力和收敛速度,本文从算法本身及其应用实现两个方面作了改进,主要创新点如下。第一:算法采用基于伪随机概率转移规则的城市选择策略,并融合基于“3-opt”的迭代局部寻优策略。该策略采用了确定性选择和随机性选择相结合的城市选择方法,在提高全局搜索能力的同时,也在一定程度上加快了收敛速度;同时,在每一次迭代结束,即蚂蚁完成路径构建步骤后,以“3-opt”为局部搜索策略进行迭代局部搜索,将当前解优化为局部最优解(非全局最优解),在一定程度上提高了最优解的质量。第二:基于连接操作的有序编码策略。改进的蚁群算法解决数据仓库中MJQO问题时,采用对join编码、而非对关系编码的策略,以尽可能避免两个结果集(或关系)之间进行笛卡尔积操作,缩小了搜索策略空间,同时也提高了优化算法的搜索效率。改进的蚁群算法在解决数据仓库多连接查询优化问题时,以左线性空间为搜索空间,采用有序串对连接进行编码,应用改进的蚁群算法找出全局最优搜索策略,分析了关键参数的选择对算法性能的影响,构建算法性能评估模型。实验结果表明,该改进策略加快了算法的收敛速度,并提高了最优解的质量。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 研究现状
  • 1.2.1 数据仓库查询优化研究现状
  • 1.2.2 本文完成的主要工作
  • 1.3 论文结构安排
  • 第二章 数据仓库与OLAP技术
  • 2.1 数据仓库
  • 2.1.1 数据仓库的产生及发展
  • 2.1.2 数据仓库的概念及特征
  • 2.1.3 数据仓库的体系结构
  • 2.1.4 数据仓库的多维模型
  • 2.1.4.1 星型结构
  • 2.1.4.2 雪花结构
  • 2.2 OLAP技术
  • 2.2.1 OLAP概念及特征
  • 2.2.2 OLAP操作
  • 2.2.3 OLAP的实现
  • 2.3 数据仓库和OLAP技术的研究和发展现状
  • 2.4 本章小结
  • 第三章 多连接查询优化研究
  • 3.1 多连接查询的研究背景
  • 3.2 多连接查询优化
  • 3.2.1 查询优化
  • 3.2.1.1 查询处理
  • 3.2.1.2 查询优化器
  • 3.2.2 多连接查询优化
  • 3.2.2.1 多连接查询的概念
  • 3.2.2.2 多连接查询的表示
  • 3.2.3 代价评估模型
  • 3.2.3.1 QEP的代价构成
  • 3.2.3.2 代价模型
  • 3.2.3.4 逻辑优化代价评估模型
  • 3.2.4 查询优化搜索算法
  • 3.3 本章小结
  • 第四章 蚁群算法
  • 4.1 引言
  • 4.2 蚁群算法的机制原理
  • 4.3 蚁群算法的模型特征
  • 4.3.1 TSP描述
  • 4.3.2 基本蚁群算法的数学模型
  • 4.3.3 基本蚁群算法程序结构流程
  • 4.4 最大最小蚁群系统
  • 4.4.1 信息素更新机制
  • 4.4.2 信息素限制机制
  • 4.4.3 信息素的初始化机制
  • 4.4.4 信息素平滑机制
  • 4.5 本章小结
  • 第五章 基于改进蚁群算法的数据仓库查询优化
  • 5.1 数据仓库查询优化问题描述
  • 5.2 改进的蚁群算法
  • 5.2.1 伪随机状态转移策略
  • 5.2.2 迭代局部搜索
  • 5.2.2.1 局部搜索的概念
  • 5.2.2.2 局部搜索策略
  • 5.2.2.3 迭代局部搜索机制
  • 5.3 算法设计
  • 5.3.1 算法初始化
  • 5.3.2 查询优化搜索
  • 5.3.3 迭代更新
  • 5.4 关键参数优化
  • 5.4.1 试验平台介绍
  • 5.4.2 信息素挥发因子ρ的选择
  • 5.4.3 信息启发式因子α的选择
  • 5.4.4 期望启发式因子β的选择
  • 5.5 逻辑优化评估
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 本文总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 附录A 图索引
  • 附录B 表索引
  • Appendix A Figure Index
  • Appendix B Table Index
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].分布式数据库查询优化方法[J]. 产业与科技论坛 2017(14)
    • [2].面向对象数据库模型、存储及查询优化的研究[J]. 数字通信世界 2017(09)
    • [3].试论面向异构类型的大数据查询优化措施[J]. 数码世界 2017(02)
    • [4].基于分布式数据库的查询优化方法探究[J]. 电子制作 2014(01)
    • [5].分布式数据库分片关系变换查询优化[J]. 电子设计工程 2011(08)
    • [6].数据集成系统中多查询优化的研究[J]. 科学技术与工程 2009(12)
    • [7].一个端到端的基于深度学习的查询优化引擎[J]. 赤峰学院学报(自然科学版) 2019(01)
    • [8].大数据环境下数据的查询优化研究[J]. 长治学院学报 2015(05)
    • [9].面向分布式数据库的相关子查询优化策略[J]. 华东师范大学学报(自然科学版) 2016(05)
    • [10].面向异构类型的大数据查询优化研究[J]. 自动化与仪器仪表 2016(04)
    • [11].列存储中的OLAP多查询优化方法[J]. 计算机科学与探索 2012(09)
    • [12].一种改进的分布式数据库查询优化算法[J]. 计算机应用 2008(S2)
    • [13].基于查询优化策略的语义缓存谓词化简[J]. 电子学报 2013(10)
    • [14].基于分布式数据库查询优化策略的研究[J]. 硅谷 2014(04)
    • [15].基于关系数据库的查询优化的方法研究[J]. 长沙通信职业技术学院学报 2012(01)
    • [16].数据库管理系统中查询优化的设计和实现措施[J]. 电子技术与软件工程 2018(15)
    • [17].海量数据查询优化[J]. 信息与电脑(理论版) 2010(22)
    • [18].基于窗口函数和分布式集群的可视化学术搜索系统数据查询优化[J]. 上海交通大学学报 2019(08)
    • [19].电商推荐系统中查询优化研究[J]. 哈尔滨商业大学学报(自然科学版) 2019(02)
    • [20].浅谈SQL server查询优化[J]. 黑龙江科技信息 2013(14)
    • [21].Oracle中常用的查询优化方法[J]. 电脑知识与技术 2011(29)
    • [22].HIS查询优化的设计与实现[J]. 福建电脑 2009(06)
    • [23].数据库管理系统中查询优化的设计与实现[J]. 电脑知识与技术 2018(25)
    • [24].关系数据库系统的查询优化设计及研究[J]. 煤炭技术 2012(08)
    • [25].无线传感器网络中基于关联度的多查询优化[J]. 计算机工程与应用 2011(21)
    • [26].网格环境下基于流水线的多重相似查询优化[J]. 软件学报 2010(01)
    • [27].关系数据库中基于区域聚类的多区域查询优化[J]. 北京工业大学学报 2008(07)
    • [28].分布式数据库查询优化分析[J]. 电子技术与软件工程 2015(03)
    • [29].浅析多关系SQL查询[J]. 无线互联科技 2015(15)
    • [30].基于云计算的多重查询优化系统[J]. 计算机工程 2014(09)

    标签:;  ;  ;  ;  ;  

    基于改进蚁群算法的数据仓库查询优化研究
    下载Doc文档

    猜你喜欢