基于频繁模式树的关联规则算法研究

基于频繁模式树的关联规则算法研究

论文摘要

数据挖掘是近年来迅速发展的信息处理技术,从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它涉及数据库、人工智能、机器学习、模式识别、知识工程、面向对象、信息检索和可视化等一系列技术。关联规则挖掘作为数据挖掘领域的一个重要研究分支,它的任务是发现所有满足支持度阈值和置信度阈值的强关联规则。关联规则挖掘算法是关联规则挖掘研究的主要内容,迄今为止已经提出了许多高效的关联规则挖掘算法。本文对经典的Apriori和AprioriTid算法以及不产生候选集的FP-Growth算法进行了分析和研究。FP-Growth算法比Apriori算法在性能上有了很大提高,它仅需要扫描数据库两次,并且避免了产生大量的候选项集。但FP-Growth算法主要的瓶颈之一就是空间开销大。为了节省空间,提高频繁项的发现效率,本文对传统的频繁模式树和项头表进行了优化,采用动态构造哈希链地址的方法来构造项头表,FP-Tree的每个结点只存储该项在项头表中的地址,避免了在地址上出现空指针,节省了存储空间的开销,同时增加树结点的域实现了方便的双向遍历。此外还通过对事务数据库按一定的规则进行了划分,得到若干个数据库子集,然后分别对每个数据库子集进行数据挖掘,因而占用内存小,解决了内存无法装入频繁模式树的问题,使数据挖掘得以顺利进行。最后通过实验对基于频繁模式树的关联规则挖掘的优化算法与传统的频繁模式树的FP-Growth算法进行了比较,实验结果表明在挖掘大量数据信息时更有效。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 论文研究的背景及意义
  • 1.2 国内外研究现状
  • 1.3 论文的主要工作
  • 1.4 论文的组织结构
  • 第2章 相关技术介绍
  • 2.1 数据挖掘和知识发现
  • 2.1.1 数据挖掘目的和方法
  • 2.1.2 数据挖掘过程
  • 2.1.3 数据挖掘分类
  • 2.1.4 数据挖掘对象
  • 2.2 关联规则挖掘技术
  • 2.2.1 关联规则的基本概念
  • 2.2.2 关联规则的分类
  • 2.3 本章小结
  • 第3章 关联规则挖掘算法
  • 3.1 层次迭代算法
  • 3.1.1 Apriori算法
  • 3.1.2 Apriori算法实例与分析
  • 3.1.3 AprioriTid算法
  • 3.1.4 Apriori算法的改进算法
  • 3.2 最大频繁项目集挖掘算法
  • 3.2.1 深度优先算法
  • 3.2.2 宽度优先算法
  • 3.3 本章小结
  • 第4章 基于频繁模式树的关联规则挖掘算法
  • 4.1 不产生候选集挖掘频繁项集的算法
  • 4.1.1 频繁模式增长算法
  • 4.1.2 频繁模式增长算法应用实例与分析
  • 4.2 基于频繁模式树和项头表的优化
  • 4.2.1 项头表的优化
  • 4.2.2 频繁模式树的优化
  • 4.3 基于事务数据库的优化
  • 4.3.1 优化的理论基础
  • 4.3.2 优化的思想方法
  • 4.3.3 事务数据库划分算法
  • 4.4 本章小结
  • 第5章 实验与性能分析
  • 5.1 实验环境及事务数据库
  • 5.2 算法测试和分析
  • 5.2.1 算法在census数据库上的测试
  • 5.2.2 算法在accidents数据库上的测试
  • 5.2.3 算法测试结果分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].分布式事务数据库系统评估体系[J]. 信息通信技术与政策 2019(05)
    • [2].分布式事务数据库评测体系研究与实践[J]. 中国金融电脑 2018(01)
    • [3].超市事务数据库中的关联规则的探讨[J]. 考试周刊 2008(41)
    • [4].热璞科技 分布式事务数据库基础软件[J]. 创业邦 2018(12)
    • [5].超市事务数据库挖掘关联规则的设计[J]. 时代经贸(下旬刊) 2008(04)
    • [6].基于Voronoi图的空间事务数据库构建方法研究[J]. 测绘科学 2009(02)
    • [7].一种基于SFP树的快速关联规则挖掘算法[J]. 计算机技术与发展 2011(05)
    • [8].寿险事务数据库挖掘关联规则的分析和设计[J]. 科技资讯 2008(16)
    • [9].基于数据库划分的关联规则算法[J]. 计算机工程与设计 2008(12)
    • [10].基于最大频繁项集挖掘的微博炒作群体发现方法[J]. 计算机工程与应用 2017(04)
    • [11].一种改进的关联规则挖掘算法研究[J]. 广东第二师范学院学报 2018(03)
    • [12].基于小生境遗传算法的关联规则挖掘方法[J]. 计算机工程 2008(10)
    • [13].可能世界语义下的概率频繁项集挖掘[J]. 新余学院学报 2016(01)
    • [14].基于事务粒的Apriori改进算法[J]. 洛阳师范学院学报 2015(08)
    • [15].一种基于单事务项集组合的频繁项集挖掘算法[J]. 计算机科学 2008(01)
    • [16].基于聚类分析和Apriori算法的个性化推荐研究[J]. 电子技术与软件工程 2020(14)
    • [17].一种针对大型事务数据库的关联规则挖掘算法[J]. 空军雷达学院学报 2011(03)
    • [18].一种改进的Apriori算法[J]. 软件导刊 2010(01)
    • [19].一种优化的Apriori算法[J]. 计算机系统应用 2008(01)
    • [20].采用布尔映射矩阵的Apriori算法改进研究[J]. 福建电脑 2020(03)
    • [21].基于关联规则分析的“购物篮分析”模型的研究[J]. 北京工商大学学报(社会科学版) 2008(04)
    • [22].关联规则挖掘的PredictiveApriori算法的研究及改进[J]. 四川大学学报(自然科学版) 2012(01)
    • [23].改进的Apriori算法在个性化推荐中的应用[J]. 通讯世界 2020(06)
    • [24].一种改进的关联规则Apriori挖掘算法[J]. 深圳信息职业技术学院学报 2011(01)
    • [25].基于事务标识符序列的频繁集发现方法[J]. 安阳工学院学报 2008(02)
    • [26].基于分区的关联规则Apriori算法研究[J]. 科技视界 2015(28)
    • [27].一种引入索引加速挖掘关联规则的高效算法[J]. 计算机工程与科学 2009(04)
    • [28].数据中心特征失真下的深度挖掘算法研究[J]. 科技通报 2013(12)
    • [29].邻接矩阵在高校图书馆借阅数据挖掘中的应用[J]. 现代情报 2011(08)
    • [30].基于隐私保护的关联规则挖掘算法[J]. 计算机与数字工程 2010(08)

    标签:;  ;  ;  ;  

    基于频繁模式树的关联规则算法研究
    下载Doc文档

    猜你喜欢