基于约束的最大频繁项目集挖掘算法与实现

基于约束的最大频繁项目集挖掘算法与实现

论文摘要

数据库技术的逐渐成熟及网络技术的迅速普及,使人们采集数据的能力得到了极大的提高,从而导致了全球范围内数据存储量的急剧增大。“数据爆炸与知识贫乏”是信息时代所面临的一个严峻的问题,而数据挖掘就是解决该问题的有效手段之一。数据挖掘是从大规模的数据量中获取有用信息,发现隐含的、先前未知的、对决策有潜在价值的知识,因此对数据挖掘技术的研究有着重要的意义。本文以数据挖掘中一个重要的领域关联规则挖掘为研究课题,并对关联规则的挖掘方法进行了研究和分析。本文的研究工作主要包括以下两个方面:一方面,提出了基于数据库变化的关联规则增量式更新算法。发现频繁项目集是关联规则数据挖掘中的关键问题,频繁项目集是在给定的数据库里,在满足最小支持度和最小置信度下的一个项目集合。但随着数据库发生变化,就会产生不同的频繁项目集,如何发现在数据库变化情况下,利用已挖掘的频繁项目集来实现更新挖掘就是需研究的问题。另一方面,提出了基于约束的最大频繁项集挖掘算法,该算法是将约束条件应用到挖掘算法中,减少候选项目集的个数,提高算法的执行效率。对算法进行了详细的分析。实验结果表明,该算法具有较好的可操作性,并在一定程度上解决了产生许多无关或无价值的关联规则。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 研究发展趋势
  • 1.4 本文的主要工作和创新点
  • 1.4.1 论文的主要工作
  • 1.4.2 论文算法创新点
  • 2 数据挖掘技术
  • 2.1 数据挖掘的概念
  • 2.2 数据挖掘的理论基础
  • 2.3 数据挖掘的分类
  • 2.4 数据挖掘的应用
  • 2.5 数据挖掘的研究方向和面临的困难
  • 2.5.1 挖掘方法和用户交互问题
  • 2.5.2 性能问题
  • 2.5.3 关于数据库类型的多样性问题
  • 3 关联规则挖掘理论
  • 3.1 引言
  • 3.2 关联规则挖掘理论
  • 3.2.1 关联规则挖掘问题的形式化描述
  • 3.2.2 关联规则的相关定义
  • 3.2.3 关联规则的分类
  • 3.3 关联规则挖掘算法
  • 3.3.1 关联规则的挖掘过程
  • 3.3.2 关联规则挖掘的经典算法
  • 3.3.3 关联规则的生成
  • 3.4 关联规则相关研究概述
  • 3.4.1 广义关联规则
  • 3.4.2 有价值关联规则的判别
  • 3.4.3 并行和分布式挖掘
  • 3.5 小结
  • 4 关联规则的更新维护算法
  • 4.1 引言
  • 4.2 关联规则频繁项集理论
  • 4.2.1 关联规则更新的形式化描述
  • 4.2.2 相关工作
  • 4.3 基于数据库变化的快速增量更新算法(M-IUA)
  • 4.3.1 问题分析
  • 4.3.2 解决策略
  • 4.3.3 更新算法描述
  • 4.3.4 算法分析
  • 4.3.5 小结
  • 5 约束最大频繁集关联规则挖掘算法
  • 5.1 引言
  • 5.2 约束型关联规则挖掘理论
  • 5.2.1 约束的形式
  • 5.2.2 项约束关联规则挖掘的相关研究
  • 5.3 约束最大频繁项集挖掘算法(FCMFS)
  • 5.3.1 相关工作
  • 5.3.2 约束最大频繁项集挖掘算法(FCMFS)
  • 5.3.3 算法举例与分析
  • 5.3.4 小结
  • 6 结论
  • 6.1 总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    • [1].建立频繁项目集向量的极大频繁项目集挖掘[J]. 系统工程与电子技术 2009(10)
    • [2].基于二进制的长频繁项目集挖掘算法[J]. 计算机工程与设计 2008(24)
    • [3].关联规则挖掘中的极大频繁项目集[J]. 计算机与应用化学 2009(11)
    • [4].基于分布式数据入侵检测模型研究[J]. 计算机仿真 2010(06)
    • [5].关联规则Apriori改进算法[J]. 首都师范大学学报(自然科学版) 2009(S1)
    • [6].一种结合散列与位表挖掘频繁项目集算法[J]. 计算机科学 2010(12)
    • [7].一种基于频繁模式树的最大频繁项目集挖掘算法[J]. 小型微型计算机系统 2010(02)
    • [8].基于二进制的长频繁项空间数据挖掘算法[J]. 计算机时代 2008(10)
    • [9].一种基于分布式数据库的关联规则挖掘新算法[J]. 计算机技术与发展 2011(02)
    • [10].二进制的交叉挖掘关联规则研究[J]. 计算机工程与应用 2009(07)
    • [11].基于项目集格及位图索引的频繁项目集发现算法[J]. 系统工程理论与实践 2008(02)
    • [12].改进的关联规则算法在数据挖掘中的探讨[J]. 制造业自动化 2012(12)
    • [13].一种改进的频繁项目集挖掘算法[J]. 阜阳师范学院学报(自然科学版) 2013(01)
    • [14].关联规则Apriori算法改进研究与应用[J]. 首都师范大学学报(自然科学版) 2010(06)
    • [15].一种约束最大频繁项目集快速挖掘算法研究[J]. 海南大学学报(自然科学版) 2009(04)
    • [16].一种快速的自顶向下挖掘算法[J]. 计算机应用与软件 2014(05)
    • [17].一种基于极大团的关键时间段挖掘方法[J]. 计算机科学 2012(06)
    • [18].基于二分搜索的最大频繁项目集求解算法改进[J]. 计算机应用与软件 2010(05)
    • [19].一种新的频繁闭项目集挖掘算法(英文)[J]. Journal of Southeast University(English Edition) 2008(03)
    • [20].数据挖掘中关联规则算法的研究[J]. 电脑知识与技术 2011(26)
    • [21].基于集合和位运算的频繁集挖掘优化算法[J]. 科学技术与工程 2009(23)
    • [22].基于Apriori模型的海洋灾害预警数据挖掘技术[J]. 山东科学 2009(02)
    • [23].关联规则DHP算法的研究与分析[J]. 佛山科学技术学院学报(自然科学版) 2012(02)
    • [24].一种事务互补挖掘算法的研究及应用[J]. 计算机工程与应用 2008(35)
    • [25].基于分布式数据入侵检测模型研究[J]. 中南林业科技大学学报 2010(03)
    • [26].快速挖掘频繁项目集算法[J]. 计算机工程与设计 2009(08)
    • [27].一种基于DHP算法的频繁项集改进方法[J]. 科技视界 2013(31)
    • [28].关联规则挖掘在高校奖学金评定中的应用[J]. 宁夏师范学院学报 2010(06)
    • [29].增量更新关联规则挖掘算法研究[J]. 计算机与现代化 2009(02)
    • [30].一种新的改进的Apriori算法[J]. 微计算机信息 2009(12)

    标签:;  ;  ;  ;  ;  

    基于约束的最大频繁项目集挖掘算法与实现
    下载Doc文档

    猜你喜欢