
论文摘要
频繁模式挖掘是许多数据挖掘任务中的核心问题,有着广泛的应用。而现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。本文以频繁模式挖掘为切入点,系统地研究了频繁模式/效用频繁模式挖掘和动态维护的理论与方法。主要研究内容如下:1基于分享和继承策略的挖掘理论与方法从频繁模式构成的搜索空间入手,提出了贯穿全文的分享和继承挖掘策略。通过引进分享表结构,避免了由绝对的分而治之带来的重复遍历与计数,提高了挖掘效率;同时,在挖掘过程中根据数据集的局部子集特性动态地调整挖掘策略,给出了提高时间效率与节省空间消耗的优化方法。2效用频繁模式挖掘从分析现有频繁模式挖掘任务的局限性入手,提出了效用频繁模式挖掘模型。该模型同时考虑各项出现的次数及其对目标模型的不同影响程度,能够更好地处理实际的挖掘应用;拓展了频繁模式挖掘的任务。3频繁等价模式挖掘分析了频繁模式压缩表示的方法,提出频繁等价模式的概念和挖掘方法,它将频繁模式中具有等价关系的项集中在一个子空间内,在不丢失任何信息的同时极大地减少了频繁模式的冗余。通过与频繁闭合模式比较,表明其拥有更高的压缩率。4频繁模式的交互挖掘提出了基于分享表结构的交互挖掘方法。该方法可与分享和继承策略无缝地集成在一个框架下。通过尽量避免复杂数据结构的重建和充分利用已有的计算结果,极大地提升了挖掘的效率。5频繁模式的增量挖掘从分析增量挖掘机制入手,提出了基于分享和继承策略的增量挖掘方法。该方法可完全不依赖先前的挖掘方法,减少了大量的原库检索和计算,较好地解决了数据库发生变化下的频繁模式维护问题。6频繁模式在关联规则挖掘中的应用从分析关联规则挖掘入手,描述了频繁模式在关联规则挖掘中的作用;实现了规则生成算法,能够快速地由频繁模式生成规则。通过在数据集上的测试结果,验证了频繁模式挖掘的实际应用价值。本文还将交互挖掘与增量挖掘扩展到效用频繁模式挖掘中去,有效地解决了效用频繁模式的交互挖掘与增量挖掘问题。通过在不同数据集中与已有的各类算法做比较,证明了分享和继承策略的高效性,能较好地解决频繁模式/效用频繁模式挖掘中普遍存在重复扫描和遍历问题,提升了挖掘的效率。
论文目录
摘要ABSTRACT目录CONTENTS第一章 绪论1.1 研究背景1.2 频繁模式挖掘的主要问题1.3 本文的工作1.3.1 基于分享和继承策略的挖掘理论与方法1.3.2 效用频繁模式挖掘1.3.3 频繁等价模式挖掘1.3.4 频繁模式的动态维护1.3.5 频繁模式在关联规则挖掘中的应用1.4 本文的结构第二章 频繁模式挖掘技术综述2.1 频繁模式挖掘2.1.1 基于候选模式生成与测试的算法2.1.2 基于模式增长的算法2.2 频繁模式压缩2.2.1 最大频繁模式2.2.2 频繁闭合模式2.3 效用频繁模式挖掘2.4 频繁模式的交互挖掘2.5 频繁模式的增量挖掘2.6 关联规则挖掘2.7 小结第三章 基于分享和继承策略的挖掘算法3.1 引言3.2 频繁模式挖掘3.2.1 问题的定义3.2.2 模式构成的格3.3 基于分享和继承策略的挖掘算法3.3.1 频繁模式树FP-Tree3.3.2 分享表Share-Table3.3.3 Share-FPM算法3.3.4 分享和继承策略3.4 效用频繁模式挖掘3.4.1 效用挖掘3.4.2 效用频繁模式挖掘3.4.3 基于分享和继承策略的效用频繁模式挖掘模型3.5 效用频繁模式挖掘算法3.5.1 Share-UFPM算法3.5.2 算法分析3.6 性能分析3.6.1 试验数据集及特征3.6.2 频繁模式挖掘实验结果3.6.3 效用频繁模式挖掘实验结果3.7 小结第四章 频繁等价模式挖掘4.1 引言4.2 等价关系4.3 问题的定义4.4 频繁等价模式挖掘算法Share-FEPM4.5 实验结果4.6 小结第五章 频繁模式的交互挖掘5.1 引言5.2 问题的定义5.2.1 频繁模式的交互挖掘5.2.2 效用频繁模式的交互挖掘5.3 分享结构(Share-struct)的扩展5.4 频繁模式的交互挖掘算法5.4.1 Interactive-FPM算法5.4.2 算法分析5.5 效用频繁模式的交互挖掘算法5.5.1 Interactive-UFPM算法5.5.2 算法分析5.6 实验结果5.6.1 频繁模式交互挖掘实验结果5.6.2 效用频繁模式交互挖掘实验结果5.7 小结第六章 频繁模式的增量挖掘6.1 引言6.2 问题的定义6.2.1 频繁模式的增量挖掘6.2.2 效用频繁模式的增量挖掘6.3 频繁模式的增量挖掘算法6.3.1 IM-FPM算法6.3.2 算法分析6.4 效用频繁模式的增量挖掘算法6.4.1 IM-UFPM算法6.4.2 算法分析6.5 实验结果6.6 小结第七章 频繁模式在关联规则挖掘中的应用7.1 引言7.2 关联规则挖掘7.3 关联规则挖掘算法7.4 挖掘结果7.5 小结第八章 结论与展望8.1 结论8.2 工作展望参考文献致谢研究成果及发表的学术论文作者和导师简介附件
相关论文文献
标签:数据挖掘论文; 频繁模式论文; 效用频繁模式论文; 频繁等价模式论文; 动态维护论文;