论文摘要
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。经过十几年的努力,数据挖掘产生了许多新的概念和方法。特别是近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发展。数据挖掘可以挖掘出多种类型的模式,而其中描述给定数据集的项之间有趣联系的关联分析模式就是一个非常重要的研究方向。关联规则挖掘算法是关联规则数据挖掘研究中的主要内容,迄今为止已提出了许多高效的关联规则挖掘算法。本文对数据挖掘技术的产生进行了简要的回顾,在数据挖掘基本概念的基础上,对数据挖掘的对象、可发现的模式和经常使用的技术进行了详细的分类和总结。分析了数据挖掘技术的研究现状,对数据挖掘技术的热点研究领域进行了探讨,为本课题的全面开展奠定了基础。并对关联规则数据挖掘中的一些经典算法进行了系统的分析和总结,然后在此基础上提出了新的解决相应问题的关联规则挖掘算法。首先,提出了一种关联规则增量更新算法UPA。对UPA算法与FUP算法进行了分析与比较,实验结果显示,该算法有较好的性能。最后,提出了一种加权最大频繁项集挖掘算法WMFP。并对此算法进行了详细的分析。实验结果表明,该算法具有较好的扩展性,并在一定程度上解决了数据库中各项目具有不同重要性的问题。
论文目录
摘要ABSTRACT1 绪论1.1 数据挖掘概述1.1.1 数据挖掘的发展史1.1.2 数据挖掘的过程1.1.3 数据挖掘的功能1.2 数据挖掘的应用、方法和发展趋势1.2.1 数据挖掘的应用1.2.2 数据挖掘的方法1.2.3 数据挖掘发展趋势1.3 数据挖掘的问题1.3.1 数据挖掘方法和用户交互性问题1.3.2 性能问题1.3.3 数据库类型的多样性问题1.4 论文的主要工作和改进、创新点1.4.1 论文的主要工作1.4.2 论文算法的改进和创新点2 关联规则数据挖掘理论和算法2.1 关联规则挖掘的基本概念2.1.1 基本概念2.1.2 关联规则分类2.1.3 关联规则的挖掘步骤2.2 关联规则数据挖掘算法2.2.1 Apriori 经典挖掘算法2.2.2 Apriori 算法的优化2.2.3 FP-Tree 算法2.3 本章小结3 关联规则增量更新算法3.1 关联规则增量更新算法概念和分类3.1.1 关联规则增量更新算法基本概念3.1.2 关联规则增量更新算法的分类3.2 FUP 算法3.2.1 FUP 算法的基本思想3.2.2 FUP 算法的描述3.2.3 FUP 算法的不足之处3.3 UPA 算法3.3.1 UPA 算法中的符号3.3.2 问题分析3.3.3 算法描述3.3.4 算法的性能比较3.4 本章小结4 加权最大频繁项目集挖掘算法4.1 引例4.2 权值的分类4.2.1 垂直权值4.2.2 水平权值4.2.3 混合权值4.3 加权最大频繁项目集挖掘算法WMFP4.3.1 相关概念4.3.2 加权FP-Tree4.3.3 算法策略4.3.4 算法描述4.3.5 算法示例4.3.6 算法实验4.4 本章小结5 结论致谢参考文献附录
相关论文文献
标签:关联规则论文; 更新挖掘论文; 加权最大频繁集论文;