关联规则数据挖掘方法的研究与实现

论文摘要

数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。经过十几年的努力,数据挖掘产生了许多新的概念和方法。特别是近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发展。数据挖掘可以挖掘出多种类型的模式,而其中描述给定数据集的项之间有趣联系的关联分析模式就是一个非常重要的研究方向。关联规则挖掘算法是关联规则数据挖掘研究中的主要内容,迄今为止已提出了许多高效的关联规则挖掘算法。本文对数据挖掘技术的产生进行了简要的回顾,在数据挖掘基本概念的基础上,对数据挖掘的对象、可发现的模式和经常使用的技术进行了详细的分类和总结。分析了数据挖掘技术的研究现状,对数据挖掘技术的热点研究领域进行了探讨,为本课题的全面开展奠定了基础。并对关联规则数据挖掘中的一些经典算法进行了系统的分析和总结,然后在此基础上提出了新的解决相应问题的关联规则挖掘算法。首先,提出了一种关联规则增量更新算法UPA。对UPA算法与FUP算法进行了分析与比较,实验结果显示,该算法有较好的性能。最后,提出了一种加权最大频繁项集挖掘算法WMFP。并对此算法进行了详细的分析。实验结果表明,该算法具有较好的扩展性,并在一定程度上解决了数据库中各项目具有不同重要性的问题。

论文目录

摘要

ABSTRACT

1 绪论

1.1 数据挖掘概述

1.1.1 数据挖掘的发展史

1.1.2 数据挖掘的过程

1.1.3 数据挖掘的功能

1.2 数据挖掘的应用、方法和发展趋势

1.2.1 数据挖掘的应用

1.2.2 数据挖掘的方法

1.2.3 数据挖掘发展趋势

1.3 数据挖掘的问题

1.3.1 数据挖掘方法和用户交互性问题

1.3.2 性能问题

1.3.3 数据库类型的多样性问题

1.4 论文的主要工作和改进、创新点

1.4.1 论文的主要工作

1.4.2 论文算法的改进和创新点

2 关联规则数据挖掘理论和算法

2.1 关联规则挖掘的基本概念

2.1.1 基本概念

2.1.2 关联规则分类

2.1.3 关联规则的挖掘步骤

2.2 关联规则数据挖掘算法

2.2.1 Apriori 经典挖掘算法

2.2.2 Apriori 算法的优化

2.2.3 FP-Tree 算法

2.3 本章小结

3 关联规则增量更新算法

3.1 关联规则增量更新算法概念和分类

3.1.1 关联规则增量更新算法基本概念

3.1.2 关联规则增量更新算法的分类

3.2 FUP 算法

3.2.1 FUP 算法的基本思想

3.2.2 FUP 算法的描述

3.2.3 FUP 算法的不足之处

3.3 UPA 算法

3.3.1 UPA 算法中的符号

3.3.2 问题分析

3.3.3 算法描述

3.3.4 算法的性能比较

3.4 本章小结

4 加权最大频繁项目集挖掘算法

4.1 引例

4.2 权值的分类

4.2.1 垂直权值

4.2.2 水平权值

4.2.3 混合权值

4.3 加权最大频繁项目集挖掘算法WMFP

4.3.1 相关概念

4.3.2 加权FP-Tree

4.3.3 算法策略

4.3.4 算法描述

4.3.5 算法示例

4.3.6 算法实验

4.4 本章小结

5 结论

致谢

参考文献

附录

关联规则数据挖掘方法的研究与实现

论文摘要

论文目录

相关论文文献

猜你喜欢