论文摘要
频繁项集挖掘可以广泛应用在关联规则挖掘、相关性分析、入侵检测、序列模式、分类和聚类等多种数据挖掘任务中。迄今为止已经提出了许多高效的频繁项集挖掘算法。本文对大量频繁项集挖掘算法进行了深入的研究,重点分析了几种经典模式增长算法中事务数据库在内存中的存储结构,以及各种有效的实现技术,并在此基础之上提出了新的算法。首先,对关联规则和频繁项集挖掘的相关概念、研究现状及所面临的问题进行了分析研究。并对几种典型的频繁项集挖掘算法进行了详尽分析,比较了它们各自的优缺点及适用环境。其次,对大量已有算法中事务数据库在内存中的存储结构,以及各种有效的实现技术进行了详细研究,重点分析了几种经典模式增长算法采用的数据结构和挖掘策略。最后,对三种采用的技术—FP-Tree、FP-Array以及Bitmap-Count进行了详尽地探讨,并在此基础上设计出了一种新的频繁项集挖掘算法—MS-Miner。实验结果表明MS-Miner算法不仅在算法执行性能上更优,而且在内存消耗和可扩展性上都有较好的表现,是一个高效的频繁项集挖掘算法。
论文目录
摘要Abstract第一章 前言1.1 研究工作背景1.2 本文研究的内容和创新之处1.3 本文的组织结构第二章 相关概念及研究现状2.1 关联规则综述2.1.1 关联规则相关概念2.1.2 挖掘关联规则的基本步骤2.2 频繁项集挖掘问题描述2.2.1 频繁项集挖掘相关概念2.2.2 最大频繁项集挖掘和封闭频繁项集挖掘2.3 几种典型的频繁项集挖掘算法2.3.1 两种经典的频繁项集挖掘算法2.3.2 三种高效频繁项集挖掘算法第三章 MS-MINER(MULTI-STRATEGY MINER)的设计与实现3.1 相关问题回顾和研究现状3.1.1 问题回顾3.1.2 候选项产生和检测方法3.1.3 模式增长方法3.2 MS-MINER算法采用的三种技术3.2.1 FP-Tree数据结构3.2.2 FP-Array技术3.2.3 Bitmap-Count技术3.3 MS-MINER算法描述第四章 实验与结果分析4.1 实验环境4.2 测试数据集4.3 实验结果分析第五章 总结和下一步研究工作展望5.1 总结5.2 下一步研究工作展望参考文献攻读硕士学位期间所发表的论文致谢
相关论文文献
标签:频繁项集挖掘论文; 算法论文;