MS-Miner:一种新的频繁项集挖掘算法

MS-Miner:一种新的频繁项集挖掘算法

论文摘要

频繁项集挖掘可以广泛应用在关联规则挖掘、相关性分析、入侵检测、序列模式、分类和聚类等多种数据挖掘任务中。迄今为止已经提出了许多高效的频繁项集挖掘算法。本文对大量频繁项集挖掘算法进行了深入的研究,重点分析了几种经典模式增长算法中事务数据库在内存中的存储结构,以及各种有效的实现技术,并在此基础之上提出了新的算法。首先,对关联规则和频繁项集挖掘的相关概念、研究现状及所面临的问题进行了分析研究。并对几种典型的频繁项集挖掘算法进行了详尽分析,比较了它们各自的优缺点及适用环境。其次,对大量已有算法中事务数据库在内存中的存储结构,以及各种有效的实现技术进行了详细研究,重点分析了几种经典模式增长算法采用的数据结构和挖掘策略。最后,对三种采用的技术—FP-Tree、FP-Array以及Bitmap-Count进行了详尽地探讨,并在此基础上设计出了一种新的频繁项集挖掘算法—MS-Miner。实验结果表明MS-Miner算法不仅在算法执行性能上更优,而且在内存消耗和可扩展性上都有较好的表现,是一个高效的频繁项集挖掘算法。

论文目录

  • 摘要
  • Abstract
  • 第一章 前言
  • 1.1 研究工作背景
  • 1.2 本文研究的内容和创新之处
  • 1.3 本文的组织结构
  • 第二章 相关概念及研究现状
  • 2.1 关联规则综述
  • 2.1.1 关联规则相关概念
  • 2.1.2 挖掘关联规则的基本步骤
  • 2.2 频繁项集挖掘问题描述
  • 2.2.1 频繁项集挖掘相关概念
  • 2.2.2 最大频繁项集挖掘和封闭频繁项集挖掘
  • 2.3 几种典型的频繁项集挖掘算法
  • 2.3.1 两种经典的频繁项集挖掘算法
  • 2.3.2 三种高效频繁项集挖掘算法
  • 第三章 MS-MINER(MULTI-STRATEGY MINER)的设计与实现
  • 3.1 相关问题回顾和研究现状
  • 3.1.1 问题回顾
  • 3.1.2 候选项产生和检测方法
  • 3.1.3 模式增长方法
  • 3.2 MS-MINER算法采用的三种技术
  • 3.2.1 FP-Tree数据结构
  • 3.2.2 FP-Array技术
  • 3.2.3 Bitmap-Count技术
  • 3.3 MS-MINER算法描述
  • 第四章 实验与结果分析
  • 4.1 实验环境
  • 4.2 测试数据集
  • 4.3 实验结果分析
  • 第五章 总结和下一步研究工作展望
  • 5.1 总结
  • 5.2 下一步研究工作展望
  • 参考文献
  • 攻读硕士学位期间所发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  

    MS-Miner:一种新的频繁项集挖掘算法
    下载Doc文档

    猜你喜欢