基于聚类和矩阵的关联规则挖掘研究

基于聚类和矩阵的关联规则挖掘研究

论文摘要

自20世纪80年代后期数据挖掘理论出现以来,数据挖掘有了突飞猛进的发展。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。本文主要关注数据挖掘的一个重要领域:关联规则分析。自1993年R.Agrawal提出了关联规则问题以后,引起了众多专家学者的广泛关注,使关联规则挖掘成为数据挖掘领域里最为活跃的研究方向之一。本文首先介绍了关联规则问题及其两个典型算法——Apriori算法和FP-growm算法。在分析了Apriori算法的性能瓶颈和基于Apriori算法的改进算法的基础上,提出了一种基于聚类和矩阵的关联规则挖掘算法——CM-Apriori算法,该算法只需扫描事务数据库一次,直接按事务项数聚类成矩阵,每次只需对部分聚类矩阵进行运算,就可以生成频繁项集,大大减少了扫描数据库的次数和计算成本,从而有效提高了算法的运算效率,实例分析和性能研究表明该算法优于同类算法。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 图表目录
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 数据挖掘的研究现状
  • 1.2.2 关联规则的研究现状
  • 1.3 本文的研究内容和结构
  • 第二章 数据挖掘概述
  • 2.1 数据挖掘的概念
  • 2.2 数据挖掘的过程
  • 2.3 数据挖掘的功能
  • 2.4 数据挖掘的方法
  • 2.5 数据挖掘的应用领域
  • 第三章 关联规则挖掘算法
  • 3.1 关联规则问题
  • 3.1.1 基本概念及性质
  • 3.1.2 关联规则的分类
  • 3.1.3 关联规则的挖掘
  • 3.2 Apriori算法
  • 3.2.1 Apriori算法的过程
  • 3.2.2 Apriori算法的评价
  • 3.2.3 基于Apriori算法的改进算法
  • 3.3 FP-growth算法
  • 3.4 小结
  • 第四章 基于聚类和矩阵的关联规则挖掘算法
  • 4.1 算法准备
  • 4.2 基于聚类和矩阵的关联规则挖掘算法
  • 4.2.1 算法过程
  • 4.2.2 算法的伪代码
  • 4.3 Apriori算法和CM-Apriori算法的评估
  • 4.4 小结
  • 第五章 总结与展望
  • 5.1 论文总结
  • 5.2 进一步展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于聚类和矩阵的关联规则挖掘研究
    下载Doc文档

    猜你喜欢