关联规则挖掘算法的改进与应用

关联规则挖掘算法的改进与应用

论文摘要

目前,关联规则作为数据挖掘领域中一个非常重要的研究课题,己经取得了令人瞩目的成绩,但在实际应用中,随着数据库规模逐渐增大,出现了随着数据量递增而算法挖掘效率下降的问题,具有应用局限性。因此,必须研究和改进现有的算法,使其具有更高的效率和更广阔的应用前景。首先,本文对数据挖掘技术进行全面的分析,从数据挖掘的定义、任务、体系结构以及数据挖掘的模型进行研究,特别是对数据挖掘的方法进行了细分和比较。其次,本文研究了关联规则中经典的Apriori算法及其改进算法。为了解决这些算法在候选项目集和执行时间方面存在的问题,结合关联规则的性质和布尔向量的关系运算思想,提出了基于布尔矩阵的关联规则挖掘算法(Algorithm Base on Boolean Matrix)和幂集合算法(Power.Set)。布尔矩阵的关联规则算法在挖掘过程中仅扫描数据库一次,而且不产生候选项目集,从而减少了生成频繁项目集的时间开销,提高了算法效率;幂集合算法完全脱离Apriori算法的结构,它主要利用拆解交易记录的方式进行,其主要步骤是将每一条读入的交易记录根据特定原则快速拆解成各项目集,当数据库经过一次扫描后,表示所有的交易记录也同时被拆解完成,随后输入最小支持度和置信度,就可快速挖掘出符合使用者需要的频繁项目集,进而得到其关联规则。两种算法都达到了算法改进的目的。为了验证算法的性能,本文采用了实例法和实验法对提出的新算法和经典的Apriori算法进行了对比测试。试验结果表明,两种改进的算法在效率上明显优于Apriori算法,而且挖掘的数据量越大,数据库变化快,改进的算法效率越高,两种算法都具有较好的可扩展性和较广阔的应用前景。最后,将基于布尔矩阵的关联规则算法应用在商场营销中,发现物品之间的关联性,为决策者提供指导和数据支持,从而提高企业利润。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 关联规则应用现状及发展方向
  • 1.2.1 关联规则的研究现状
  • 1.2.2 关联规则的发展方向
  • 1.3 论文主要研究内容
  • 1.4 本文结构
  • 第二章 数据挖掘理论
  • 2.1 数据仓库和联机分析处理(OLAP)
  • 2.1.1 数据仓库
  • 2.1.2 联机分析处理(OLAP)
  • 2.2 数据挖掘技术
  • 2.2.1 数据挖掘的定义
  • 2.2.2 数据挖掘的任务
  • 2.2.3 数据挖掘的方法
  • 2.2.4 数据挖掘的体系结构
  • 2.2.5 数据挖掘过程的标准化及模型
  • 第三章 关联规则挖掘理论和经典算法
  • 3.1 关联规则的基本概念
  • 3.1.1 关联规则的性质
  • 3.1.2 关联规则的挖掘过程
  • 3.1.3 关联规则的分类
  • 3.1.4 关联规则的挖掘步骤及应注意的问题
  • 3.2 关联规则的挖掘算法——APRIORI 算法
  • 3.2.1 关联规则算法的相关定义及性质
  • 3.2.2 找出频繁项集的Apriori 算法描述
  • 3.2.3 实例分析
  • 3.2.4 Apriori 算法的性能分析
  • 3.3 现有APRIORI 算法的改进思想和算法
  • 3.3.1 几种改进的算法思想
  • 3.3.2 几种改进的算法
  • 3.4 关联规则挖掘的扩充
  • 3.4.1 基于约束的关联规则
  • 3.4.2 时态约束关联规则
  • 3.4.3 变支持度关联规则
  • 3.4.4 多层关联规则挖掘
  • 3.4.5 多维关联规则挖掘
  • 第四章 关联规则挖掘算法的改进
  • 4.1 基于布尔矩阵的关联规则挖掘算法
  • 4.1.1 算法相关定义和性质
  • 4.1.2 算法实现步骤及描述
  • 4.1.3 实例分析
  • 4.1.4 两种算法性能分析及比较
  • 4.2 幂集合(PS)算法
  • 4.2.1 算法相关定义和性质
  • 4.2.2 PS 算法描述
  • 4.2.3 PS 算法中交易记录拆解过程
  • 4.2.4 PS 算法完整实例说明
  • 4.2.5 PS 算法的特殊性能分析
  • 4.2.6 PS 算法与Apriori 算法比较
  • 4.2.7 PS 算法的限制
  • 4.3 算法分析与总结
  • 第五章 关联规则算法在商场营销中的应用
  • 5.1 数据准备
  • 5.2 关联规则挖掘
  • 5.3 挖掘结果分析
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 附录
  • 个人简历
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    关联规则挖掘算法的改进与应用
    下载Doc文档

    猜你喜欢