基于频繁模式树的数据挖掘算法分析

基于频繁模式树的数据挖掘算法分析

论文摘要

数据挖掘是近年来迅速发展的信息处理技术,从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是从海量数据库中发现人们感兴趣的、隐藏的、前所未知的知识。它涉及数据库、人工智能、机器学习、模式识别、知识工程、面向对象、信息检索和可视化等一系列技术。经过十多年的发展,它己成为关系数据库中最有前景的研究和应用领域之一。关联规则挖掘作为数据挖掘领域的一个重要研究分支,它的任务是发现所有满足支持度闽值和置信度阈值的强关联规则。近年来,关联规则挖掘研究己经成为数据挖掘中的一个热点,并被广泛应用于市场营销、事务分析等应用领域。关联规则挖掘算法是关联规则挖掘研究的主要内容,迄今为止己经提出了许多高效的关联规则挖掘算法。本文首先介绍了数据挖掘的定义及主要的数据挖掘技术,然后详细描述了关联规则挖掘的基本理论和算法,其中包括经典Aptiori算法、FP-Growth算法,分别给出了两种算法的实例对算法进行了分析。最后在优化数据结构和事务数据集划分两个方而上实现了对FP-Growth算法的优化。并且通过仿真实验验证了优化算法在挖掘大型数据库时比FP-Growth算法更有效。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文研究的背景及意义
  • 1.2 数据挖掘中的关联规则
  • 1.3 论文的主要工作
  • 1.4 论文的组织结构
  • 第2章 数据挖掘技术
  • 2.1 数据挖掘的产生
  • 2.2 数据挖掘的研究现状
  • 2.3 数据挖掘的概念
  • 2.4 数据挖掘的对象
  • 2.5 数据挖掘的过程
  • 2.6 数据挖掘的任务和应用
  • 2.7 数据挖掘面临的挑战及发展趋势
  • 2.8 本章小结
  • 第3章 关联规则挖掘
  • 3.1 关联规则的简介
  • 3.2 关联规则的研究现状
  • 3.3 关联规则的基本概念
  • 3.4 关联规则的分类
  • 3.5 关联规则的挖掘过程
  • 3.6 关联规则挖掘经典算法的分析
  • 3.6.1 Apriori算法
  • 3.6.2 由频繁项集产生关联规则
  • 3.6.3 Apriori算法举例
  • 3.7 对Apriori的改进算法的分类
  • 3.8 本章小结
  • 第4章 基于频繁模式树的关联规则挖掘算法
  • 4.1 不产生候选集挖掘频繁项集的算法
  • 4.1.1 频繁模式增长算法
  • 4.1.2 频繁模式增长算法应用实例
  • 4.1.3 对频繁模式增长算法的分析
  • 4.2 基于频繁模式树的优化及相关的数据结构
  • 4.2.1 项头表的优化
  • 4.2.2 频繁模式树的优化
  • 4.2.3 频繁模式树中的部分数据结构
  • 4.3 基于频繁模式树的关联规则挖掘的优化算法
  • 4.3.1 基本思想方法
  • 4.3.2 事务数据库的划分
  • 4.3.3 频繁项集的合并与修剪
  • 4.4 本章小结
  • 第5章 实验测试与性能分析
  • 5.1 测试环境及测试事务数据库
  • 5.2 算法测试和分析
  • 5.2.1 算法在census数据库上的测试
  • 5.2.2 算法在accidents数据库上的测试
  • 5.2.3 算法测试结果分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].基于数据挖掘算法的成都市流动人口状况研究[J]. 经济研究导刊 2020(03)
    • [2].大数据下的数据挖掘算法在多维度评教模型中的应用[J]. 信息与电脑(理论版) 2020(01)
    • [3].审计信息系统的异常数据挖掘算法和应用[J]. 全国流通经济 2020(19)
    • [4].云计算环境下的数据挖掘算法探究[J]. 网络安全技术与应用 2019(05)
    • [5].基于决策树的大学生职位晋升影响因素数据挖掘算法[J]. 北华大学学报(自然科学版) 2019(06)
    • [6].如何运用数据挖掘算法进行投诉预测分析[J]. 信息通信 2019(11)
    • [7].基于关联规则的数据挖掘算法[J]. 电子技术与软件工程 2018(02)
    • [8].一种基于神经网络的数据挖掘算法[J]. 电脑编程技巧与维护 2017(03)
    • [9].基于数据挖掘算法的电子图书馆智能推荐技术研究[J]. 西南师范大学学报(自然科学版) 2017(07)
    • [10].采用高阶累积量压缩的镀铬加工实时数据挖掘算法[J]. 世界有色金属 2016(09)
    • [11].基于云计算的海量数据挖掘算法[J]. 产业与科技论坛 2015(16)
    • [12].数据挖掘算法基于关联规则的分析和应用[J]. 课程教育研究 2017(11)
    • [13].基于数据挖掘算法的创客校园质量管理模型研究[J]. 现代职业教育 2017(10)
    • [14].基于云计算的数据挖掘算法研究[J]. 无线互联科技 2013(12)
    • [15].基于数据挖掘算法数据模型实现大数据分析的方法研究[J]. 电子测量技术 2020(03)
    • [16].数据挖掘算法在云平台应用中的优化与实施[J]. 电子元器件与信息技术 2019(03)
    • [17].关联规则下的数据挖掘算法分析[J]. 信息记录材料 2018(07)
    • [18].一种改进的数据挖掘算法[J]. 科技通报 2016(11)
    • [19].基于神经网络自适应搜索的大数据挖掘算法[J]. 计算机与网络 2016(23)
    • [20].基于R语言的数据挖掘算法研究[J]. 电脑知识与技术 2016(28)
    • [21].云计算平台下数据挖掘算法研究[J]. 信阳农林学院学报 2017(01)
    • [22].入侵检测中常用数据挖掘算法的分析与研究[J]. 无线互联科技 2014(11)
    • [23].基于链距离估计的非显著特征数据挖掘算法[J]. 科技通报 2015(06)
    • [24].数据挖掘算法的研究——以不确定图模型为例[J]. 电脑知识与技术 2015(12)
    • [25].数据挖掘算法的分析探讨[J]. 硅谷 2014(02)
    • [26].动态云模型大规模数据挖掘算法[J]. 长春工业大学学报(自然科学版) 2014(03)
    • [27].常用数据挖掘算法的分析对比[J]. 河南科技 2014(19)
    • [28].高速接入网云计算平台的大数据挖掘算法研究(英文)[J]. 机床与液压 2017(24)
    • [29].数据挖掘算法在中药研究中的应用[J]. 中国药房 2018(19)
    • [30].一种有效的多类医疗数据挖掘算法研究[J]. 科技通报 2017(05)

    标签:;  ;  ;  ;  

    基于频繁模式树的数据挖掘算法分析
    下载Doc文档

    猜你喜欢