基于关联规则的数据挖掘算法研究

基于关联规则的数据挖掘算法研究

论文摘要

数据挖掘或知识发现是用于数据分析和理解、揭示数据内部知识的技术,在最近几年里已被广泛的研究,其中关联规则是数据挖掘的一个重要的问题。关联规则的挖掘必须经过概念提出、概念接受、广泛研究和探索、逐步应用和大量应用等阶段。目前,关联规则的基本概念和研究方法趋于清晰,它的研究正向着更深入的方向发展,大部分学者认为它的研究仍然处于广泛研究和探索阶段,迫切需要在基础理论、应用模式、以及挖掘算法等方面进行创新。同时,关联规则挖掘需要在挖掘效率、可用性、精确性等方面得到提升。因此,研究者需要探索新的关联规则挖掘理论和模型,需要对一些传统的算法进行改进;也需要研究新的更有效的算法等。鉴于目前数据挖掘技术和关联规则挖掘研究现状和发展趋势选择了这一课题开展相关工作。在关联规则理论方面,对关联规则的基本概念,关联规则的典型算法,及其算法研究新进展进行了全面地分类、归纳和总结,同时也针对各类算法的实用条件,算法间的差别进行了客观地比较。在关联规则挖掘算法方面,针对大数据集挖掘过程中对内存和CPU等系统资源要求较高的情况,在关联规则挖掘前提出以二进制序列集来组织数据,提高整个关联规则挖掘中项目集的存储效率;在关联规则挖掘方面提出两种数据结构构造算法,二进制序列密集树算法和频繁模式树的正负关联规则挖掘算法,前者首先是对数据进行压缩,把较大的事务数据集聚为一个相对较小的数据结构,用以计算二项集的支持度和致信度;然后在二进制频繁项集树上,利用二项集的支持度和致信度信息从树的顶层直至底层构造频繁项集,进而挖掘出所有的关联规则;同时为避免单一挖掘正关联规则的局限性,提出基于频繁模式树的正负关联规则挖掘算法,该算法将事务数据库中出现的正项目和隐含的负项目进行处理,打破了先挖掘正关联规则,其次再挖掘负关联规则这种单一的挖掘模式。这两种数据结构算法只需一次扫描整个数据库而且不产生侯选集就可以从数据库中挖掘所有的正,负关联规则,大大的提高了运算的效率。试验结果表明,该算法在挖掘效率、可用性,算法扩展性方面有较好的性能。该算法对数据挖掘的作用来说,具有一定的实用价值,一方面,它可以给研究数据挖掘关联规则的科研人员提供思路,供科研人员参考;另一方面,如果将其整合到其它现有的数据挖掘工具中,可以大大提高算法的实用价值。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 拟解决的问题和本文的创新性工作
  • 1.3 论文的研究内容
  • 第二章 数据挖掘技术
  • 2.1 数据挖掘的基本概念
  • 2.1.1 数据挖掘的技术含义
  • 2.1.2 数据挖掘研究的理论基础
  • 2.2 数据挖掘技术的产生背景
  • 2.2.1 数据挖掘技术产生的商业需求分析
  • 2.2.2 数据挖掘技术产生的技术背景分析
  • 2.3 数据挖掘技术的分类问题
  • 2.4 数据挖掘的步骤
  • 第三章 关联规则数据挖掘
  • 3.1 关联规则的相关概念
  • 3.2 关联规则的典型算法
  • 3.2.1 关联规则的搜索算法
  • 3.2.2 基于APRIORI 类的关联规则算法
  • 3.2.3 不产生频繁候选项的关联规则算法
  • 3.3 基于复杂数据属性的算法扩展
  • 3.4 关联规则挖掘算法的新进展
  • 第四章 二进制密集树的关联规则挖掘算法
  • 4.1 引言
  • 4.2 事务的二进制序列数据组织
  • 4.2.1 二进制序列集的定义
  • 4.2.2 事务的二进制序列表示
  • 4.3 频繁项二进制密集树算法
  • 4.3.1 二进制数组密集树算法
  • 4.3.2 二进制密集树路径码算法
  • 4.3.3 频繁项集树算法
  • 4.3.4 频繁项集树关联规则算法
  • 4.4 APRIORI 算法
  • 4.5 试验结果与性能评估
  • 第五章 基于频繁模式树的正负关联规则挖掘算法
  • 5.1 单一正关联规则缺陷
  • TREE'>5.2 含负项目的频繁模式树FPNTREE
  • 5.2.1 基本概念
  • 5.2.2 算法思想及其方法描述
  • 5.3 频繁模式树一般关联规则挖掘
  • 5.4 关联规则更新算法
  • 5.5 算法性能分析
  • 5.6 小结
  • 第六章 结论与展望
  • 6.1 本文总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
    • [2].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
    • [3].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
    • [4].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
    • [5].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
    • [6].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
    • [7].企业形成机理与政治关联的关系[J]. 商 2016(24)
    • [8].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
    • [9].关联性·横与竖[J]. 美术界 2019(10)
    • [10].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
    • [11].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
    • [12].关联性·黑与白[J]. 美术界 2018(08)
    • [13].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
    • [14].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
    • [15].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
    • [16].连连看[J]. 启蒙(0-3岁) 2008(02)
    • [17].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
    • [18].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
    • [19].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
    • [20].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)
    • [21].关联企业的法律特征及其与企业集团的关系[J]. 商场现代化 2017(04)
    • [22].简述社会经济统计学与数理统计学的关联性[J]. 经贸实践 2016(22)
    • [23].N(2,2,0)代数的Ω-模糊关联理想[J]. 无锡商业职业技术学院学报 2015(06)
    • [24].政治关联为何降低企业绩效——基于生产效率的解释[J]. 浙江社会科学 2016(04)
    • [25].民营企业政治关联及策略选择[J]. 中外企业家 2014(34)
    • [26].银行关联与企业风险——基于我国上市公司的经验证据[J]. 管理世界 2014(04)
    • [27].金融关联的动因与经济后果:文献回顾与研究展望[J]. 财会月刊 2015(28)
    • [28].教学要注重“关联”[J]. 语文教学通讯 2011(17)
    • [29].关联理论视角下翻译课堂教学的构建[J]. 时代教育 2018(11)
    • [30].关联理论视角下的翻译研究[J]. 校园英语 2018(25)

    标签:;  ;  ;  ;  ;  

    基于关联规则的数据挖掘算法研究
    下载Doc文档

    猜你喜欢