有效关联规则挖掘方法的研究

有效关联规则挖掘方法的研究

论文摘要

近年来,数据挖掘己经成为人工智能、模式识别等领域的研究热点。伴随着数据量的急剧增长,数据挖掘技术已经越来越引起人们重视。其中,关联规则是数据挖掘中最活越的研究方向之一。本文对关联规则数据挖掘进行了较为深入的分析和研究。主要工作包括以下几个方面: 1 目前,关联规则的研究主要集中在效率的提高上。针对规则的分析相对较少。本文首先分析了关联规则的衡量标准以及规则的前件与后件的相关性问题,总结了目前对挖掘有效关联规则的相关研究。针对传统关联规则中无法描述规则前件与后件的相关性问题,提出了一种新的挖掘有效关联规则的框架:支持度-匹配度。将该框架下生成的规则与支持度-置信度框架下生成的规则做了比较。结果表明,用所提出的方法生成的规则不仅前件和后件具有较高的相关性,而且减少了冗余规则的生成。最后,给出该框架的扩展应用及部分实验结果。 2 在实际应用中,数据库或数据仓库是随时间变化的,因而其中的关联规则也随之变化。已有许多研究人员对如何高效的更新关联规则进行了分析和研究,并提出了相应的算法。其中关联规则的更新主要涉及三个方面:第一方面,在给定的最小支持度和最小置信度下,当一个新的数据库 db 添加到数据库 DB 中时,如何生成 db+DB中的关联规则;第二方面,在给定最小支持度和最小置信度下,当数据库 db 从 DB中删除时,如何生成DB-db中的关联规则;第三方面,考虑新增加的db的新颖性时,如何进行加权增量更新。 2.1 首先,本文针对第一方面进行了分析和研究,并提出了一种基于向量的增量更新算法 VFUP(Vector-Based Fast Updating Algorithm),将该算法和已有的增量更新算法进行了分析和比较,说明了该算法的高效性和可行性。 2.2 其次,对最小支持度,最小置信度不变的情况下,新增数据库 db 时的关联规则更新问题,进行了分析和研究。考虑到新增数据库的新颖性、以及生成规则的有趣性等问题,本文结合VFUP算法的效率以及匹配度的思想,提出了基于项目集加权的增量更新算法。即:在新增数据库db 中采取频繁项目集与非频繁项目集同时加权的方法来挖掘DB+db中的关联规则。这样可以增加db中频繁项目集和非频繁项目集对DB+db中关联规则的影响。在进行n次增量更新算法的设计时,首先,结合增量更新和加权的特点,设计高效的算法来提高效率。在规则分析中采取新的框架理论,来分析得到的规则。最后,将加权增量更新得到的结果同增量更新算法得到的结果进行分析和比较,实验表明该方法是有效的。

论文目录

  • 中文摘要
  • 英文摘要
  • 目录
  • 一、引言
  • 1.1 数据挖掘背景
  • 1.2 数据挖掘基本概念
  • 1.3 数据挖掘分类
  • 1.3.1 模式分类
  • 1.3.2 聚类
  • 1.3.3 关联分析
  • 1.3.4 回归
  • 1.3.5 时间序列
  • 1.3.6 序列模式
  • 1.4 数据挖掘前景分析
  • 二、关联规则数据挖掘
  • 2.1 关联规则基本概念
  • 2.2 关联规则基本问题
  • 2.3 关联规则分类
  • 2.4 关联规则挖掘的算法
  • 2.4.1 经典算法apriori
  • 2.4.2 fp-tree 算法
  • 2.4.3 AprioriTid 算法和 AprioriHybird
  • 2.4.4 基于划分的方法
  • 2.4.5 基于hash 的方法
  • 2.4.6 基于采样的方法
  • 2.4.7 散列
  • 2.4.8 多层关联规则挖掘
  • 2.4.9 多维关联规则挖掘
  • 2.5 关联规则的扩展应用
  • 2.5.1 IUA 算法和LAA 算法
  • 2.5.2 FUP 算法
  • 三、有效关联规则的研究
  • 3.1 关联规则的价值衡量
  • 3.2 实例分析
  • 3.3 衡量标准改进
  • 3.4 支持度-匹配度扩展应用
  • 3.4.1 水平加权的关联规则开采
  • 3.4.2 增量更新的关联规则
  • 3.4.3 实验数据描述
  • 3.5 实验结果对比
  • 四、增量关联规则的向量法挖掘
  • 4.1 向量法挖掘关联规则的基本思想
  • 4.2 关联规则的增量更新问题
  • 4.3 基于向量法的增量更新算法(VFUP)
  • 4.3.1 算法 VFUP
  • 4.3.2 实例分析
  • 4.3.3 算法分析
  • 五、基于项目集加权的增量关联规则算法研究
  • 5.1 加权增量更新
  • 5.2 规则分析
  • 5.3 算法分析
  • 5.4 实例分析
  • 5.5 新增 n 次数据库时的关联规则更新
  • 5.6 实验结果
  • 结语
  • 参考文献
  • 后记
  • 相关论文文献

    • [1].论关联企业的法律识别[J]. 晋阳学刊 2020(01)
    • [2].无题[J]. 书城 2020(04)
    • [3].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
    • [4].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
    • [5].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
    • [6].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
    • [7].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
    • [8].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
    • [9].企业形成机理与政治关联的关系[J]. 商 2016(24)
    • [10].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
    • [11].关联性·横与竖[J]. 美术界 2019(10)
    • [12].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
    • [13].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
    • [14].关联性·黑与白[J]. 美术界 2018(08)
    • [15].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
    • [16].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
    • [17].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
    • [18].连连看[J]. 启蒙(0-3岁) 2008(02)
    • [19].价格关联协议的基本类型及其竞争法控制初探[J]. 西部法学评论 2019(06)
    • [20].基于制衡股东角度规范关联交易的思考[J]. 会计师 2019(24)
    • [21].关联企业授信贷前尽职调查探析[J]. 中国商论 2020(07)
    • [22].政治关联会影响券商的经济后果吗?[J]. 投资研究 2019(11)
    • [23].政治关联、制度环境与企业绩效关系研究[J]. 市场研究 2020(04)
    • [24].基于关联规则的数据挖掘的研究与应用[J]. 粘接 2020(05)
    • [25].标准相对关联度的定义及基础算法[J]. 标准科学 2020(07)
    • [26].金融控股公司关联交易监管方略谈[J]. 经济师 2020(09)
    • [27].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
    • [28].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
    • [29].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
    • [30].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)

    标签:;  ;  ;  ;  ;  ;  

    有效关联规则挖掘方法的研究
    下载Doc文档

    猜你喜欢