关联分类算法的若干研究与改进

关联分类算法的若干研究与改进

论文摘要

关联分类自提出以来,一直是数据挖掘领域关注和研究的一个热点。关联分类因将关联规则挖掘技术与数据分类相结合,产生的规则集比较完备,经大量研究及实验表明,与C4.5等传统分类算法相比,关联分类具有更好的分类效果;而与神经网络、SVM等分类算法相比,关联分类的分类器是规则的集合,更易于理解。同时关联分类也具有较好的数据适应性和鲁棒性。因此,关联分类目前已发展成数据挖掘领域的一种重要分类方法。但是关联分类算法也存在一些难以克服的问题,主要原因是它会产生太多的分类关联规则。这不仅导致计算速度慢、系统资源开销大,而且大部分分类规则对分类器的分类效果并没有影响,有时甚至会降低分类效果。为此,本文对关联分类算法进行较为系统的研究,主要的工作有:(1)提出一种基于压缩规则预测的关联分类算法由于关联分类算法产生大量分类规则,所以在建立分类器时,需要采用某种策略对规则剪枝,挑选有用规则建立分类器。任何剪枝策略都是依据训练数据集的特性,制定相应的准则选择规则和建立分类器,然而预测数据与训练数据的特性不一定完全一致,就有可能导致分类模型过于拟合训练数据集,即存在过剪枝现象,使得有些预测数据不能被分类,降低分类效果。本文提出以压缩规则为单位构造分类器,压缩规则比单一规则具有更好的数据匹配性,增强了规则的预测功能,使得更多的预测数据可以被高质量的规则分类。(2)提出一种基于正负类信息增益评价的关联分类算法关联分类算法的分类精确度很大程度上取决于如何选择分类器的规则集。DDPMine算法依据模式的信息增益随着模式支持度的降低而单调递减的特性,对FP-growth过程高度剪枝,直接挖掘最具分辨能力的模式,再由模式产生规则,使得DDPMine取得了革命性的进步。规则优劣的评价标准应能在最大限度上反映规则后件不确定性的变化。然而对模式而言,各个类是平等的,规则的后件是未知的。因此,模式的信息增益不能准确反映规则后件不确定性的变化,这是DDPMine算法的一个不足。对此,本文将规则后件类作为正类,其他类作为负类,提出了正负类信息增益的概念,并且在理论上证明了正负类信息增益的合理性,在此基础上,提出了基于正负类信息增益评价的改进算法zFDDPMine。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  • 1.1 选题依据
  • 1.2 本文主要研究内容与创新点
  • 1.2.1 本文的主要研究内容
  • 1.2.2 本文的创新点
  • 1.3 本文结构
  • 第二章 关联分类概述及研究现状
  • 2.1 关联分类的提出
  • 2.1.1 关联分类的起源:关联规则挖掘
  • 2.1.2 关联分类的提出
  • 2.2 关联分类的概念
  • 2.2.1 关联分类的相关定义
  • 2.2.2 最早的关联分类模型 CBA
  • 2.3 关联分类存在的问题
  • 2.3.1 关联分类的搜索空间
  • 2.3.2 关联分类的规则选择
  • 2.4 关联分类的主要算法
  • 2.4.1 CMAR
  • 2.4.2 CPAR
  • 2.4.3 L3 算法
  • 2.4.4 DDPMine 算法
  • 2.4.5 MMAC
  • 2.4 小结
  • 第三章 一种基于压缩规则预测的关联分类方法
  • 3.1 引言
  • 3.2 压缩规则
  • 3.3 基于压缩规则预测的改进关联分类算法
  • 3.3.1 基于压缩规则预测的改进 L3 算法
  • 3.3.2 基于压缩规则预测的改进 DDPMine 算法
  • 3.4 小结
  • 第四章 一种基于正负类信息增益评价的关联分类算法
  • 4.1 引言
  • 4.2 模式信息增益
  • 4.3 基于正负类评价的关联分类算法
  • 4.3.1 正负类信息熵的提出
  • 4.3.2 正负类信息熵合理性证明
  • 4.3.3 zFDDPMine 算法
  • 4.4 实验与结果分析
  • 4.4.1 实验环境及数据集
  • 4.4.2 实验结果及分析
  • 4.5 小结
  • 第五章 总结与展望
  • 5.1 本文的工作总结
  • 5.2 展望及进一步工作
  • 参考文献
  • 致谢
  • 个人简历、在校期间的研究成果及发表的学术论文
  • 相关论文文献

    • [1].论关联企业的法律识别[J]. 晋阳学刊 2020(01)
    • [2].无题[J]. 书城 2020(04)
    • [3].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
    • [4].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
    • [5].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
    • [6].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
    • [7].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
    • [8].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
    • [9].企业形成机理与政治关联的关系[J]. 商 2016(24)
    • [10].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
    • [11].关联性·横与竖[J]. 美术界 2019(10)
    • [12].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
    • [13].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
    • [14].关联性·黑与白[J]. 美术界 2018(08)
    • [15].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
    • [16].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
    • [17].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
    • [18].连连看[J]. 启蒙(0-3岁) 2008(02)
    • [19].价格关联协议的基本类型及其竞争法控制初探[J]. 西部法学评论 2019(06)
    • [20].基于制衡股东角度规范关联交易的思考[J]. 会计师 2019(24)
    • [21].关联企业授信贷前尽职调查探析[J]. 中国商论 2020(07)
    • [22].政治关联会影响券商的经济后果吗?[J]. 投资研究 2019(11)
    • [23].政治关联、制度环境与企业绩效关系研究[J]. 市场研究 2020(04)
    • [24].基于关联规则的数据挖掘的研究与应用[J]. 粘接 2020(05)
    • [25].标准相对关联度的定义及基础算法[J]. 标准科学 2020(07)
    • [26].金融控股公司关联交易监管方略谈[J]. 经济师 2020(09)
    • [27].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
    • [28].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
    • [29].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
    • [30].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)

    标签:;  ;  ;  ;  

    关联分类算法的若干研究与改进
    下载Doc文档

    猜你喜欢