多分类器集成技术研究

多分类器集成技术研究

论文摘要

作为数据挖掘领域中一项重要的技术,分类技术在许多方面有着广泛的应用,目前存在着很多的分类技术,如决策树、支持向量机等。为了达到比较好的预测效果,传统的操作中,常常通过训练集产生多个分类模型,再用测试集逐个测试其分类性能,把性能最好的一个作为最终的分类模型。但是单个分类模型的预测性能毕竟有限,而且每个分类器都有其适合分类的数据区域,它可能对测试集表现出比较好的效果,但是对待测数据却没有很好的效果,这体现了单个分类器分类性能的不稳定性。而通过对多个单分类器进行有效地组合既可以提高分类的性能,又可以保证预测结果的稳定性,在这种情况下,分类集成技术应运而生。分类集成技术主要是通过对多个单分类器进行组合来提高分类性能,这些单分类器被称为基分类器,它主要包括两个部分:基分类器的产生方式和基分类器的组合方式。Boosting算法是分类集成学习中比较有代表性的方法,它产生基分类器时,通过在训练集样本上维护一套权重分布,使每次训练产生的基分类器关注不同的样本;Bagging方法也是一种比较重要的分类集成技术,它通过每次有放回抽样来产生基分类器,每个样本被选中的机会是完全相等的。MultiBoost方法可以看作Boosting方法和Wagging方法的结合,经过验证,它相对于Boosting方法和Wagging方法有较低的错误率,它主要是对训练集指定一套符合泊松分布的权重,然后生成基分类器。本文通过对这些方法进行分析,提出了两种改进的训练集样本加权方法用于产生基分类器。.基分类器的组合方式是分类集成中另一个重要的方面,在基分类器的输出是类别的情况下,目前常用的是投票法;Bagging方法用的是简单投票法,每个基分类器的投票在最终决策中是相同的,Boosting方法是根据基分类器的分类错误率对每个基分类器给予一个投票权重,最终的决策运用有权投票技术。本文详细分析了有权投票技术,在此基础上,针对不同方面的考虑,提出了两种投票权值调整的方法。最后通过实验对本文所提算法进行了实验验证,结果显示,本文所提方法可以进一步提高分类性能。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 本文主要内容和结构安排
  • 第2章 理论基础
  • 2.1 数据挖掘
  • 2.2 分类技术概述
  • 2.2.1 分类的概念及算法
  • 2.2.2 分类器性能评价标准
  • 2.3 分类集成技术概述
  • 2.3.1 集成学习的作用
  • 2.3.2 分类集成的拓扑结构
  • 2.3.3 基分类器的生成方式
  • 2.3.4 基分类器的组合方式
  • 2.4 分类集成学习中的典型算法
  • 2.4.1 Boosting算法
  • 2.4.2 Bagging算法
  • 2.4.3 Wagging算法
  • 2.4.4 MultiBoost算法
  • 2.5 本章小结
  • 第3章 两种训练样本加权方式
  • 3.1 经典集成方法中样本加权分析
  • 3.2 分层样本加权方法
  • 3.3 基于分类输出的加权方法
  • 3.4 本章小结
  • 第4章 两种投票权值调整方式
  • 4.1 投票方法分析
  • 4.2 动态投票权值调整方法
  • 4.3 基于验证情况的投票权值调整法
  • 4.4 本章小结
  • 第5章 实验结果和分析
  • 5.1 评价方法
  • 5.2 实验数据集介绍
  • 5.3 训练集加权实验
  • 5.4 投票权值调整实验
  • 5.5 集成技术在车辆欠费预测中的应用
  • 5.6 本章小结
  • 结论与展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].基于动态分类器集成系统的卷烟感官质量预测方法[J]. 计算机应用与软件 2020(01)
    • [2].基于标准数据集的分类器融合学习模型[J]. 微型电脑应用 2020(04)
    • [3].一种自适应子融合集成多分类器方法[J]. 计算机测量与控制 2019(04)
    • [4].基于多分类器融合的近红外光谱技术鉴别蜂蜜品种[J]. 化学分析计量 2019(03)
    • [5].基于分类器的身份证号码识别研究[J]. 贵州科学 2018(01)
    • [6].一种基于多分类器融合的人体运动行为识别模型[J]. 计算机科学 2016(12)
    • [7].一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版) 2017(02)
    • [8].一种代价敏感的三类分类器评估方法的研究与应用[J]. 通化师范学院学报 2017(08)
    • [9].基于多分类器组合的遥感土地利用分类研究[J]. 安徽农业科学 2015(32)
    • [10].多分类器融合与单分类器影像分类比较研究[J]. 矿山测量 2016(04)
    • [11].《未来垃圾分类器》[J]. 幼儿教育 2020(14)
    • [12].基于多分类器组合的城市不透水面提取研究[J]. 城市地理 2017(04)
    • [13].《垃圾分类器》[J]. 辅导员 2016(11)
    • [14].多分类器融合的遥感影像分类方法实验研究[J]. 全球定位系统 2020(05)
    • [15].一种基于核聚类的多分类器选择算法[J]. 电子技术与软件工程 2020(13)
    • [16].基于一种新的级联分类器的目标检测系统[J]. 现代电子技术 2020(01)
    • [17].最佳的分类器链局部检测与挖掘算法[J]. 计算机工程与设计 2017(11)
    • [18].基于多分类器融合与模糊综合评判的滚动轴承故障诊断[J]. 中国科技论文 2016(04)
    • [19].近红外光谱和多分类器融合的葡萄酒品种判别研究[J]. 光谱学与光谱分析 2016(11)
    • [20].基于多分类器集成的语音情感识别[J]. 微电子学与计算机 2015(07)
    • [21].基于集成分类器的流量识别技术研究[J]. 科技视界 2015(33)
    • [22].二叉树型多分类器融合的轴承故障诊断方法[J]. 计算机工程与应用 2015(21)
    • [23].智能垃圾分类器[J]. 科学启蒙 2013(12)
    • [24].一种新的多分类器融合方法[J]. 西南师范大学学报(自然科学版) 2014(01)
    • [25].动态加权投票的多分类器聚合[J]. 现代计算机(专业版) 2014(05)
    • [26].面向用户观点分析的多分类器集成和优化技术[J]. 计算机学报 2013(08)
    • [27].基于证据理论的优化集成分类器融合算法及应用[J]. 化工学报 2012(09)
    • [28].多类不平衡数据上的分类器性能比较研究[J]. 计算机工程 2011(10)
    • [29].基于多分类器融合的语音识别方法研究[J]. 重庆邮电大学学报(自然科学版) 2011(04)
    • [30].基于粗糙集约简的多分类器系统构造方法[J]. 计算机工程与应用 2010(03)

    标签:;  ;  ;  

    多分类器集成技术研究
    下载Doc文档

    猜你喜欢