集成学习及其应用研究

集成学习及其应用研究

论文摘要

集成学习(Ensemble Learning)是一种机器学习范式,是当前的研究热点之一在多个领域有了很好的应用。但集成学习技术还没有成熟,在研究过程中仍然存在着众多待解决的问题,在应用上也和人们期待的水平相去甚远。本课题对集成学习进行了深入地研究,一方面分析了现有方法的优劣。另一方面,研究了影响集成效果的各个因素,这为进一步改进集成学习做好铺垫。在现有算法的研究基础上,提出了新的集成学习方法:针对某些个体分类器对集成效果起较小的作用或起消极作用的情况,本文提出了“基于信息增益的分类器选择”方法,这种方法首先需要构造分类器空间,然后计算个体分类器信息增益,根据信息增益删除一个或若干个个体分类器,最后再将剩余的分类器集成,实验结果表明经过信息增益选择分类器后的集成要优于不进行处理的情况;针对数据集中不是所有的特征都对集成起积极作用的情况,本文提出了“基于改进遗传算法的特征选择”方法,该方法将机器学习应用到遗传算法中,达到有效选择特征的目的,然后在处理过的数据集上使用集成学习,实验证明经过此方法处理的数据集不但在集成效果有了很大提高,而且大大缩短训练时间。最后,本文还对集成学习的应用进行了研究,第一,详细分析了入侵检测数据集(KDD CUP99、UCI)。第二,对KDD CUP 99做了适当的处理,然后成功将集成学习方法应用到此数据集上。第三,比较了经典的集成学习方法和本文提出的集成学习方法在入侵检测数据集上的效果。本文通过多次实验和应用实例对提出的新方法进行了验证,结果表明新方法是有效性的、可行性的。

论文目录

  • 摘要
  • ABSTRACT
  • 1. 前言
  • 1.1 集成学习的研究背景及意义
  • 1.2 集成学习发展状况及应用
  • 1.2.1 发展现状
  • 1.2.2 应用研究
  • 1.3 主要研究内容和组织结构
  • 1.3.1 论文的主要研究内容
  • 1.3.2 论文的组织结构
  • 2. 集成学习方法的研究与分析
  • 2.1 个体分类器获得方式
  • 2.1.1 训练数据的处理
  • 2.1.2 输入特征的处理
  • 2.2 个体分类器集成
  • 2.2.1 决策层次的融合
  • 2.2.2 排序层次的融合
  • 2.2.3 度量层次的融合
  • 2.3 集成学习方法的比较
  • 2.3.1 集成方法介绍
  • 2.3.2 实验数据
  • 2.3.3 实验设计
  • 2.3.4 实验结果
  • 2.4 本章小结
  • 3. 基于IG的分类器选择
  • 3.1 信息增益
  • 3.1.1 熵的概念
  • 3.1.2 信息增益
  • 3.2 基于信息增益的分类器选择公式
  • 3.3 算法分析
  • 3.4 算法实现
  • 3.4.1 实验数据
  • 3.4.2 实验流程
  • 3.4.3 实验设计
  • 3.4.4 实验结果
  • 3.5 本章小结
  • 4. 基于改进遗传算法的特征选择
  • 4.1 遗传算法简述
  • 4.1.1 编码
  • 4.1.2 初始种群
  • 4.1.3 适应度函数
  • 4.1.4 遗传算子
  • 4.2 算法描述
  • 4.3 算法实现
  • 4.3.1 算法流程
  • 4.3.2 实验结果
  • 4.4 结果验证
  • 4.5 本章小结
  • 5. 集成学习在入侵检测上应用
  • 5.1 入侵检测及KDD CUP 99
  • 5.1.1 入侵检测概述
  • 5.1.2 KDD CUP 99介绍
  • 5.2 应用分析
  • 5.2.1 数据处理
  • 5.2.2 特征选择
  • 5.2.3 分类器选择
  • 5.2.4 结果分析
  • 5.3 本章小结
  • 6. 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于动态分类器集成系统的卷烟感官质量预测方法[J]. 计算机应用与软件 2020(01)
    • [2].基于标准数据集的分类器融合学习模型[J]. 微型电脑应用 2020(04)
    • [3].一种自适应子融合集成多分类器方法[J]. 计算机测量与控制 2019(04)
    • [4].基于多分类器融合的近红外光谱技术鉴别蜂蜜品种[J]. 化学分析计量 2019(03)
    • [5].基于分类器的身份证号码识别研究[J]. 贵州科学 2018(01)
    • [6].一种基于多分类器融合的人体运动行为识别模型[J]. 计算机科学 2016(12)
    • [7].一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版) 2017(02)
    • [8].一种代价敏感的三类分类器评估方法的研究与应用[J]. 通化师范学院学报 2017(08)
    • [9].基于多分类器组合的遥感土地利用分类研究[J]. 安徽农业科学 2015(32)
    • [10].多分类器融合与单分类器影像分类比较研究[J]. 矿山测量 2016(04)
    • [11].《未来垃圾分类器》[J]. 幼儿教育 2020(14)
    • [12].基于多分类器组合的城市不透水面提取研究[J]. 城市地理 2017(04)
    • [13].《垃圾分类器》[J]. 辅导员 2016(11)
    • [14].多分类器融合的遥感影像分类方法实验研究[J]. 全球定位系统 2020(05)
    • [15].一种基于核聚类的多分类器选择算法[J]. 电子技术与软件工程 2020(13)
    • [16].基于一种新的级联分类器的目标检测系统[J]. 现代电子技术 2020(01)
    • [17].最佳的分类器链局部检测与挖掘算法[J]. 计算机工程与设计 2017(11)
    • [18].基于多分类器融合与模糊综合评判的滚动轴承故障诊断[J]. 中国科技论文 2016(04)
    • [19].近红外光谱和多分类器融合的葡萄酒品种判别研究[J]. 光谱学与光谱分析 2016(11)
    • [20].基于多分类器集成的语音情感识别[J]. 微电子学与计算机 2015(07)
    • [21].基于集成分类器的流量识别技术研究[J]. 科技视界 2015(33)
    • [22].二叉树型多分类器融合的轴承故障诊断方法[J]. 计算机工程与应用 2015(21)
    • [23].智能垃圾分类器[J]. 科学启蒙 2013(12)
    • [24].一种新的多分类器融合方法[J]. 西南师范大学学报(自然科学版) 2014(01)
    • [25].动态加权投票的多分类器聚合[J]. 现代计算机(专业版) 2014(05)
    • [26].面向用户观点分析的多分类器集成和优化技术[J]. 计算机学报 2013(08)
    • [27].基于证据理论的优化集成分类器融合算法及应用[J]. 化工学报 2012(09)
    • [28].多类不平衡数据上的分类器性能比较研究[J]. 计算机工程 2011(10)
    • [29].基于多分类器融合的语音识别方法研究[J]. 重庆邮电大学学报(自然科学版) 2011(04)
    • [30].基于粗糙集约简的多分类器系统构造方法[J]. 计算机工程与应用 2010(03)

    标签:;  ;  ;  ;  

    集成学习及其应用研究
    下载Doc文档

    猜你喜欢