基于遗传算法的决策树剪枝方法

基于遗传算法的决策树剪枝方法

论文摘要

决策树剪枝是决策树优化的常用方法。在保持决策树分类精度的前提下,该方法通过去掉决策树中某些子树的方法,达到减小决策树规模的目的。目前的决策树剪枝方法按照一定顺序遍历决策树包含的所有子树,以决策树的分类精度或者规模为依据决定子树是否应该被移除,因此剪枝效率较低且存在着一定的剪枝偏置。本文提出了一种两阶段的决策树剪枝方法。其中第一阶段使用遗传算法对剪枝决策树空间进行搜索,来构造当前最优决策树集合;第二阶段综合决策树的分类精度,规模和稳定性三方面因素,从当前最优决策树集合中找到一棵决策树作为最优剪枝后决策树。基于遗传算法的决策树剪枝方法由于采用多标准评价决策树子树,克服了原有剪枝算法的偏置。同时引入遗传算法来加速剪枝决策树空间的搜索速度。在多个UCI数据库上的实验结果表明,使用该方法得到的决策树很好的平衡了决策树分类精度和规模之间的关系,使得剪枝后的决策树具有良好的分类性能。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景与意义
  • 1.2 国内外研究现状
  • 1.3 研究内容
  • 1.4 论文组织
  • 第2章 决策树学习
  • 2.1 基本的决策树学习算法
  • 2.1.1 分割属性的选择
  • 2.1.2 决策树的停止标准
  • 2.1.3 叶子节点的类别标签
  • 2.2 决策树的解释
  • 2.3 决策树分类精度的评估
  • 2.4 本章小结
  • 第3章 决策树剪枝算法
  • 3.1 决策树的过度拟合现象
  • 3.2 决策树剪枝方法
  • 3.2.1 预剪枝方法
  • 3.2.2 后剪枝方法
  • 3.3 决策树后剪枝方法的分析
  • 3.3.1 代价复杂度剪枝
  • 3.3.2 减小错误率的剪枝
  • 3.3.3 悲观错误剪枝
  • 3.3.4 规则后剪枝
  • 3.3.5 后剪枝算法的比较
  • 3.4 本章小结
  • 第4章 基于遗传算法的决策树剪枝算法
  • 4.1 决策树剪枝中的假设空间搜索
  • 4.2 遗传算法
  • 4.2.1 算法综述
  • 4.2.2 遗传算法框架
  • 4.3 评价决策树的标准
  • 4.3.1 分类精度
  • 4.3.2 稳定性
  • 4.3.3 规模
  • 4.3.4 综合评价
  • 4.4 两阶段剪枝过程
  • 4.4.1 最优决策树集合构造
  • 4.4.2 决策树的表示
  • 4.4.3 适应度函数的表示
  • 4.4.4 遗传算子
  • 4.4.5 最优剪枝树的选择
  • 4.5 实验结果及分析
  • 4.6 本章小结
  • 第5章 总结与展望
  • 参考文献
  • 致谢
  • 攻读学位期间取得的科研成果
  • 相关论文文献

    • [1].基于优化决策树的智能故障诊断方法研究[J]. 广东水利电力职业技术学院学报 2020(01)
    • [2].基于赤池信息准则的分类回归决策树剪枝算法[J]. 计算机应用 2014(S2)
    • [3].浅析决策树对犯罪风险程度的预测[J]. 科技风 2019(02)
    • [4].基于改进决策树的故障诊断方法研究[J]. 成都信息工程大学学报 2018(06)
    • [5].模型决策树:一种决策树加速算法[J]. 模式识别与人工智能 2018(07)
    • [6].基于样本对的极小决策树构建[J]. 北京信息科技大学学报(自然科学版) 2015(03)
    • [7].边画边算的决策树实战[J]. 中国信息技术教育 2020(Z4)
    • [8].基于最大间隔的决策树归纳算法[J]. 科技信息 2011(25)
    • [9].基于最大间隔的决策树归纳算法[J]. 科技视界 2011(01)
    • [10].基于改进的代价敏感决策树的网络贷款分类[J]. 计算机应用 2019(10)
    • [11].不一致数据上精确决策树生成算法[J]. 软件学报 2017(11)
    • [12].基于加权多决策树的入侵检测系统模型研究[J]. 计算机安全 2009(08)
    • [13].基于核属性的决策树构造算法研究[J]. 滁州学院学报 2008(06)
    • [14].基于决策树的设备预测性维护[J]. 数字通信世界 2018(08)
    • [15].贝叶斯的决策树剪枝算法在学科评审中的研究[J]. 计算机工程与设计 2013(11)
    • [16].基于多决策树的RFID入侵检测模型[J]. 计算机应用研究 2014(04)
    • [17].基于决策树的财务危机预警研究[J]. 财会通讯 2011(17)
    • [18].浅谈随机决策树[J]. 电脑知识与技术 2009(25)
    • [19].一种懒惰式决策树和普通决策树结合的分类模型——半懒惰式决策树[J]. 计算机应用与软件 2008(12)
    • [20].基于不同决策树的面向对象林区遥感影像分类比较[J]. 应用生态学报 2018(12)
    • [21].基于伪梯度提升决策树的内网防御算法[J]. 计算机科学 2018(04)
    • [22].基于决策树的游客意向及旅游建议的研究[J]. 现代计算机(专业版) 2018(12)
    • [23].基于多源不确定物体的研究[J]. 湖南工程学院学报(自然科学版) 2018(03)
    • [24].基于决策树的日志分析方法[J]. 软件导刊 2020(01)
    • [25].基于决策树判别的高温目标遥感识别方法[J]. 科学技术与工程 2019(11)
    • [26].决策树多元分类模型预测森林植被覆盖[J]. 电子制作 2017(24)
    • [27].基于加权划分非平衡决策树的诗歌朗读情感度分析[J]. 计算机科学 2020(S2)
    • [28].非相容表决策树构建算法[J]. 河海大学学报(自然科学版) 2013(02)
    • [29].有序决策树的比较研究[J]. 计算机科学与探索 2013(11)
    • [30].一种基于决策树的选择查询算法[J]. 中国科技信息 2012(03)

    标签:;  ;  ;  ;  

    基于遗传算法的决策树剪枝方法
    下载Doc文档

    猜你喜欢