增量决策树中样例选择的影响与评价

增量决策树中样例选择的影响与评价

论文摘要

随着数据库和网络技术的不断发展,使得人们可以越来越容易地获得海量的数据,但由于数据信息自身的复杂性,使如何有效地处理和理解这些数据成为需要解决的难题,而机器学习方法可以帮助我们认识和理解这些数据里隐含的知识,同时还可以帮助和指导生产实践。此时,首先要面临的问题就是数据的动态增长,其次是数据的数量巨大,二者都可以通过机器学习中的增量学习和主动学习来解决。前者可以适应数据不断增长的学习环境,在保持原有学习结果的基础之上接收新的数据,通过调整更新分类器来获取新的知识,而后者可以主动选择样例,从而降低数据的数量和复杂度,节约学习的成本,降低构造分类器的代价。本文研究了基于增量决策树的主动学习方法,其实就是将增量学习和主动学习两种方法进行有效地结合,从而同时发挥二者的优势。增量决策树是一种有效的增量学习方法,它可以在尽量最小破坏原有决策树的结构稳定性前提下,通过动态调整算法来更新决策树。在此基础上,进一步研究了决策树结构的变化规律,提出了基于最大不一致判断准则的未标注样例选择算法,从而完成主动学习中重要的一环。同时还介绍了基于最大熵和基于最大可能预测错误的样例选择算法,并通过实验验证了这些算法的分类性能,结果表明这三种学习算法都显著减少了训练所需样例的数目,同时也证明了基于增量决策树的主动学习方法的有效性,并且在一定程度上会好于另外两种方法。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景与意义
  • 1.2 国内外研究现状
  • 1.3 研究内容
  • 1.4 论文组织
  • 第2章 增量决策树介绍及其变化分析
  • 2.1 基础理论
  • 2.1.1 信息论原理
  • 2.1.2 增量学习技术
  • 2.1.3 朴素贝叶斯分类原理
  • 2.2 增量决策树学习算法简介
  • 2.2.1 ID3 算法简介
  • 2.2.2 ID3’算法简介
  • 2.2.3 ID4 算法简介
  • 2.2.4 ID5R 算法简介
  • 2.2.5 ITI 算法简介
  • 2.3 增量决策树的结构变化分析
  • 2.3.1 连续值属性时决策树的变化
  • 2.3.2 离散值属性时决策树的变化
  • 第3章 基于增量决策树的主动学习
  • 3.1 主动学习的概念
  • 3.1.1 半监督学习与主动学习
  • 3.1.2 主动学习的基本过程
  • 3.2 主动学习的常见方法
  • 3.2.1 基于池的主动学习
  • 3.2.2 基于流的主动学习
  • 3.2.3 主动学习的算法示例
  • 3.3 增量决策树在主动学习中的应用
  • 3.3.1 算法设计思想
  • 3.3.2 基于增量决策树的样例选择算法
  • 3.4 有关实验与分析
  • 3.4.1 与随机选择样例的比较
  • 3.4.2 与其它主动学习方法的比较
  • 3.5 本章小结
  • 第4章 总结与展望
  • 4.1 本文总结
  • 4.2 工作展望
  • 参考文献
  • 致谢
  • 攻读学位期间取得的科研成果
  • 相关论文文献

    • [1].基于优化决策树的智能故障诊断方法研究[J]. 广东水利电力职业技术学院学报 2020(01)
    • [2].基于赤池信息准则的分类回归决策树剪枝算法[J]. 计算机应用 2014(S2)
    • [3].浅析决策树对犯罪风险程度的预测[J]. 科技风 2019(02)
    • [4].基于改进决策树的故障诊断方法研究[J]. 成都信息工程大学学报 2018(06)
    • [5].模型决策树:一种决策树加速算法[J]. 模式识别与人工智能 2018(07)
    • [6].基于样本对的极小决策树构建[J]. 北京信息科技大学学报(自然科学版) 2015(03)
    • [7].边画边算的决策树实战[J]. 中国信息技术教育 2020(Z4)
    • [8].基于最大间隔的决策树归纳算法[J]. 科技信息 2011(25)
    • [9].基于最大间隔的决策树归纳算法[J]. 科技视界 2011(01)
    • [10].基于改进的代价敏感决策树的网络贷款分类[J]. 计算机应用 2019(10)
    • [11].不一致数据上精确决策树生成算法[J]. 软件学报 2017(11)
    • [12].基于加权多决策树的入侵检测系统模型研究[J]. 计算机安全 2009(08)
    • [13].基于核属性的决策树构造算法研究[J]. 滁州学院学报 2008(06)
    • [14].基于决策树的设备预测性维护[J]. 数字通信世界 2018(08)
    • [15].贝叶斯的决策树剪枝算法在学科评审中的研究[J]. 计算机工程与设计 2013(11)
    • [16].基于多决策树的RFID入侵检测模型[J]. 计算机应用研究 2014(04)
    • [17].基于决策树的财务危机预警研究[J]. 财会通讯 2011(17)
    • [18].浅谈随机决策树[J]. 电脑知识与技术 2009(25)
    • [19].一种懒惰式决策树和普通决策树结合的分类模型——半懒惰式决策树[J]. 计算机应用与软件 2008(12)
    • [20].基于不同决策树的面向对象林区遥感影像分类比较[J]. 应用生态学报 2018(12)
    • [21].基于伪梯度提升决策树的内网防御算法[J]. 计算机科学 2018(04)
    • [22].基于决策树的游客意向及旅游建议的研究[J]. 现代计算机(专业版) 2018(12)
    • [23].基于多源不确定物体的研究[J]. 湖南工程学院学报(自然科学版) 2018(03)
    • [24].基于决策树的日志分析方法[J]. 软件导刊 2020(01)
    • [25].基于决策树判别的高温目标遥感识别方法[J]. 科学技术与工程 2019(11)
    • [26].决策树多元分类模型预测森林植被覆盖[J]. 电子制作 2017(24)
    • [27].基于加权划分非平衡决策树的诗歌朗读情感度分析[J]. 计算机科学 2020(S2)
    • [28].非相容表决策树构建算法[J]. 河海大学学报(自然科学版) 2013(02)
    • [29].有序决策树的比较研究[J]. 计算机科学与探索 2013(11)
    • [30].一种基于决策树的选择查询算法[J]. 中国科技信息 2012(03)

    标签:;  ;  ;  ;  ;  

    增量决策树中样例选择的影响与评价
    下载Doc文档

    猜你喜欢