决策树分类算法的改进及其应用研究

决策树分类算法的改进及其应用研究

论文摘要

随着人们对数据挖掘理论的不断探讨和研究,数据挖掘技术在各行各业中的应用日趋广泛和成熟。在诸多的数据挖掘技术和方法中,决策树方法是用于数据分类和预测领域的重要方法之一,它是一种以实例为基础的归纳式学习算法,从一组无次序、无规则的实例中推理出决策树形式的分类规则,进而预测未知数据。ID3算法是决策树构造方法中最为常用的实现方法,它在数据分类和预测领域得到广泛应用,然而,在实际应用中,发现ID3算法存在很多不足之处。因此,本文重点研究决策树方法中的ID3算法,分析ID3及其改进算法的优缺点,给出合理的优化方案,以完善ID3算法,使其具有更好地分类效果。具体的优化方案主要体现在以下两个方面:第一,简化ID3算法的启发式函数。本文通过近似值的方法,对ID3算法的信息增益公式进行近似推导,消除其中复杂的对数运算,最终得到适用于多类的、具有通用性和一般性的简化启发式函数。新的ID3简化算法选择信息增益最小的属性作为测试属性,在计算信息增益时,避免了对数运算,只包含计算机较易处理的基本运算符号,所以,在一定程度上减少了选取最优属性的计算量,提高了算法的执行效率。第二,解决ID3算法的多值偏向问题。本文引入权值函数的概念从根本上克服ID3算法的多值偏向问题。其核心思想是:通过引入基于属性取值个数的单调权值函数,为不同属性自动分配不同权值,以权衡属性取值个数与信息增益之间的关系,进而得到新的最优属性选取标准。通过实例分析和算法比较,改进后的ID3算法选取的测试属性更为合理,进而从形成的决策树中提取的规则更为符合人们的实际需求。最后,本文通过一个实例实现了ID3优化算法在学员续费决策问题中的应用。根据学员分类应用流程,将学员基本信息表和学员反馈信息表整合而成的新数据集作为ID3优化算法的挖掘样本集合,最终形成决策树,并从中提取出知识规则。利用从大量学员相关数据背后挖掘出的知识规则可以辅助企业管理者更准确的做出判断和决策,提高了企业效益。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 第一节 课题研究背景
  • 第二节 国内外相关课题研究现状
  • 一、国外决策树方法发展历程
  • 二、国内决策树方法研究现状
  • 第三节 课题研究内容及意义
  • 第四节 论文组织结构
  • 第二章 数据挖掘与决策树方法
  • 第一节 数据挖掘综述
  • 一、数据挖掘的概念
  • 二、数据挖掘的分类
  • 三、数据挖掘的特点
  • 四、数据挖掘的步骤
  • 五、数据挖掘技术和方法
  • 第二节 决策树方法
  • 一、决策树的基本概念
  • 二、决策树的表示形式
  • 三、决策树的生成原理
  • 四、决策树的剪枝处理
  • 五、提取决策规则
  • 第三节 本章小结
  • 第三章 ID3 算法的研究与优化方案
  • 第一节 ID3 算法的研究
  • 一、ID3 算法的基本原理
  • 二、ID3 算法描述
  • 三、ID3 算法实例
  • 第二节 ID3 算法的分析
  • 一、ID3 算法的优缺点
  • 二、ID3 改进算法分析
  • 第三节 ID3 算法的优化方案
  • 第四节 本章小结
  • 第四章 ID3 算法的优化
  • 第一节 优化算法的理论支持
  • 一、简化算法理论基础
  • 二、多值偏向理论分析
  • 第二节 ID3 优化算法研究
  • 一、ID3 简化算法
  • 二、ID3 改进算法
  • 第三节 ID3 优化算法实例分析
  • 一、ID3 简化算法分析
  • 二、ID3 改进算法分析
  • 第四节 本章小结
  • 第五章 ID3 优化算法在学员续费决策问题中的应用
  • 第一节 需求分析
  • 第二节 问题定义
  • 第三节 数据准备工作
  • 第四节 建立分类模型
  • 第五节 提取规则和预测未来
  • 第六节 本章小结
  • 第六章 总结与展望
  • 第一节 论文工作总结
  • 第二节 后续工作展望
  • 参考文献
  • 致谢
  • 本人在读期间发表的研究成果
  • 相关论文文献

    • [1].基于优化决策树的智能故障诊断方法研究[J]. 广东水利电力职业技术学院学报 2020(01)
    • [2].基于赤池信息准则的分类回归决策树剪枝算法[J]. 计算机应用 2014(S2)
    • [3].浅析决策树对犯罪风险程度的预测[J]. 科技风 2019(02)
    • [4].基于改进决策树的故障诊断方法研究[J]. 成都信息工程大学学报 2018(06)
    • [5].模型决策树:一种决策树加速算法[J]. 模式识别与人工智能 2018(07)
    • [6].基于样本对的极小决策树构建[J]. 北京信息科技大学学报(自然科学版) 2015(03)
    • [7].边画边算的决策树实战[J]. 中国信息技术教育 2020(Z4)
    • [8].基于最大间隔的决策树归纳算法[J]. 科技信息 2011(25)
    • [9].基于最大间隔的决策树归纳算法[J]. 科技视界 2011(01)
    • [10].基于改进的代价敏感决策树的网络贷款分类[J]. 计算机应用 2019(10)
    • [11].不一致数据上精确决策树生成算法[J]. 软件学报 2017(11)
    • [12].基于加权多决策树的入侵检测系统模型研究[J]. 计算机安全 2009(08)
    • [13].基于核属性的决策树构造算法研究[J]. 滁州学院学报 2008(06)
    • [14].基于决策树的设备预测性维护[J]. 数字通信世界 2018(08)
    • [15].贝叶斯的决策树剪枝算法在学科评审中的研究[J]. 计算机工程与设计 2013(11)
    • [16].基于多决策树的RFID入侵检测模型[J]. 计算机应用研究 2014(04)
    • [17].基于决策树的财务危机预警研究[J]. 财会通讯 2011(17)
    • [18].浅谈随机决策树[J]. 电脑知识与技术 2009(25)
    • [19].一种懒惰式决策树和普通决策树结合的分类模型——半懒惰式决策树[J]. 计算机应用与软件 2008(12)
    • [20].基于不同决策树的面向对象林区遥感影像分类比较[J]. 应用生态学报 2018(12)
    • [21].基于伪梯度提升决策树的内网防御算法[J]. 计算机科学 2018(04)
    • [22].基于决策树的游客意向及旅游建议的研究[J]. 现代计算机(专业版) 2018(12)
    • [23].基于多源不确定物体的研究[J]. 湖南工程学院学报(自然科学版) 2018(03)
    • [24].基于决策树的日志分析方法[J]. 软件导刊 2020(01)
    • [25].基于决策树判别的高温目标遥感识别方法[J]. 科学技术与工程 2019(11)
    • [26].决策树多元分类模型预测森林植被覆盖[J]. 电子制作 2017(24)
    • [27].基于加权划分非平衡决策树的诗歌朗读情感度分析[J]. 计算机科学 2020(S2)
    • [28].非相容表决策树构建算法[J]. 河海大学学报(自然科学版) 2013(02)
    • [29].有序决策树的比较研究[J]. 计算机科学与探索 2013(11)
    • [30].一种基于决策树的选择查询算法[J]. 中国科技信息 2012(03)

    标签:;  ;  ;  ;  ;  

    决策树分类算法的改进及其应用研究
    下载Doc文档

    猜你喜欢