决策树分类算法及其应用

决策树分类算法及其应用

论文摘要

随着企业信息化建设,数据仓库和决策支持系统技术在企业中得到了空前的应用。如何将决策支持系统中的数据挖掘方法应用到企业中成为了研究的重点。论文主要是围绕数据挖掘分类算法中的决策树算法的关键技术展开研究的。本文首先对决策树分类算法做了一个综述。对典型的决策树分类算法的主要特性,优缺点,适用范围,目前的改进状况,决策树算法的应用和展望进行了简要的概述。随着数据处理技术的飞速发展,需要处理的数据规模越来越大,已经从最初的小型数据库发展到现在大型数据库,数据仓库等。这时有效性、正确性和空间性就成为了数据挖掘中主要考虑的特性。在对典型决策树分类算法的研究后,将抽样技术引入到决策树算法C4.5中,使得这种对小数据集有效的算法也能在给定大数据集的情况下挖掘出有一定正确性的分类规则。选择UCI机器学习库的标准数据库为数据源,使用改进的基于抽样的决策树C4.5算法进行分类规则的挖掘。试验表明该方法能在获得满意的正确性的情况下显著的提高数据挖掘的效率。紧接着结合一个钢铁企业的应用背景,将改进的算法应用在了两个大的方面:钢铁企业生产成本关键工序分析和钢铁企业亏损品种分析。第一个应用以工艺路线为切入点,结合钢铁企业的成本分析项目,对生产成本关键工序进行数据仓库建模。采用改进的基于抽样技术的决策树C4.5算法对海量数据进行挖掘,挖掘出工艺路线中的关键工序,影响钢铁企业成本的分类规则。第二个应用结合钢铁企业的销售亏损品种分析项目,对亏损品种分析进行数据仓库建模,挖掘出钢铁企业亏损品种分析的关键影响因素。两个应用为钢铁企业的成本管理提供了科学依据,同时为数据挖掘系统的建立提供了很好的经验。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题的背景和意义
  • 1.1.1 课题的背景及可行性分析
  • 1.1.2 本课题的目的和意义
  • 1.2 论文研究的主要思路
  • 1.3 论文的结构
  • 本章小结
  • 第二章 决策树分类算法综述
  • 2.1 分类算法
  • 2.1.1 决策树(decision tree)分类算法
  • 2.1.2 贝叶斯(Beyes)分类算法
  • 2.1.3 粗糙集(Rough Set)分类算法
  • 2.1.4 人工神经网络(Artificial Neural Network.ANN)分类算法
  • 2.2 决策树(decision tree)分类算法典型算法分析
  • 2.2.1 ID3 算法
  • 2.2.2 C4.5 算法
  • 2.2.3 SLIQ 算法与SPRINT 算法
  • 2.2.4 CHAID 算法
  • 2.2.5 CART 算法
  • 2.2.6 雨林(RainForest)算法
  • 2.2.7 PUBLIC 算法
  • 2.2.8 BOTA 算法
  • 2.3 决策树分类算法的主要进展
  • 2.3.1 数据预处理
  • 2.3.2 多决策树综合技术
  • 2.3.3 决策树的增量学习
  • 2.3.4 并行机制
  • 2.4 决策树应用
  • 2.5 总结与展望
  • 本章小结
  • 第三章 基于抽样的C4.5 算法的研究
  • 3.1 抽样的方法
  • 3.2 样本量
  • 3.3 基于抽样的决策树C4.5 算法
  • 3.3.1 基本思想
  • 3.3.2 确定抽样的初始样本量
  • 3.3.3 确定抽样的进度
  • 3.3.4 确定抽样的终止条件
  • 3.4 基于抽样的决策树算法描述
  • 3.5 试验结果
  • 本章小结
  • 第四章 决策树分类算法的应用
  • 4.1 决策树分类算法在钢铁企业生产成本关键工序分析中的应用
  • 4.1.1 钢铁企业生产成本工序维度建模
  • 4.1.2 钢铁生产成本工序数据仓库实现过程
  • 4.1.3 钢铁企业生产成本关键工序数据挖掘
  • 4.2 决策树分类算法在钢铁企业亏损品种分析中的应用
  • 4.2.1 钢铁企业亏损品种分析模型的建立
  • 4.2.2 钢铁企业亏损品种分析数据仓库的实现过程
  • 4.2.3 钢铁企业亏损品种分析数据挖掘
  • 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].决策树分类算法及其应用[J]. 科学技术创新 2017(25)
    • [2].基于决策树分类算法的遥感影像土地利用分类[J]. 阴山学刊(自然科学版) 2018(02)
    • [3].不确定数据的决策树分类算法[J]. 计算机应用 2009(11)
    • [4].一种有效的多关系决策树分类算法[J]. 内蒙古农业大学学报(自然科学版) 2020(02)
    • [5].决策树分类算法研究[J]. 信息与电脑(理论版) 2020(14)
    • [6].数据挖掘中决策树分类算法的研究与改进[J]. 软件导刊 2009(02)
    • [7].决策树分类算法在输变电设备状态监测装置可用性判断中的研究与应用[J]. 数字技术与应用 2016(12)
    • [8].决策树分类算法在教学评估中的应用[J]. 中国高等教育评估 2013(02)
    • [9].基于红黑树的连续属性数据流快速决策树分类算法[J]. 南京邮电大学学报(自然科学版) 2017(02)
    • [10].基于决策树分类算法的入侵检测研究[J]. 电子设计工程 2013(22)
    • [11].决策树几种分类算法的分析比较[J]. 电脑知识与技术 2018(20)
    • [12].基于不确定数据决策树分类算法的软件外包评价模型[J]. 天津职业技术师范大学学报 2011(03)
    • [13].基于修正系数的决策树分类算法[J]. 计算机工程与设计 2008(24)
    • [14].属性约简的决策树分类算法对未成年人犯罪行为的分析[J]. 中国人民公安大学学报(自然科学版) 2011(04)
    • [15].ID3决策树分类算法在学生信息中的应用[J]. 硅谷 2011(11)
    • [16].一种改进的基于粗糙集理论的决策树分类算法[J]. 云南民族大学学报(自然科学版) 2012(06)
    • [17].决策树分类算法——ID3算法及其讨论[J]. 软件导刊 2010(10)
    • [18].决策树分类算法-ID3的改进[J]. 黑龙江科技信息 2009(07)
    • [19].基于最小Gini指标的决策树分类算法设计与研究[J]. 软件导刊 2009(05)
    • [20].基于决策树分类算法异构数据的索引优化[J]. 电子科技 2018(03)
    • [21].数据挖掘中决策树分类算法的研究[J]. 东华理工大学学报(自然科学版) 2010(02)
    • [22].基于数据挖掘技术的高校精准化资助路径探析[J]. 国际公关 2020(08)
    • [23].基于bagging思想的决策树分类算法研究[J]. 北京服装学院学报(自然科学版) 2020(03)
    • [24].基于MR的并行决策树分类算法的设计与实现[J]. 广西师范大学学报(自然科学版) 2011(01)
    • [25].决策树分类算法C4.5中连续属性过程处理的改进[J]. 计算机与现代化 2010(08)
    • [26].一种基于改进SLIQ决策树分类算法的应用研究[J]. 苏州大学学报(工科版) 2010(01)
    • [27].基于McDiarmid不等式的决策树分类算法[J]. 山西大学学报(自然科学版) 2019(04)
    • [28].数据挖掘中改进的C4.5决策树分类算法[J]. 吉林大学学报(理学版) 2017(05)
    • [29].基于关联矩阵的决策树分类算法[J]. 长春大学学报 2013(04)
    • [30].基于模糊分裂的概念自适应增量决策树分类算法[J]. 计算机工程与设计 2011(04)

    标签:;  ;  ;  ;  ;  

    决策树分类算法及其应用
    下载Doc文档

    猜你喜欢