基于决策树的数据挖掘算法优化研究

基于决策树的数据挖掘算法优化研究

论文题目: 基于决策树的数据挖掘算法优化研究

论文类型: 硕士论文

论文专业: 计算机应用技术

作者: 王威

导师: 周荣辉

关键词: 数据挖掘,决策树,算法,粗糙集,属性相似度

文献来源: 西南交通大学

发表年度: 2005

论文摘要: 数据挖掘是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中、事先未知、但又潜在有用的信息和知识的过程,建立数据间关系模型,并用其做出预测。决策树模型是数据挖掘中最常用的一种方法。它能够直接体现数据的特点,便于理解,具有较好的分类预测能力,并能方便提取决策规则。 决策树的生成过程也就是知识发现的过程,决策树模型的复杂度和预测精度决定了决策树的好坏。决策树是根据启发规则生成的,常见的决策树生成算法有基于信息论的ID3、C4.5算法以及基于最小GINI指标的CART、SLIQ、PUBLIC方法。最优决策树的生成作为一类NP问题,目前又引入了一些新的技术和方法作为启发规则如:遗传算法、相关分析等,并对现有启发规则的计算做了一定的简化,同时对决策规则的完备性也进行了初步探讨。 为了从大量的属性中找出决策规则,论文首先引入粗糙集理论,对测试属性进行约简,找出真正影响决策的属性,减小决策树的规模。并根据相似性原理,以测试属性和决策属性的相似度作为启发规则构建决策树。并在高校教师综合考评系统中采用了这种新算法,实验结果表明这种新的决策树生成算法较ID3算法的预测精度更高,计算更加简便。论文最后较为详细的介绍了教师综合评价决策树的具体实现过程。

论文目录:

第1章 绪论

1.1 数据挖掘概念

1.2 数据挖掘过程

1.3 数据挖掘的方法

1.3.1 信息论方法

1.3.2 集合论方法

1.3.3 仿生物技术

1.3.4 公式发现

1.3.5 统计分析方法

1.3.6 其他方法和技术

1.4 课题解决问题及意义

1.5 论文组织结构

第2章 决策树生成基本算法

2.1 决策树算法概述

2.1.1 决策树描述

2.1.2 决策树的生成过程

2.1.3 决策树的评价指标

2.2 几种常用的决策树生成算法

2.2.1 ID3算法简介

2.2.2 C4.5算法简介

2.2.3 CART算法简介

2.2.4 SLIQ算法简介

2.2.5 SPRINT算法简介

2.2.6 PUBLIC算法简介

2.3 本章小节

第3章 决策树生成算法的现有改进工作

3.1 启发规则的改进方法

3.1.1 启发规则的选择

3.1.2 启发规则的计算

3.2 决策规则的探讨

3.3 本章小节

第4章 一种新的决策树生成算法

4.1 基于粗糙集理论的测试属性约简

4.2 基于属性相似度的决策树生成

4.3 新算法在高校教师综合评定系统中的应用

4.3.1 项目背景简介

4.3.2 高校教师综合评定判决树生成

4.4 本章小节

第5章 教师综合考评系统的实现

5.1 系统的技术特征

5.2 系统的实现过程

5.2.1 测试属性的约简

5.2.2 测试属性与决策属性相似度的计算

5.2.3 决策树的生成

5.2.4 决策规则的验证

5.3 本章小节

结论

致谢

附录:决策规则生成算法源程序

攻读硕士学位期间发表的论文

发布时间: 2005-08-16

参考文献

  • [1].基于决策树的企业销售人员招聘模型的研究与实现[D]. 李文艳.宁夏大学2017
  • [2].数据挖掘在计算机辅助诊断中的应用研究[D]. 耿中泽.南方医科大学2008
  • [3].数据挖掘中分类算法的并行化研究与应用[D]. 王海涛.电子科技大学2014
  • [4].压力容器质量过程控制中数据挖掘方法及应用研究[D]. 莫莹.天津工业大学2017
  • [5].医疗数据挖掘可视化系统的研究与实现[D]. 吴春姗.北京邮电大学2017
  • [6].数据仓库和数据挖掘在物流系统中的应用研究[D]. 张文娟.成都理工大学2009
  • [7].数据挖掘在师资人才管理系统中的应用[D]. 高建伟.成都理工大学2005
  • [8].数据挖掘在商业银行客户关系管理中的应用[D]. 丁咏.重庆大学2006
  • [9].数据挖掘在证券投资基金中的应用[D]. 常世光.上海交通大学2007
  • [10].数据挖掘在我国家庭保险购买行为分析上的应用[D]. 赖春燕.哈尔滨工业大学2017

相关论文

  • [1].基于决策树算法的数据挖掘的应用[D]. 呼延琢.西安电子科技大学2007
  • [2].数据挖掘中决策树分类算法研究与应用[D]. 冯亚.西北大学2007
  • [3].决策树学习及其剪枝算法研究[D]. 王黎明.武汉理工大学2007
  • [4].决策树分类算法优化研究[D]. 陈沛玲.中南大学2007
  • [5].决策树优化算法研究[D]. 何箭.合肥工业大学2004
  • [6].基于决策树算法的改进与应用[D]. 王峥琦.西安科技大学2005
  • [7].基于决策树的分类算法研究[D]. 胡江洪.武汉理工大学2006
  • [8].基于数据挖掘的决策树算法研究及应用探讨[D]. 刘美玲.东北林业大学2006
  • [9].基于决策树算法的改进与应用[D]. 袁琴琴.长安大学2006
  • [10].基于决策树的数据挖掘算法的技术研究[D]. 成文丽.太原理工大学2003

标签:;  ;  ;  ;  ;  

基于决策树的数据挖掘算法优化研究
下载Doc文档

猜你喜欢