基于关联度函数的决策树分类算法研究

基于关联度函数的决策树分类算法研究

论文题目: 基于关联度函数的决策树分类算法研究

论文类型: 硕士论文

论文专业: 控制科学与工程

作者: 韩松来

导师: 周华平

关键词: 数据挖掘,分类,预测,决策树,多值偏向

文献来源: 国防科学技术大学

发表年度: 2005

论文摘要: 数据挖掘,又称为数据库中的知识发现,是一个可以从大量数据中自动提取有用模式的过程。分类是数据挖掘的重要内容之一,而在分类算法中以决策树算法应用最为广泛。现存的决策树算法普遍地存在着一个问题——属性选择时的多值偏向。多值偏向可能导致从数据集中归纳出错误的知识,使决策树的性能下降。本论文针对上述问题,主要作了如下工作:①从实验和理论两个方面分析了决策树算法的多值偏向问题;②提出了一种避免了多值偏向问题的决策树算法——AF算法;③实现了AF算法,并把它应用到医学领域中的病人分类问题中。本文主要有两个创新点:第一,提出了一种从理论上分析多值偏向问题的方法。实验方法是分析决策树算法中的多值偏向问题的传统方法,其缺点是需要具备该数据领域的专家知识。本文提出的分析多值偏向问题的理论方法,使得在缺乏专家知识的情况下,仍然能够对决策树算法的多值偏向问题作出判断。第二,提出了一种新的基于关联度函数的决策树算法——AF算法。在深入分析多值偏向问题的基础上,本文提出了一种克服了多值偏向问题的决策树算法——AF算法。通过评估发现,AF算法在总体性能上要优于目前被广泛采用的ID3算法。

论文目录:

摘要

ABSTRACT

第一章 绪论

1.1 决策树算法研究的意义

1.2 决策树算法研究的历史与现状

1.2.1 决策树算法研究的发展过程

1.2.2 决策树算法研究的发展趋势

1.3 论文的主要内容及组织结构

第二章 数据挖掘理论

2.1 引言

2.2 数据挖掘的定义

2.2.1 数据挖掘的含义

2.2.2 数据挖掘示例

2.3 数据挖掘的功能

2.3.1 概念/类描述

2.3.2 关联分析

2.3.3 分类和预测

2.3.4 聚类分析

2.3.5 孤立点分析

2.3.6 演变分析

2.4 数据挖掘结果的评估

2.5 小结

第三章 数据挖掘中的决策树算法

3.1 引言

3.2 决策树算法简介

3.2.1 决策树算法中的基本概念

3.2.2 决策树算法中的主要过程

3.3 决策树算法中要研究的问题

3.3.1 数据预处理

3.3.2 属性选取标准

3.3.3 决策树剪枝

3.3.4 决策树算法评估

3.4 决策树算法中的各种属性选取标准

3.4.1 信息增益标准

3.4.2 Gini-Index标准

3.4.3 Chi-Square统计标准

3.4.4 RELIEF标准

3.4.5 CM标准

3.5 小结

第四章 决策树算法中的多值偏向问题分析

4.1 引言

4.2 多值偏向问题的实验分析

4.2.1 实验分析的步骤

4.2.2 实验分析举例

4.2.3 实验分析的缺点

4.3 多值偏向问题的理论分析

4.3.1 多值偏向问题的理论分析方法

4.3.2 ID3 算法的多值偏向分析

4.3.3 Gini-Index算法的多值偏向分析

4.3.4 Chi-Square算法的多值偏向分析

4.3.5 RELIEF算法的多值偏向分析

4.4 小结

第五章 基于关联度函数的决策树算法

5.1 引言

5.2 基于关联度函数的决策树算法的提出

5.3 基于关联度函数的决策树算法的基本内容

5.4 基于关联度函数的决策树算法的多值偏向分析

5.5 基于关联度函数的决策树算法的评估

5.6 小结

第六章 基于关联度函数的决策树算法的应用

6.1 引言

6.2 数据结构与算法流程

6.2.1 核心数据结构的设计

6.2.2 生成决策树的算法流程

6.2.3 判定数据记录类型的算法流程

6.3 AF算法在病人分类中的应用

6.3.1 问题的描述

6.3.2 AF算法的应用

6.3.3 AF算法与ID3 算法的比较

6.4 小结

第七章 总结与展望

7.1 本文的主要内容

7.2 对未来研究的展望

致谢

参考文献

攻读硕士学位期间发表的论文

附录I AF算法的实现程序

发布时间: 2006-09-14

参考文献

  • [1].前向决策树算法的研究与改进[D]. 张悦.河北大学2010
  • [2].基于粗糙集的决策树算法研究与改进[D]. 吴寒.哈尔滨工程大学2008
  • [3].基于决策树算法的气象数据分析及发布平台[D]. 严蔚岚.南京信息工程大学2018
  • [4].决策树算法在市场细分中的应用研究[D]. 张静.辽宁工程技术大学2007
  • [5].基于蚁群优化的决策树算法研究与应用[D]. 张忠坤.北京邮电大学2014
  • [6].决策树算法中模糊语义的研究[D]. 卢宪娇.中国石油大学2011
  • [7].决策树算法研究及在查询接口发现中的应用[D]. 胡道京.苏州大学2010
  • [8].基于信息熵的决策树算法研究及在肺病住院费用分析中的应用[D]. 王佳杰.长春理工大学2011
  • [9].探井生产管理决策支持系统知识发现技术的研究[D]. 陈晓伟.中国石油大学2010
  • [10].基于粗糙集的决策树算法在高校评教中的应用[D]. 吴学辉.太原理工大学2011

相关论文

  • [1].基于决策树的数据挖掘算法研究与应用[D]. 卢东标.武汉理工大学2008
  • [2].决策树分类算法的研究及应用[D]. 卜亚杰.华北电力大学(河北)2008
  • [3].数据挖掘中决策树分类算法研究与应用[D]. 冯亚.西北大学2007
  • [4].决策树学习及其剪枝算法研究[D]. 王黎明.武汉理工大学2007
  • [5].决策树分类算法优化研究[D]. 陈沛玲.中南大学2007
  • [6].数据挖掘决策树分类算法的研究与应用[D]. 张桂杰.长春理工大学2006
  • [7].基于决策树算法的改进与应用[D]. 王峥琦.西安科技大学2005
  • [8].基于决策树的分类算法研究[D]. 关晓蔷.山西大学2006
  • [9].基于决策树的分类算法研究[D]. 胡江洪.武汉理工大学2006
  • [10].基于决策树算法的改进与应用[D]. 袁琴琴.长安大学2006

标签:;  ;  ;  ;  ;  

基于关联度函数的决策树分类算法研究
下载Doc文档

猜你喜欢