数据挖掘中一种基于遗传算法改进的ID3算法

数据挖掘中一种基于遗传算法改进的ID3算法

论文摘要

随着现代信息技术的迅速发展,许多领域都积累了大量的数据,对发现潜在于这些数据中的知识与规律的渴望造就了数据挖掘学科的兴起及数据挖掘技术的发展。作为一个多学科交叉的综合性领域,数据挖掘涉及了数据库、统计学、机器学习、高性能计算、模式识别、神经网络和数据可视化话等学科。决策树算法是对一组已知示例进行归纳学习,并生成一颗决策树的方法。该算法目前已经被广泛应用于自动知识获取领域。最为典型的决策树分类器学习算法是ID3算法,它采用自顶向下分而治之的策略,利用信息增益的标准选择分裂属性,能保证构造出一棵简单的树。该算法简单高效,生成的知识易于被人理解,但是在面对大量的数据获取的数据进行知识提取时存在着过度拟合的问题。在深入分析ID3算法的基础上提出了基于遗传算法改进的ID3算法并利用该算法对网络上包含入侵的数据进行了建模。该算法首先将已有的知识的规则作为遗传基因,进行进化,利用遗传算法将现有的规则集进行了分割,然后再利用划分的规则集生成决策树群,之后利用决策树群给出预测结果。实验结果表明,该算法能够较好的进行分类,并对比了ID3算法给出的结果。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 本课题的研究背景和意义
  • 1.2 国际国内研究现状及进展
  • 1.3 本文的研究内容和目标
  • 1.4 本文的组织结构
  • 第二章 数据挖掘的理论研究
  • 2.1 数据挖掘定义和三大技术支柱
  • 2.2 数据挖掘分类
  • 2.3 数据挖掘方法简介
  • 第三章 基本ID3 算法及遗传算法
  • 3.1 CLS(概念学习系统)一般学习算法
  • 3.2 信息论在决策树学习中的意义及应用
  • 3.3 传统ID3 学习算法
  • 3.4 其它改进ID3 算法介绍
  • 3.5 遗传算法简介
  • 第四章 基于遗传算法的ID3 算法
  • 4.1 基于遗传算法的ID3 算法
  • 4.1.1 基于遗传算法的ID3 算法中的ID3 算法
  • 4.1.2 ID3 算法的伪码
  • 4.1.3 基于遗传算法的ID3 算法中的遗传算法
  • 4.1.4 遗传算法中的选择算法
  • 4.1.5 选择算法的伪码
  • 4.1.6 遗传算法中的交叉算法
  • 4.2 基于遗传算法的ID3 算法
  • 4.2.1 算法的基本思路
  • 4.2.2 算法的伪码
  • 4.3 算法的理论分析
  • 4.3.1 过度拟合现象的原因
  • 4.3.2 基于遗传算法的ID3 算法的分析
  • 第五章 实验系统的设计与结果分析
  • 5.1 实验系统的设计
  • 5.1.1 系统中的数据结构
  • 5.1.2 实验系统中用到的类
  • 5.1.3 实验系统中用到的函数
  • 5.2 实验数据的来源
  • 5.3 实验及结果分析
  • 5.3.1 实验参数的说明
  • 5.3.2 实验的结果
  • 5.4 算法的展望
  • 参考文献
  • 致谢
  • 附录 A 攻读学位其间发表的论文
  • 相关论文文献

    标签:;  ;  ;  ;  

    数据挖掘中一种基于遗传算法改进的ID3算法
    下载Doc文档

    猜你喜欢