论文摘要
随着现代信息技术的迅速发展,许多领域都积累了大量的数据,对发现潜在于这些数据中的知识与规律的渴望造就了数据挖掘学科的兴起及数据挖掘技术的发展。作为一个多学科交叉的综合性领域,数据挖掘涉及了数据库、统计学、机器学习、高性能计算、模式识别、神经网络和数据可视化话等学科。决策树算法是对一组已知示例进行归纳学习,并生成一颗决策树的方法。该算法目前已经被广泛应用于自动知识获取领域。最为典型的决策树分类器学习算法是ID3算法,它采用自顶向下分而治之的策略,利用信息增益的标准选择分裂属性,能保证构造出一棵简单的树。该算法简单高效,生成的知识易于被人理解,但是在面对大量的数据获取的数据进行知识提取时存在着过度拟合的问题。在深入分析ID3算法的基础上提出了基于遗传算法改进的ID3算法并利用该算法对网络上包含入侵的数据进行了建模。该算法首先将已有的知识的规则作为遗传基因,进行进化,利用遗传算法将现有的规则集进行了分割,然后再利用划分的规则集生成决策树群,之后利用决策树群给出预测结果。实验结果表明,该算法能够较好的进行分类,并对比了ID3算法给出的结果。
论文目录
摘要Abstract第一章 绪论1.1 本课题的研究背景和意义1.2 国际国内研究现状及进展1.3 本文的研究内容和目标1.4 本文的组织结构第二章 数据挖掘的理论研究2.1 数据挖掘定义和三大技术支柱2.2 数据挖掘分类2.3 数据挖掘方法简介第三章 基本ID3 算法及遗传算法3.1 CLS(概念学习系统)一般学习算法3.2 信息论在决策树学习中的意义及应用3.3 传统ID3 学习算法3.4 其它改进ID3 算法介绍3.5 遗传算法简介第四章 基于遗传算法的ID3 算法4.1 基于遗传算法的ID3 算法4.1.1 基于遗传算法的ID3 算法中的ID3 算法4.1.2 ID3 算法的伪码4.1.3 基于遗传算法的ID3 算法中的遗传算法4.1.4 遗传算法中的选择算法4.1.5 选择算法的伪码4.1.6 遗传算法中的交叉算法4.2 基于遗传算法的ID3 算法4.2.1 算法的基本思路4.2.2 算法的伪码4.3 算法的理论分析4.3.1 过度拟合现象的原因4.3.2 基于遗传算法的ID3 算法的分析第五章 实验系统的设计与结果分析5.1 实验系统的设计5.1.1 系统中的数据结构5.1.2 实验系统中用到的类5.1.3 实验系统中用到的函数5.2 实验数据的来源5.3 实验及结果分析5.3.1 实验参数的说明5.3.2 实验的结果5.4 算法的展望参考文献致谢附录 A 攻读学位其间发表的论文
相关论文文献
标签:决策树论文; 数据挖掘论文; 遗传算法论文; 算法论文;