论文摘要
人类社会已经进入信息时代,随着数据库技术的成熟和数据应用的普及,人类积累的数据量正在以指数速度迅速增长,数据挖掘(Data Mining)技术现在已经成为信息技术应用领域研究的焦点。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。由于高校招生人数的扩大,导致学生的能力参差不齐。努力提高学生学习成绩是每一所高校的目标,影响学生的学习成绩的因素很多。传统的学生学习成绩分析无非是得到均值、方差、区别显著性检验、信度、效度等,往往还是基于教学本身来考虑。其实在教学中还有一些不易察觉的因素隐含其中,何况还有教学以外的因素影响学生学习成绩,这些都是需要进一步分析。本文列举了经典的决策树算法—ID3算法的应用实例,并结合属性选择标准等知识提出了改进的ID3算法。并将该方法应用到了高校学生成绩的数据挖掘中,通过此方法对学生某门课的成绩进行了情况分类,并对得到的结果进行分析,得出了影响学生成绩的内部原因以及其它一些原因。通过将改进的ID3算法与经典ID3算法构造的决策树进行比较,我们发现改进算法的决策树更加简洁、更接近于理想的决策树。根据决策树中反映的信息来制定相应的措施,保证学生能够更加轻松愉快的获取知识,使教学呈现出多元化的特点,为提高教育教学质量打下坚实的基础。
论文目录
摘要Abstract第1章 绪论1.1 研究背景及意义1.2 数据挖掘和决策树的研究现状1.3 本文的主要研究内容1.4 论文组织结构第2章 数据挖掘知识概述2.1 数据挖掘的概念2.2 数据挖掘的相关技术2.2.1 归纳学习法2.2.2 统计分析方法2.2.3 仿生物技术2.2.4 可视化技术2.3 数据挖掘的主要任务2.3.1 数据总结2.3.2 分类2.3.3 预测2.3.4 关联分析2.3.5 聚类2.4 数据挖掘的应用领域2.5 本章小结第3章 决策树算法与标准ID3算法的研究3.1 决策树算法概述3.2 标准ID3算法的研究3.2.1 ID3算法的基本思想3.2.2 ID3算法的数学表示形式3.2.3 ID3算法的具体描述3.3 ID3算法的评估分析3.4 本章小结第4章 决策树剪枝算法与ID3改进算法的研究4.1 研究简化决策树算法的原因4.2 决策树剪枝算法的研究4.2.1 预剪枝算法(pre-pruning)4.2.2 后剪枝算法4.2.3 修改测试属性空间剪枝算法4.2.4 改进属性选择标准4.2.5 改变数据结构4.3 基于泰勒公式的改进ID3算法4.3.1 算法改进的理论基础4.3.2 ID3算法的改进过程4.4 实验验证4.5 本章小结第5章 数据挖掘技术在高校教学研究中的应用5.1 问题的提出5.2 解决方案的研究5.3 解决方案的具体实施过程5.3.1 确定数据挖掘对象及目标5.3.2 分类方法的选定5.3.3 数据采集5.3.4 改进ID3算法的实现与应用5.3.5 学生基本信息的分类规则5.4 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果个人简历致谢
相关论文文献
标签:数据挖掘论文; 信息熵论文; 决策树论文; 剪枝算法论文;