教育信息挖掘模型的设计与实现

教育信息挖掘模型的设计与实现

论文摘要

在高等学校的信息化建设中积累了大量的数据,挖掘隐藏在这些数据背后的知识,为人们的决策提供帮助,对于促进高等学校的建设,具有一定的现实意义。本文对数据挖掘中的决策树算法ID3算法进行了研究,并结合教育管理信息中数据的特点,对ID3算法进行了改进;并设计了教育信息挖掘模型DT-IDM。决策树学习算法在数据挖掘技术中具有很重要的作用。但决策树的ID3算法有以下三方面不足;(1)在决策树的每个节点上只选择单个属性,属性间的相关性强调不够,导致决策树中子树的重复。(2)在生成决策树过程中,由于递归地划分,一些数据子集可能变得太小,进一步划分就失去了统计意义。(3)倾向于有许多值的属性。针对ID3算法存在的不足,结合教育管理信息中数据的特点,对ID3算法进行了改进,提出了IDT-DM算法,主要做了以下改进;(1)引入相关度概念,将与分类属性相关度小于事先规定的阈值的属性剔除,降低了决策树的复杂度,使生成的知识、规则更容易理解。(2)在生成决策树过程中,算法根据设定的分类阈值进行判断,决定是否进一步划分,如果划分停止则创建一个叶节点。(3)引进了复合度量基准取代信息增益作为决策属性选择的标准。在一定程度上解决了决策树采用信息增益基准所造成的偏向有许多值的属性的缺陷。根据改进的IDT-DM算法,设计了面向教育管理决策的数据挖掘模型;在挖掘模型DT-IDM的实现过程中,运用VISUAL C++开发语言,采用SQL Server2000数据库创建了教育信息挖掘库。根据教育信息库中的数据,对学生课程成绩信息,学生基本信息等信息进行挖掘。在知识的表达和解释方面,使用易理解的表格、图形等,并进行了解释和评估。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 教育信息挖掘技术的应用状况
  • 1.2 教育信息及其结构
  • 1.3 论文研究内容及章节安排
  • 第2章 数据挖掘原理
  • 2.1 数据挖掘的基本概念
  • 2.2 分类和分类方法
  • 2.3 决策树的基本概念
  • 2.3.1 决策树的学习算法
  • 2.3.2 决策树的构造
  • 2.3.3 构造决策树的算法
  • 2.3.4 决策树的分析研究
  • 第3章 决策树分类挖掘方法
  • 3.1 ID3算法介绍
  • 3.2 ID3的改进方法
  • 3.2.1 属性相关性
  • 3.2.2 非分类属性组合及其意义
  • 3.3 修改后的ID3算法描述
  • 3.4 决策树剪枝
  • 3.4.1 剪枝处理方法
  • 3.4.2 剪枝处理算法
  • 第4章 基于决策树的教育信息挖掘模型的设计
  • 4.1 教育信息挖掘模型的设计原则
  • 4.2 教育信息挖掘模型的系统构成
  • 4.3 数据库与挖掘库的设计
  • 第5章 教育信息的规则挖掘
  • 5.1 教育信息挖掘的环境选择
  • 5.2 分类规则挖掘过程
  • 5.2.1 挖掘对象的确定
  • 5.2.2 挖掘参数的确定
  • 5.2.3 挖掘规则的输出
  • 第6章 挖掘结果分析
  • 6.1 数据挖掘几个重要参数
  • 6.2 数据的量化技术和方法
  • 6.3 不同应用目的的相关规则
  • 6.3.1 课程之间的规则
  • 6.3.2 学生发展的规则
  • 6.3.3 课程和基本信息的规则
  • 6.4 教育信息挖掘结果的分析与研究
  • 第7章 结论
  • 参考文献
  • 攻读学位期间公开发表论文
  • 致谢
  • 研究生履历
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    教育信息挖掘模型的设计与实现
    下载Doc文档

    猜你喜欢