论文摘要
为了真正实现以学习者为主体的个性化学习,就要注重学习者特征分析以及在此基础上实现学习个性化。后者是个性化学习的关键技术。随着数据挖掘技术在教育领域的广泛应用,对改进的ID3算法的研究作为一个研究热点在个性化学习领域得到了广泛的关注。为了有效利用学习资源,本文对数据挖掘中的决策树算法-ID3算法进行了研究,并结合个性化学习数据的特点,设计实现了一种基于ID3算法的决策树新算法—ILIDA-ID3算法,并根据新算法设计了教育信息挖掘模型。本论文的主要工作体现在:①本文分析了常见学生模型以及IEEE1484.2 PAPI模型规范的优缺点,分析了影响个性化学习的参数,提出了一个相对完整的个性化学生模型。②新算法主要做了以下改进:1)根据ID3算法信息量计算公式的特点,提出了针对ID3算法信息量计算的近似计算方法,简化了信息量计算的复杂度,提高了决策树构造的效率。2)学习者有许多属性,对个性化学习挖掘结果所做的贡献也是不同的,如果考虑所有属性,挖掘涉及的属性就会很多,时间上就会浪费。本文在ILIDA-ID3算法中引入相关度概念,先对进行挖掘的非分类属性进行相关性分析,将与分类属性相关度小于事先规定的阈值的属性剔除,这减少了子树的重复,有效的降低了决策树的复杂度,从而使生成的知识更容易理解。3)在生成决策树过程中,由于反复划分,一些数据子集可能变得太小,使得进一步划分失去了统计意义,为了避免这一问题,算法根据预先设定的分类阈值进行判断,如果给定子集中的样本数少于该阈值,该子集的进一步划分停止。作为替换,创建一个叶节点。在树剪枝时,对作为替换创建的叶节点,找出子集中分类属性具有最大样本数的类别,作为该叶节点的分类属性的值。4)引进了复合度量基准取代信息增益作为决策属性选择的标准。在一定程度上解决了决策树采用信息增益基准所造成的偏向有许多值的属性的缺陷,并可改善决策树结构和分类正确率。③根据ILIDA-ID3算法,本文设计出一个面向个性化学习评价的数据挖掘模型:个性化学习评价挖掘模型。