RSM改进及多级评分AHM的开发研究

RSM改进及多级评分AHM的开发研究

论文摘要

无论是观察分数还是能力分数,它们只是对被试一个笼统的大概描述。这种传统测验对具有相同分数或相同能力的被试,却有不同知识状态或不同认知结构这一现象无法做出合理解释;而认知诊断测验能对被试在完成测验项目时的认知过程或心理加工过程进行诊断和评估。Tatsuoka的规则空间模型(RSM)是较早提出且最有影响的认知诊断模型之一,她认为测验评估能够且应该提供被试的具体认知结构,并用它来指导对被试作出补救决策。属性层次方法(AHM)是其中一种变体,该方法假设测验项目是由一组具有层次结构的属性来表征的,然后根据被试的作答反应把被试归类到相应的知识状态中。一方面,本研究对RSM中一些错误理论进行改进。RSM分成两大部分,第一部分是Q矩阵理论,第二部分是模式识别。本文从理论和实例两方面揭示RSM中Q矩阵理论的缺陷和错误,这些失误使得RSM中用布尔描述函数(BDF)计算被试理想项目反应模式(IRP)的方法缺乏理论依据,于是提出了几种更简便的计算理想项目反应模式的方法。接着介绍了一种由可达阵推导出简化Q阵的方法,且指出构造认知诊断测验中可达阵的重要性。还有,RSM的分类方法较复杂,本文把几种度量距离和相似性的方法(KL、KF、LL、SQRT、COS)作为模式识别准则,并用蒙特卡洛模拟实验方法比较这些分类法与规则空间方法的优劣。结果表明,LL方法分类效果最好。另一方面,本研究主要把0-1评分模型的AHM扩展成多级评分模型的AHM。本文提出确定多级评分模型AHM的期望项目反应模式全集的方法,并把在0-1评分模型中具有最高归准率的分类法——对数似然比(LL)也推广到多级评分模型,同时也提出了把相似度作为归类准则的几种分类法(S1、S2、S11、S21)。用蒙特卡洛模拟实验比较这几种分类法基于等级评分模型的优劣,用属性模式归准率和单个属性的归准率作为评价指标。结果发现,在各种情况下属性模式归准率比相应的单个属性归准率低。LL与方法A的归类效果最好,其次是S2和S21,最后是S1、S11和方法B。一般来说,随着slip的提高,它们的归准率相应下降,并且对于不同的属性层次结构,变化的规律是一致的,而S2、S11和S21在线型和合流型的变化规律则有稍微差异。在归类精度和简单性方面,多级评分AHM比Bolt等提出的多级评分融合模型(Fusion Model)更有优势。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究目的和意义
  • 1.2 本研究领域的国内外现状
  • 1.3 研究的内容及所要解决的问题
  • 1.4 论文主要创新点
  • 1.5 论文组织结构
  • 第2章 理论基础综述
  • 2.1 项目反应理论(IRT)
  • 2.1.1 项目反应理论基本概念
  • 2.1.2 IRT 基础模型
  • 2.1.3 IRT 的优缺点
  • 2.2 模式识别
  • 2.2.1 模式识别简介
  • 2.2.2 分类方法
  • 2.3 认知诊断
  • 2.3.1 背景及意义
  • 2.3.2 认知诊断模型述评
  • 2.3.3 认知诊断的国内外研究发展概况
  • 第3章 规则空间模型的改进
  • 3.1 规则空间模型回顾
  • 3.1.1 Q 矩阵理论
  • 3.1.2 模式分类
  • 3.2 Q矩阵理论的错误与改进
  • 3.2.1 确定Q 阵的错误与改进
  • 3.2.2 确定理想项目反应模式的错误与改进
  • 3.3 新的分类方法
  • 3.4 实验
  • 第4章 多级评分模型的属性层次方法
  • 4.1 0-1 评分模型属性层次方法的回顾
  • 4.2 多级评分模型属性层次方法
  • 4.2.1 Warshall 算法求可达阵R
  • r'>4.2.2 扩张算法求简化关联阵Qr
  • 4.2.3 确定期望项目反应模式全集
  • 4.2.4 0-1 评分模型AHM 分类法的推广
  • 4.2.5 对数似然比(Logarithm of Likelihood ratio ,LL)
  • 4.2.6 多级评分模型的新分类法
  • 4.3 实验设计与结果分析
  • 4.3.1 研究方法
  • 4.3.2 结果与分析
  • 第5章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 附录
  • 在学期间学术成果情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    RSM改进及多级评分AHM的开发研究
    下载Doc文档

    猜你喜欢