论文摘要
无论是观察分数还是能力分数,它们只是对被试一个笼统的大概描述。这种传统测验对具有相同分数或相同能力的被试,却有不同知识状态或不同认知结构这一现象无法做出合理解释;而认知诊断测验能对被试在完成测验项目时的认知过程或心理加工过程进行诊断和评估。Tatsuoka的规则空间模型(RSM)是较早提出且最有影响的认知诊断模型之一,她认为测验评估能够且应该提供被试的具体认知结构,并用它来指导对被试作出补救决策。属性层次方法(AHM)是其中一种变体,该方法假设测验项目是由一组具有层次结构的属性来表征的,然后根据被试的作答反应把被试归类到相应的知识状态中。一方面,本研究对RSM中一些错误理论进行改进。RSM分成两大部分,第一部分是Q矩阵理论,第二部分是模式识别。本文从理论和实例两方面揭示RSM中Q矩阵理论的缺陷和错误,这些失误使得RSM中用布尔描述函数(BDF)计算被试理想项目反应模式(IRP)的方法缺乏理论依据,于是提出了几种更简便的计算理想项目反应模式的方法。接着介绍了一种由可达阵推导出简化Q阵的方法,且指出构造认知诊断测验中可达阵的重要性。还有,RSM的分类方法较复杂,本文把几种度量距离和相似性的方法(KL、KF、LL、SQRT、COS)作为模式识别准则,并用蒙特卡洛模拟实验方法比较这些分类法与规则空间方法的优劣。结果表明,LL方法分类效果最好。另一方面,本研究主要把0-1评分模型的AHM扩展成多级评分模型的AHM。本文提出确定多级评分模型AHM的期望项目反应模式全集的方法,并把在0-1评分模型中具有最高归准率的分类法——对数似然比(LL)也推广到多级评分模型,同时也提出了把相似度作为归类准则的几种分类法(S1、S2、S11、S21)。用蒙特卡洛模拟实验比较这几种分类法基于等级评分模型的优劣,用属性模式归准率和单个属性的归准率作为评价指标。结果发现,在各种情况下属性模式归准率比相应的单个属性归准率低。LL与方法A的归类效果最好,其次是S2和S21,最后是S1、S11和方法B。一般来说,随着slip的提高,它们的归准率相应下降,并且对于不同的属性层次结构,变化的规律是一致的,而S2、S11和S21在线型和合流型的变化规律则有稍微差异。在归类精度和简单性方面,多级评分AHM比Bolt等提出的多级评分融合模型(Fusion Model)更有优势。