题目难度分布和样本容量对两种CTT等值结果的影响

题目难度分布和样本容量对两种CTT等值结果的影响

论文摘要

在测验研究领域内寻找测量同一心理品质的两个测验形式之间分数转换关系的统计技术,叫等值。等值来源于实际工作的需要,其目的是为了使得两个不同测验形式之间的分数具有可比性。迄今,学者们已经提出了多种等值方法,其中基于经典测验理论(CTT)的方法主要有线性等值和等百分位等值两种。不同的等值方法会产生不同的等值结果。于是,到底用哪种等值方法得到的结果更加精确,就成为学者们关注的问题。对此,国内外已经有过许多研究,但由于每个研究所采用的研究情境各不相同,因此结论也各不相同。本研究用蒙特卡洛模拟研究方法,用单组非锚测验设计,以真分数等值为依据,综合比较了各种题目难度分布条件下和各种样本容量条件下两种CTT等值方法的等值结果。研究结果表明,在本研究所设情境中:(1)线性等值的误差受题目难度分布影响较大,等百分位等值的误差几乎不受题目难度分布影响。(2)线性等值的误差几乎不受样本容量的影响,等百分位等值的误差受样本容量影响较大。(3)不论题目难度分布如何,只要样本容量足够大,等百分位等值的效果都比线性等值更好。本研究的结论和以往研究有一些不同之处,为此本文也进行了一些讨论。

论文目录

  • 摘要
  • Abstract
  • 引言
  • 1 文献综述
  • 1.1 测验等值概述
  • 1.1.1 等值的意义和实质
  • 1.1.2 测验等值的条件
  • 1.1.3 测验等值结果的表示方法
  • 1.2 测验等值计算的基本方法
  • 1.2.1 CTT 等值法
  • 1.2.2 IRT 等值法
  • 1.3 常用测验等值设计
  • 1.3.1 单组设计
  • 1.3.2 等组设计
  • 1.3.3 锚测验设计(共同题设计)
  • 1.3.4 共同被试设计
  • 1.4 测验等值的误差理论
  • 1.4.1 随机误差
  • 1.4.2 系统误差
  • 1.5 国内外不同等值方法的比较研究
  • 2 研究方法与设计
  • 2.1 研究思路
  • 2.2 研究方法
  • 2.3 研究设计
  • 2.4 研究过程
  • 2.5 对研究过程的一些补充说明
  • 2.5.1 不同难度分布的数据的模拟方法
  • 2.5.2 “题目难度分布是否符合要求”的检验方法
  • 2.5.3 模拟被试的真分数的计算
  • 2.5.4 模拟作答的操作
  • 2.5.5 信度的计算
  • 2.5.6 真分数等值的计算
  • 2.5.7 等值绝对误差的计算
  • 2.5.8 等值平均绝对误差的计算
  • 3 结果与讨论
  • 3.1 题目难度分布、样本容量和等值方法对等值误差的影响
  • 3.1.1 总述
  • 3.1.2 难度分布的主效应分析
  • 3.1.3 样本容量的主效应分析
  • 3.1.4 等值方法的主效应分析
  • 3.1.5 难度分布与等值方法的交互效应分析
  • 3.1.6 样本容量与等值方法的交互效应分析
  • 3.1.7 严格的平行测验条件下,样本容量与等值方法的简单交互效应分析
  • 3.2 题目难度分布和样本容量对线性等值误差的影响
  • 3.3 题目难度分布和样本容量对等百分位等值误差的影响
  • 3.4 关于本研究的结果的一些讨论
  • 3.5 关于“等值悖论”的一些讨论
  • 结论
  • 参考文献
  • 附录
  • 致谢
  • 在读期间公开发表论文(著)及科研情况
  • 相关论文文献

    • [1].基于CTT编制中职学生体育学习兴趣量表[J]. 体育科学研究 2015(05)
    • [2].题目难度分布和样本容量对两种CTT等值结果的影响[J]. 心理学探新 2012(03)
    • [3].单组设计中三种基于CTT的等值方法群体不变性的研究[J]. 中国考试 2013(11)
    • [4].基于CTT理论的内地西藏学生汉语阅读障碍诊断测验初编[J]. 开封教育学院学报 2019(05)
    • [5].与人遗传病相关的三核苷酸(GAA)_n·(CTT)_n重复序列的分子克隆[J]. 内蒙古科技大学学报 2008(03)
    • [6].基于CTT、GT、IRT的评分者信度研究——以某届奥运会女子跳水决赛为例[J]. 考试研究 2013(05)
    • [7].基于Web的适应性考试系统的设计与实现[J]. 考试周刊 2008(18)
    • [8].中联重科设备亮相俄罗斯CTT展 洞悉需求深耕市场[J]. 交通世界(建养.机械) 2014(06)
    • [9].运用R语言CTT程序包进行教育测量学研究的实例分析[J]. 考试研究 2019(05)
    • [10].营养素养评价工具的汉化及在糖尿病患者中的信效度研究——基于CTT和Rasch模型的分析[J]. 中国全科医学 2020(26)
    • [11].基于CTT的企业专利布局分析研究[J]. 机械设计 2015(08)
    • [12].人生意义量表(修订版)的适用性和推广性:基于CTT和多维Rasch的分析[J]. 中国临床心理学杂志 2015(04)
    • [13].基于CTT和IRT的意大利语试题质量研究[J]. 现代教育技术 2018(08)
    • [14].柳工设备闪耀俄罗斯CTT展[J]. 建筑机械 2014(07)
    • [15].柳工欧维姆亮相CTT展 中国预应力技术进入俄罗斯市场[J]. 工程机械 2013(07)
    • [16].柳工携18台设备亮相俄罗斯CTT展[J]. 工程机械 2014(07)
    • [17].高中生学习倦怠量表的编制及信效度研究——基于CTT、GT和IRT的分析[J]. 西南大学学报(社会科学版) 2017(04)
    • [18].基于CTT、SEM、GT方法的无领导小组讨论信效度研究[J]. 湖州师范学院学报 2014(02)
    • [19].高考数学中考试评价的研究——基于CTT与IRT的实证比较[J]. 华东师范大学学报(教育科学版) 2014(03)
    • [20].鼎盛天工参展CTT[J]. 工程机械文摘 2008(04)
    • [21].基于CTT、IRT、FT的体育明星代言人信源模型量表研究[J]. 哈尔滨体育学院学报 2019(01)
    • [22].M310核电机组安全壳整体密封与强度试验(CTT)在一回路冷态功能试验(CFT)前实施的策略分析[J]. 科技创业家 2013(16)
    • [23].CTT、IRT、FT:体育科学量表编制中的应用——以《特质流畅量表》为研究例证[J]. 体育科学 2015(09)
    • [24].基于CTT和GA的智能题库系统设计与实现[J]. 长春工程学院学报(自然科学版) 2010(02)
    • [25].CTT与IRT参数不变性比较的实证研究综述[J]. 南京师大学报(社会科学版) 2008(02)
    • [26].柳工欧维姆亮相CTT展 进入俄罗斯市场[J]. 建筑 2013(13)
    • [27].基于CTT的多层次高校试卷质量评价研究[J]. 高教学刊 2019(13)
    • [28].提高科学学业质量监测工具的效度——基于CTT和IRT技术的科学问卷质量分析方法[J]. 教育导刊 2018(01)
    • [29].基于CTT与IRT的试卷质量评价系统设计与实现[J]. 计算机工程与设计 2013(05)
    • [30].中国重汽A7亮相俄罗斯CTT展会 现场获近百辆意向订单[J]. 重型汽车 2014(03)

    标签:;  ;  ;  ;  ;  

    题目难度分布和样本容量对两种CTT等值结果的影响
    下载Doc文档

    猜你喜欢