摘要
目的基于经典测验理论(classical test theory, CTT)和项目反应理论(item response theory, IRT)下的等值方法对2个年度临床医学专业(本科)水平测试(简称学业水平测试)考生作答情况进行分析, 探讨学业水平测试中更为适合的等值方法。方法基于CTT方法, 采用塔克(Tucker)观察分数线性等值方法、列文(Levine)观察分数线性等值方法、等百分位法、等百分位平滑法4种方法, 基于IRT方法的单参数、双参数模型中, 采用分别估计法、同时估计法和固定共同题参数估计法各3种校准方法进行等值探索, 通过等值标准误来分析以上10种等值结果的稳定性。结果 CTT方法的等值误差在0.7~1.6之间, IRT方法的等值误差在0.2~0.6之间, IRT误差更小。CTT方法中, Tucker观察分数线性等值方法误差最小, 为0.7, 等百分位平滑法误差最大, 为1.6;IRT方法中, 单参数模型的等值结果优于双参数模型, 单参数模型中, 固定共同题参数估计法的误差最小, 为0.2。结论学业水平测试等值可以选择IRT单参数模型中的固定共同题参数估计法, 通过等值, 年度2学业水平测试等值后的分数上调, 合格标准保持不变, 有效地实现了分数可比, 保证了考试公平。
-
单位北京语言大学