摘要

采用项目反应理论(IRT)和经典测量理论(CTT)对比研究某科目学业水平考试连续两年的考生成绩。依据项目反应理论具有样本独立性和测验独立性的特点,探索将考生水平和试卷难度参照到同一能力量尺上的测量学方法。三参数逻辑斯蒂克模型(3PLM)的拟合优度好,特别适用于对新高考学考对试卷难度设计、试题测量效果和考生学业质量的评价。考试分数赋以学业质量内涵有利于促进教育评价科学转型,试卷难度从要求根据"合适"考生水平到追求"合理"匹配学业水平,试题评价从依靠专家"经验"为主到依据测量技术分析"实证"为主,学业质量评价从显示"排位"前后论成败到揭示"内涵"结构提内能。应用好项目反应理论为破除"唯分数"痼疾找到一条可行路径,可以在新高考学考评价中发挥重要作用。