摘要
计算机自动评分优势诸多,发展势头迅疾,将这一技术引入到实评之中,须对其效度进行论证。本研究依据Williamson等在2012年提出的计算机自动评分效度论证框架,对2016年11月我国新疆地区中国少数民族汉语水平等级考试(MHK)口语考试的实测数据进行了计算机自动评分的效度验证,结果显示:依据该框架对口语开放性试题计算机自动评分进行效度验证是可行的,MHK口语开放性试题的计算机自动评分与人工评分的依据相似,与专家评分的相关系数在0.8以上,评分的一致性和稳定性较高,多项指标明显优于人工评分。
-
单位北京语言大学