摘要

本文是关于大规模大学英语口语朗读题型测试及其机器阅卷的研究。我们从中国科学技术大学2005-2007年期末口语考试中随机抽取了836份有效数据,并进行了人工阅卷与机器阅卷的比对实验。研究结果表明,机器阅卷与人工阅卷所得成绩的相关度为0.713,在5分制评分标准下平均分差为0.335,分差大于1的仅占3.2%。随着口语考试机器阅卷数据库的不断扩大,机器阅卷的信度还将进一步提高。因此,在大规模英语口语测试中,朗读题型采用机器阅卷已具备较高的评分信度与实用性,可替代人工阅卷。