摘要

文章从句酷批改网抽取了非英语专业大学生英语议论文写作文本2300篇,采用二语句法复杂度分析器分析,进一步使用随机森林和逻辑回归机器学习算法探究高分组学生在句法层面的重要写作特征。研究发现:基于二语句法复杂度,使用随机森林和逻辑回归对高分组学生作文机评分数预测的准确率较高,高分组学生的写作文本在单位长度、句子复杂度和特定短语结构三大类句法复杂度上具有突出表现,其中最显著的五项句法特征是平均句长、平均每句所含子句量、平均子句长度、每个主从句中的动词短语量和每个子句中的复杂名词性短语量。文章的研究结果可以为提高英语写作教学水平和改进写作机评系统提供参考。