摘要
本文系统采用词汇水平、切题程度、句型难度和表达准确度四个指标来得出总分,并通过给出原文点评来指出文章的错误,通过词汇拓展对文章中使用错误的词语进行拓展释义。通过遍历文章所有词后统计各个词汇等级的词数得出词汇水平;通过计算篇章向量和题目向量之间的余弦相似度得出切题程度;通过句法树高度、连接词密度和文章的平均句子长度来计算句型难度;再根据错词的数量占文章中的比例得出表达准确度指标;原文点评的内容通过调用智能语言学习课题组的改错API得出;通过在汉语大词典中检索用户使用错误的词语返回其用法、释义等得到词汇拓展。最后,用非负约束的Lasso回归来拟合出文章的总分。系统搭建方面,本文采用Vue框架来搭建前端服务[1],用Flask框架来搭建后端服务。
-
单位北京语言大学