基于文本语义离散度的自动作文评分关键技术研究

王耀华; 李舟军; 何跃鹰; 巢文涵; 周建设

摘要

该文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式。基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分。该文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验。实验结果表明,在50篇作文的验证集上,在加入文本语义离散度特征后,预测分数与真实分数之间均方根误差最大降低10.99%,皮尔逊相关系数最高提升2.7倍。该表示方法通用性强,没有语种限制,可以扩展到任何语言。

单位
首都师范大学; 北京航空航天大学; 国家计算机网络应急技术处理协调中心

收藏分享被引浏览

更新时间：2024-05-13 23:14

基于文本语义离散度的自动作文评分关键技术研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友