摘要

针对当前已有算法未能计算语义相似度,导致检测结果不理想的问题,提出一种面向大学英语教学的作文主题偏离自动检测算法。在大学英语教学环境下,以分布式和结构化两种语义空间为基础,组建语义表示模型,在英语单词以及短语中,得到语义相似度。通过LDA(Latent Dirichlet Allocation)模型对全部文档进训练,同时对文档中各个主体和特征词进行概率加权求和,根据设定的合理阈值检测出偏离主体的作文。仿真实验结果表明,所提算法能获取高精度的作文主题偏离自动检测结果。

全文