基于LDA耦合空间模型的作文跑题检测方法研究

作者:孟超颖; 宋文爱; 富丽贞
来源:计算机应用研究, 2019, 36(12): 3544-3547.
DOI:10.19734/j.issn.1001-3695.2018.08.0590

摘要

传统的跑题检测方法大部分是将文本转换为向量空间的向量表示,再计算与正确文章之间的相似度来得到是否跑题的结果,然而这种方法仅针对文章语句结构上的表示,却忽略了文章语义上的关联,并且对于题目发散度较高的作文跑题检测效果较低。针对以上问题,利用题目与正文主题词在耦合空间计算其相关度,再通过聚类的方法实现无监督的作文跑题检测。实验结果表明,基于耦合空间模型的作文跑题检测方法不论对于题目发散度较低还是较高的作文的检测准确度都有一定程度的提高,其中对于题目发散度较高的作文更为明显。

全文