基于向量空间模型和Word2vec的试题相似度研究

作者:孙鹏辉; 邹金霞; 韩婧妍; 曲家锴
来源:信息记录材料, 2020, 21(04): 149-151.
DOI:10.16009/j.cnki.cn13-1295/tq.2020.04.097

摘要

随着教育领域信息化技术的不断深入发展,试卷信息系统应运而生,不过由于老师上传试卷的各种主客观因素,试卷的重复问题一直无法避免。利用Word2vec模型和向量空间模型对试题进行相似度分析,使用跳字模型对语料库进行训练之后得到词向量,最后再使用余弦相似度算法得到检查结果。实验结果显示,算法的准确度与人工判定的结果对比达到了90.47%,算法取得了较好的成果。