随着教育领域信息化技术的不断深入发展,试卷信息系统应运而生,不过由于老师上传试卷的各种主客观因素,试卷的重复问题一直无法避免。利用Word2vec模型和向量空间模型对试题进行相似度分析,使用跳字模型对语料库进行训练之后得到词向量,最后再使用余弦相似度算法得到检查结果。实验结果显示,算法的准确度与人工判定的结果对比达到了90.47%,算法取得了较好的成果。