摘要

在统计计算机学科专业7年毕业论文题目的基础上,从语义的角度对毕业论文题目的相似性进行了分析,为论文题目的查重及归类提供依据.首先,对毕业论文题目进行分词以得到特征词汇,进而计算特征词的权重构成论文题目的向量表示;其次,使用PLSA方法对得到的题目向量进行语义提取;最后,对语义向量进行相似度比较得出论文题目的相似性.实验结果表明,与传统的VSM方法相比,从语义角度对论文题目进行相似性比较更加合理、有效.

全文