摘要
对于科研项目查重,常规方法为对科研项目的项目名称、申请书等项目组成部分分别进行相似度计算,加权处理得到综合相似度后再判断项目的相似度,不易区分客观上有一定相似度而实际上不相似的科研项目.提出一种基于最小值和Min-Max方法修正的科研项目综合相似度计算方法,先设定项目组成部分相似度最小值,低于最小值的项目组成部分不参与项目综合相似度计算,再基于Min-Max方法对项目组成部分相似度进行修正,经过修正的相似度加权处理后得到项目综合相似度.实验结果表明,基于最小值和Min-Max方法修正的计算方法能较大程度提高似相似实际不相似科研项目综合相似度的精确度.
- 单位