科技项目申报文档有较强的领域特征、统一的文档结构和特殊的相似度分析需求,文中提出了一种基于文档知识画像的多维度多粒度相关性计算模型,简称DLSM,该模型综合不同维度权重,不同粒度文本的相似性分析,结果更加精确合理。实验表明,DLSM模型在文档相似性分析中有更好的准确率和召回率。