摘要

针对油田井控领域文本相似度计算时,由于语义信息不足导致相似度计算结果准确度不高的问题。论文提出一种基于知识图谱和依存句法分析的文本相似度计算方法。在该方法中,首先利用依存句法技术获取文本核心关系词对,然后基于井控知识图谱和同义词词林对计算不同的关系词对间的相似度,再结合基于词向量的句子相似度计算,分配权重,最后获取井控文本的综合相似度。实验结果表明:与现有方法相比,该方法融合了文本在词和句子级别上的信息,更好地对文本语义进行识别,较大地提高了油田井控领域文本之间相似度计算结果准确率。