摘要

提出了一种以WordNet isa分类树为基础的概念间语义相似度算法。该算法将WordNet看作完备的语料库,考虑到每个概念所含有的同义词数目,结合WordNet自身的结构特点来计算概念的IC值。在计算语义相似度时,通过计算最短路径距离中每条边的语义距离之和来计算任意两概念的语义距离。并通过因子对每个边的长度进行了加权。