摘要

提出了一种只利用Wikipedia的链接结构化信息度量词汇间语义相关性的新方法,在语义相关性的计算过程中,综合考虑了两种指向的共享链接(指入型、指出型)和三种链接相关的类型(直接链接相关、间接链接相关、传递链接相关)。利用多个通用的测试数据集与当前若干主流语义相关性度量方法进行了实验比较,结果表明本文方法在不需要进行任何的文本处理的情况下取得了前所未有的好效果。