摘要

针对英文句子相似度计算问题,提出基于框架语义(frame semantics)的分析计算方法.对比传统基于关键词及句子结构等计算方法,提出的方法考虑整个句子的语义信息,即关键词的上下文信息,以提高相似度计算结果的准确性.该方法建立在框架语义库FrameNet之上,并结合使用语义框架抽取工具Semafor及命名实体抽取工具NER,以减少人工参与,提高方法的执行效率.通过扩展FrameNet中的语义框架类别,应对部分关键词无法激起框架的问题;通过量化框架间语义关系并定义计算规则,实现句子间相似度的计算与判断.在标准测试集上的实验结果表明,该方法的计算结果在准确率、召回率等评价指标上,优于传统方法.