摘要

关系抽取旨在从非结构化文本中识别出实体对间的关系.目前,大多数关系抽取方法缺乏考虑实体的上下文语义环境,难以获得输入文本中丰富的语义特征.另一方面,大多数研究仅在包级别进行噪声句的筛选,无法有效地处理包内仅有一个句子的情况.为此,本文提出一种语义增强与双级别注意力的关系抽取方法.该方法首先利用门控机制筛选句子中的关键词,并依此作为实体的上下文语义环境信息,得到语义增强实体特征,与经过神经网络编码得到的句子特征相整合,得到鲁棒的句子特征表示.最后,利用双级别注意力降低噪声句对关系抽取方法性能的影响.在NYT公共数据集上的实验结果表明,本文所提方法优于目前主流的关系抽取方法.