摘要

传统的三元组抽取采用流水线方式分阶段进行命名实体识别和关系抽取,导致实体识别的精度直接影响关系抽取的效果,造成句子上下文信息缺失,以及实体关系重叠问题等。为此,提出了结合依存分析、图注意力网络和对抗训练的三元组联合抽取模型,该模型将句子输入到BiLSTM层提取单词特征,利用可学习的线性单元进行特征强化,同时将句子输入到句法分析层生成的约束矩阵;将强化后的单词特征与依存约束矩阵输入到图注意力网络提取句子序列特征和单词的局部依赖特征,共同计算图注意力系数;再使用Sigmoid层预测出句子中的实体和实体关系;在词嵌入层加入对抗训练改善模型鲁棒性。实验采用公共数据集NYT验证了模型抽取三元组的准确率,同时召回率也显著提升,与现有的流水线和联合方法相比,改善了误差累积、关系重叠问题。