摘要
关系抽取任务的研究往往需要人工标注大量训练数据去支撑,而远程监督可以通过自动构建训练数据的方式降低人工的成本和压力,但自动构建的数据集存在着严重的错误标注问题。针对这一问题,提出一种基于知识图谱的远程监督关系抽取降噪方法。利用生成对抗网络对数据集进行清洗;融入知识图谱中的实体信息,构建异构信息图;最后利用图注意力网络对异构信息图进行编码,实现关系抽取。在公开数据集NYT10上,相较于主流最优模型在精确率、召回率和F1值上均有所提高,证明知识图谱信息对远程监督关系抽取的重要性。
-
单位北京市遥感信息研究所