摘要
实体关系抽取旨在给定的一个句子中抽取两个实体之间的语义关系。实体关系抽取是信息抽取和自然语言处理中的一项基本而重要的任务。尽管近年来已出现了一些较好的深度实体关系抽取算法,但如何充分利用语料库信息并有效地抽取语句中实体间的语义关系,以进一步提高深度模型的精度仍面临着严峻的挑战。本文首先基于训练文库构建了一种新的实体语义关系图,随着测试的进行它也可以不断扩展。实体语义关系图用于从语料库的所有句子中全局获取实体之间的语义关系。然后,选取语料库中存在的大量"other"关系作为负样本进行训练,以提高分类性能。最后,利用轻量级预训框架ALBERT、图卷积网络和负样本学习三元组损失,提出了一种新的实体关系抽取算法。该算法能不断地汇总和完善与待抽取实体对间关系的相关知识,因此可以有效地提高实体关系抽取的精度。在SemEval-2010 Task8和TACRED的基准测试中对这种算法进行的广泛性能对比实验,表明该算法的性能均优于目前最具代表性的深度实体关系抽取算法。
- 单位