基于TransH的双重注意力机制远程监督关系抽取算法

作者:季一木; 汤淑宁; 刘尚东*; 张旺; 洪程; 邱晨阳; 刘强; 肖婉
来源:南京邮电大学学报(自然科学版), 2022, 42(06): 70-78.
DOI:10.14132/j.cnki.1673-5439.2022.06.009

摘要

远程监督为关系抽取任务提供了大量自动标注的数据集,且领域迁移性强,为实现自动抽取奠定了基础。然而,构造的数据集伴随了强约束性的假设,存在着严重的错误标签问题,且这些噪声数据极大影响了最终的性能结果。为了缓解错误标注的问题,文中提出了一种双重注意力模型:第一层注意力机制通过在句子编码部分引入TransH预训练好的实体向量,与句子特征共同进行注意力选择,为体现关系信息的特征分配更高的权重来提高句子编码质量;第二层则是从句子级别再进行一次注意力计算,挑选出有效的实例,进一步降低噪声数据的权重。通过在广泛使用的数据集上进行多次对比实验,表明文中所提模型可以充分利用所有信息资源,结果明显优于其他基线模型。

全文