摘要
实体关系抽取是信息抽取领域的一项关键技术,在知识库自动构建、问答系统等领域有着极为重要的意义.远程监督关系抽取技术利用大型知识库(Knowledge Base, KB)自动对语料进行标注,但存在噪声过大的问题.前人提出的注意力模型中利用实体对的向量表示相减得到关系语义表示,进而使用关系表示来达到降噪的效果,然而同一实体对间存在多种关系,此种表示方法会导致噪声无法很好的过滤.针对上述问题提出了适用于多种关系存在的实体关系表示方法,并构建了一种基于新型关系表示的注意力机制的远程监督关系抽取模型.该模型使用PCNN网络来获取句子的语义特征,使用变换矩阵为每个实体对集合学习一个新型的关系表示来构建句子层的注意力,以达到进一步降噪的目的.实验表明:模型的预测结果优于基于远程监督的实体关系抽取问题的基线.
- 单位