摘要

针对现有实体关系抽取模型结构复杂且抽取效果欠佳的问题,提出基于预训练的BERT(bidirectional encoder representation from transformers)与CNN(convolutional neural network)编码特征融合的实体关系联合抽取方法。首先,基于BERT-CNN编码的句子向量预测主语的首尾位置;其次,将预测的首尾位置索引句子中的特征向量作为预测主语的首尾向量,再将预测的主语首尾向量采用乘积方式进行特征融合得到主语向量;然后,将主语向量与句子向量以乘积方式融合得到新的句子编码向量,进而指导不同关系下宾语首尾位置的预测,得到实体关系三元组。为了验证模型效果,将本模型与其他类似算法模型在NYT与WebNLG公开数据集上进行对比实验,其准确率、召回率均优于对比模型且F1值分别达到92.75%与93.19%。