摘要
在传统多数据知识的三元组实体关系抽取任务中,存在实体识别精度低下,实体关系抽取复杂度高、重叠率大、缺失数据多等问题。构建了一种基于双层注意力机制增强双特征的神经网络模型—BIO-VEC-DAM模型,提高了实体识别率,降低了实体关系抽取的复杂性与重叠率。BIO-VEC-DAM模型首先通过BIO标注法对多数据进行集成处理,减低数据冗杂,构建三元组的初始形态;然后利用改进BIO标注法提取三元组的位置特征,并采用WORD2Vec算法提取三元组的置信度特征;接着使用双层注意力机制增强位置特征与置信度特征,提高特征辨识度;最后将增强后的特征投入到神经网络模型中进行训练。实体关系抽取实验的仿真结果表明,BIO-VEC-DAM模型较传统模型与单一特征增强的CNN模型相比,准确率与召回率均有显著提升;且在实体识别任务中,经不同数据集的训练后,上述模型较其它模型相比,F1值平均提高了0.96%。所以,在三元组实体关系抽取任务中,构建的BIO-VEC-DAM模型性能更为优越。
-
单位中国科学院; 中国刑事警察学院; 中国科学院大学