摘要
常见的命名实体识别模型主要关注字词特征的抽取,对上下文语义信息的捕捉与挖掘不够充分,对中文字词边界模糊、语义歧义等问题效果较差;对此,提出了一种结合词典方法的图注意力网络实体抽取模型,能够有效减少错误信息在网络中的传播,增强对词典信息的有效利用;并通过融入“BMES”图结构和注意力机制,建立字词之间的通道,深度挖掘字词在不同语境下的关系;为了验证模型的有效性,在MRSA和Weibo数据集上进行了测试,模型在MRSA上的F1值可达94.12%,与传统方法相比提高了1.42%;后者在模型下的F1值可达61.30%,较传统方法提升了2.51%;实验结果证明,结合词典方法和交互图的图注意力网络模型在MRSA和Weibo数据集上实体识别的准确率优于传统方法,且具有一定的泛化能力。
-
单位东北大学; 国网辽宁省电力有限公司信息通信分公司; 安徽继远软件有限公司