摘要
针对语言普遍存在的字符间非线性关系,为捕获更丰富的语义特征,提出了一种基于图卷积神经网络(GCN)和自注意力机制(self-attention)的命名实体识别方法。首先,借助深度学习方法有效提取字符特征的能力,采用图卷积神经网络学习字符间的全局语义特征;采用双向长短时记忆网络(BiLSTM)提取字符的上下文依赖特征。其次,融合以上特征并引入自注意力机制计算其内部重要度。最后,使用条件随机场(CRF)从融合特征中解码出最优的编码序列,并作为实体识别的结果。实验表明,与单一采用双向长短记忆网络和条件随机场的方法相比,在MSRA数据集和BioNLP/NLPBA 2004数据集上的识别精度分别提高了15.2%和1.03%,该方法在中文和英文数据集上都具备良好的序列标注能力,且泛化能力较强。
- 单位