摘要

在医疗病历实体识别领域中,传统的命名实体识别方法因网络模型单一的原因,存在对语义特征提取不充分、模型训练时间过长等问题,导致模型鲁棒性不强、识别精准度不高。针对以上问题,本文提出一种基于文本卷积神经网络、双向简单循环单元网络(BiSRU)和自注意力机制的多网络联合模型(TextCNN-BiSRU-SelfAttention),利用SRU神经网络解决模型训练时间过长的问题,引入文本卷积神经网络解决传统BiLSTM神经网络模型无法提取局部语义特征的问题,通过自注意力机制使得模型训练的重点放在相关数据上,尽可能忽视无关数据,从而解决传统模型不能很好关注相关数据的问题。最后将多元特征向量融合,充分提取相关数据的局部特征和全局特征以提高模型识别的精确度。实验结果表明,在ChineseBLUE (cMedQANER)[17]数据集上,该模型在精准度、召回率、F1-Measure值都有较为显著的提升,同时模型训练时间明显缩短。