基于LEBERT-BCF的电子病历实体识别

作者:吴广硕; 樊重俊*; 陶国庆; 贺远珍
来源:计算机时代, 2023, (02): 92-97.
DOI:10.16644/j.cnki.cn33-1094/tp.2023.02.021

摘要

针对BERT在中文电子病历实体识别过程中缺少词信息,实体边界信息被浪费和模型鲁棒性较差等问题,提出一种基于BERT并引入外部词典进行特征增强和对抗训练的实体识别模型LEBERT-BCF。该模型通过外部词典自动为电子病历进行词汇匹配构建字符-词语对,在BERT内部将字符-词语对中对应字向量与词向量经过Lexicon Adapter模块进行特征融合并使用FGM提升模型的鲁棒性。在CCKS 2019数据集上的实验结果表明,该模型的F1值比BERTBiLSTM-CRF提高了3.45%。