摘要

当前电子病历(EMRs)命名实体识别(NER)的研究主要集中在验证传统文本中的命名实体识别方法是否对电子病历有效。到目前为止,仍未从多类分类的角度提出通过深度学习提高命名实体识别性能的模型。文中通过对一个真实的EMRs语料库进行标注并完成模型的训练与性能评估,然后提出一种基于深度学习卷积神经网络(CNN)的EMRs命名实体多类分类方法。该方法分为两个阶段:在第一阶段中对EMRs进行预处理,以嵌入单词来表示样本;在第二阶段,将训练数据分割成多个子集,并在每个子集上训练出CNN二元分类模型。通过数据测试实验,将此方法与其他传统方法进行详细的对比,验证了该多类分类方法的有效性。

全文