摘要

本文对基于词汇增强的中文电子病历命名实体识别方法进行了分析。命名实体识别(NER)是自然语言处理中的基本任务。在中文命名实体识别任务中,通常可分为基于字符(字符粒度)和基于单词(单词粒度)。在命名实体识别任务的中文电子病历中,命名实体识别方法的字符粒度更为常见。词汇信息在实体识别中非常重要,但常用的方法缺少重要的词汇信息,因此采用LEBER方法引入词汇信息,提高中文电子病历命名实体识别模型的性能。实验证明,词汇增强方法在中文电子病历命名实体识别中是有效的。