摘要

基于词典增强的方法存在搜索潜在匹配词较慢、难以批量计算等问题。针对该问题,对比计算机视觉领域的语义分割任务与自然语言处理领域的命名实体识别任务之间的相似性,提出了引入图像语义分割中的全卷积网络模型(Fully Convolutional Network),并将其应用于医疗文本的命名实体识别任务。在瑞金糖尿病数据集上进行实验,结果表明,相比基于词典增强的方法,该方法能达到F1值差距在1%内,同时无需引入词级别信息且便于进行批量计算,而在实验数据集上实际运行时间仅为基于词典增强方法的不到2%。

全文