融合HowNet的中文电子病历命名实体识别

作者:张军亮; 方雪梅; 雒曼; 孙晶晶
来源:情报理论与实践, 2021, 44(10): 18-26.
DOI:10.16353/j.cnki.1000-7490.2021.10.003

摘要

中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。

全文