摘要

目的 中医电子病历入院记录中包含了丰富的中医诊断信息,多用自然语言形式表达,为提高电子病历的利用以及深度促进知识加工,本文对电子病历入院记录展开信息自动抽取研究。方法 本文选择主诉、刻下症等包含症状、舌象、脉象等中医术语的文本,以及现病史、既往病史等叙述性强的病史类文本作为主要研究对象,然后根据文本类型分别进行处理。对于主诉、刻下症等症状文本,直接采用命名实体识别技术,抽取症状实体;对于现病史、既往病史等病史文本,首先进行事件抽取,划分出诊疗事件,然后采用命名实体识别技术,抽取各类实体,最后将各类实体存入数据库。结果 利用该方法对某医院骨伤科的电子病历进行了实验,其中对刻下症中症状实体的识别率达83.75%,对现病史中症状、疾病等实体的平均识别率达90.48%。结论 本文提出的方法可对电子病历的入院记录信息实现自动抽取并以结构化的方式进行存储,为进一步分析和利用电子病历数据提供了便利,并为中医智能化奠定了坚实的基础。