摘要
目的 利用中医临床症状信息自动抽取技术,将自然语言描述的症状信息从原始病案中抽取出来进行结构化处理,为中医临床数据知识化奠定坚实基础。方法 构建中医临床症状基础语料库,利用该语料库,采用深度学习方法遴选信息识别模型,选取某中医院肝病科臌胀病临床数据,应用信息识别模型对其中的中医临床症状信息进行抽取,并将其存储至中医临床病例报告表(CRF)中。结果 构建了中医临床症状基础语料库,遴选出了BERT-BiLSTM-CRF模型进行症状实体和症状附加类目属性识别以及TextCNN模型进行症状必要类目属性识别,可有效实现中医临床数据中的症状信息自动抽取,并写入CRF表。结论 创建了一个适用于从中医临床数据中自动抽取症状信息的技术方法,可以有效从海量中医临床数据中抽取症状信息。同时随着专科专病临床数据信息抽取工作的不断开展,症状语料库将得以扩展,可进一步提高症状及其属性识别的正确率。该方法作为基于真实世界中医临床数据的知识工程关键技术之一,为开展中医临床大数据知识工程提供了技术支撑。
-
单位湖北中医药大学; 湖北省中医院