摘要
针对互联网中医学数据异构多源、传统中文分词方法无法识别医学术语的问题,利用语义技术构建面向疾病的医学知识模型,明确诊疗方案中的关键信息要素,为中文分词提供疾病自定义词典,基于分词结果统计疾病相关命名实体的词频,形成面向疾病的家庭医疗咨询决策支持。实验以湿疹的家庭医疗场景为例,建立湿疹知识图谱辅助中文文本分析,激素类药物中氢化可的松和糠酸莫米松的词频最高,分别为56%和27%;湿疹常用护肤品牌中,郁美净的频次最高,约75%。结果表明,该方法可以作为院内数据挖掘的补充和扩展,为建立医学大数据科研辅助分析平台提供基础。
-
单位浙江大学; 浙江传媒学院; 生物医学工程与仪器科学学院; 杭州市第一人民医院