摘要
随着信息技术的普及和推广,健康医疗大数据呈指数级增长,基于健康医疗大数据的临床真实世界研究日益受到关注。医院电子病历记录了真实世界下患者的诊疗全过程,是最能为临床决策提供支持的数据源之一。但电子病历数据中大量非结构化文本数据的存在,增加了数据处理难度,制约了基于电子病历数据研究的开展。急需将信息技术、人工智能等先进的方法用于非结构化电子病历数据的处理,以加速数据价值转化。本文总结了当前非结构化医学数据处理的常用方法,包括基于词典和规则的方法、基于传统机器学习和深度学习的方法和以本体为代表的基于认知模型的方法,探讨了非结构化电子病历数据处理时的标准化问题及透明化报告问题,展望了相关发展。
-
单位武汉大学中南医院