摘要

在大数据时代,医院记录了越来越多与病人相关的临床信息,这些信息数据对医生来说具有较高的潜在价值。本文首先使用Python爬虫技术对北京市电子病历共享平台近一年来感冒和流感患者的所有病症数据进行提取并保存在Excel中;其次,进行降维处理,提取出可以直接判断感冒和流感两种疾病的特征属性;再次,利用决策树算法ID3、Pandas和Sklearn算法对这些数据直接建立预测模型;最后,使用Graphviz工具将模型可视化。本文直接展示了这两种相似疾病的主要病症及其关联,为医生和病人及时区分感冒和流感并加以治疗提供了有效的帮助。