摘要

文章基于临床电子病历中医疗实体的共现关系,先构建疾病-症状二分网络,再利用SimRank++算法和协同过滤算法共同实现疾病实体和症状实体之间相关关系的度量,最后应用Spark分布式平台来适应大量数据的高计算强度,以提高计算效率。实验表明,本文方法可以有效度量疾病实体和症状实体之间的相关程度,可为临床医生的疾病诊断提供帮助。