摘要

针对现有的向量空间模型在电子病历聚类时忽略语义关系的不足,提出了一种基于关联关系的电子病历聚类方法:从海量的电子病历中分析特征语的同现概率,根据关联规则分析特征词语的关联关系,挖掘电子病历特征词之间的隐含语义关系,表达电子病历向量,结果表明,基于关联关系的电子病历聚类更为准确。