摘要

为了科学、高效地挖掘出隐含在海量医疗数据流中有价值的信息,本文提出了基于滑动窗口模型的医疗数据流加权频繁模式挖掘算法(WSW-MFP)。首先,该算法利用字节序列表示法构建加权频繁模式树(PR-Tree),用于存储医疗数据流中动态变化的候选加权频繁模式;其次,随着窗口不断滑动实时更新PR-Tree各结点的频繁项计数值;最后,递归调用、逐层迭代得出医疗数据流中的加权频繁模式。实验结果表明,算法既降低了内存空间的占用率,又提高了挖掘效率,能够有效减少业务高峰期对数据库性能的影响。因此,WSW-MFP算法能够有效地应用于医疗数据挖掘,为医院临床诊疗、科研和医疗质量管理提供决策依据。