摘要

医疗诊断与预测因数据量太大而需要流式存储,使得频繁项集挖掘出现耗时大,效率低下等问题。以解决这些问题为目的,研究了一种改进的基于大规模数据流的频繁项集挖掘方法,即增量式频繁项集挖掘方法。文章的重要结果是,该方法可结合历史数据与当前数据簇,快速求出近似全局支持度,并找出全局频繁项集集合。将该方法应用于Apriori算法上,通过实验得出了该增量式Apriori方法具有高效率的结论。

全文