摘要

无重叠条件序列模式挖掘是一种带间隙约束的序列模式挖掘方法,能够有效地克服当前此类挖掘中的问题.但是当前的方法仅仅用于挖掘频繁模式,为了高效地挖掘最为频繁的k种无重叠序列模式,本文提出了"Gfp-tree(Gain-frequence-patterntree)"这一数据结构,构建了无重叠条件下完备的Top-k模式挖掘算法.该算法基于Apriori性质,不预先设定支持度阈值,而是在挖掘过程中生成并动态调整,直到挖掘过程结束.有效减少了候选模式的生成数量,节约了运行时间.实验表明,该算法具有较高的效率.