摘要

作为数据挖掘的一个新兴方向,研究人员在时间序列领域提出了用于挖掘相对次序相同的保序模式。尽管现有的保序模式挖掘算法可以有效地找出全部的频繁模式,但在当用户仅对某个特定的模式及其为前缀的模式较为感兴趣时,现有的挖掘算法效率过于低下。为了解决上述问题,本文提出了一种共生保序模式挖掘算法,用于挖掘出以给定模式为前缀的共生保序模式。该算法包括融合准备和计算超模式的支持度两个主要部分,其中,融合准备分为四个步骤:获取模式p的后缀保序模式,计算后缀保序模式的出现,前向验证模式p的出现,后向查找所有可融合模式的出现;在计算超模式的支持度时,提出一种剪枝策略,使得候选模式的个数进一步减少。在真实数据集上,实验结果验证了本文算法的高效性。