摘要

以完全无监督的方式从较长的时间序列中提取出先前未知,重复出现的相似子序列,此问题称为模体发现问题。针对该问题,提出了基于Matrix Profile的多条时间序列模体发现算法TSMPM。算法共分为两个阶段,第一阶段从Matrix Profile结构中提取motif seeds,即彼此最相似的子序列,作为查询序列。第二阶段使用超快速的时间序列相似性搜索算法扫描整条时间序列得到Distance Profile,设定相似性阈值,从生成的Distance Profile结构中获得所有可能的时间序列模体。在公开的基准时间序列数据集上进行实验,实验表明,所提出的算法能够在较短的时间内发现多条模体,是质量和效率相平衡的算法。

全文