摘要
现有的时间序列相似度量方法难以兼顾微观形状与宏观结构两方面的相似性,同时存在易受异常值、位移拉伸影响等问题。针对上述情况,提出具有更高精度与鲁棒性,更小时间复杂度的优化DTW与面积距离结合的算法。首先在DTW中引入分段聚合与相似度阈值,前者能降低数据维度,减少DTW的计算量,后者能够过滤数据中的异常值,提高算法的鲁棒性;其次提出面积距离度量,描述整体序列中的起伏变化,发现序列的整体相似性;从微观形状与宏观结构两方面表述时序序列,能够进一步提升算法精度。在UCR的30个不同数据集上进行的实验表明,该方法与现有相似度量方法相比,具有更高的精度与鲁棒性。
- 单位