基于短序列分组和拼接策略的子序列快速查询算法

作者:范纯龙; 王靖云; 滕一平; 丁国辉
来源:计算机应用研究, 2020, 37(06): 1702-1706+1749.
DOI:10.19734/j.issn.1001-3695.2018.11.0866

摘要

子序列查询技术在金融、商业、医疗等领域均有重要应用,但因DTW等相似性比对算法的时间复杂度较高,子序列长度对检索时间影响很大,限制了数据集上长子序列检索的效率。针对这一问题提出一种子序列快速查询算法。首先对数据集中特定长度下所有子序列进行分组并标记出代表性子序列;然后在查询时将查询序列切分成定长的小段序列,并用DTW算法确定与小段序列相似的代表子序列候选集;最后对候选集进行序列拼接,获取到查询结果序列。实验表明新算法效率较典型算法提高约10倍。

全文