摘要
动态时间规整(Dynamic Time Warping,DTW)是序列比对的经典方法,可以计算动态对应的序列间距的最小值.该文从一个新颖的角度重构了DTW的理论框架,提出了DTW的可加保优和始发保优两条特性.并依赖始发保优的算法拓展能力,将DTW由普通距离延拓到平均距离、Pearson相关系数、和Tanimoto相似系数的动态优化的计算模式,建立了一系列序列比对的新方法.动态计算的Pearson相关系数和Tanimoto相似系数较常规Pearson系数和Tanimoto系数分别更能捕捉长度一致的序列之间的真实相似性.对该系列方法以计算效率最高的动态平均距离为代表作内置,进行大量标注数据集的层次聚类比较测试,证实相较于传统DTW算法在基于序列比对的聚类准确率(平均F值)上至少有35个百分点的提高.且使用k NN作序列匹配分类实验也证实了动态平均距离优于传统DTW距离.
- 单位