摘要
高维数据分类在统计分析中具有重要意义.然而分类方法由于所依赖的度量距离仍面临噪声敏感性强、计算量大及精度低等问题而导致分类效果不佳.针对高维时序相似性度量的精度及效率的不足,基于欧式距离提出一种改进的相似性度量方法并用于提升分类效果.首先,采用离散小波变换(DWT)对序列进行分解重构,提出局部高频DWT方法以达到降维消噪的目的.然后,在距离函数的基础上结合波幅和秩相关系数的概念,从相对偏差与波动趋势一致性角度进行改进.采用1-最近邻技术(1-NN),比较所提方法与动态时间规整(DTW)、FastDTW、最长公共子序列(LCSS)度量方法的性能.基于40个UCR时间序列数据集的实验结果表明,相对于DTW, FastDTW, LCSS度量方法,所提方法下的1-NN分类准确率更具有优越性,置信度不低于85%,同时证实了所提相似性搜索方法在准确率及速度上均得到显著改善.该结论丰富了相似性度量理论基础,对数据挖掘技术在智能系统管理、时间序列统计上的应用具有重要的参考价值.
- 单位