摘要

基于符号表示的时间序列分类方法是时间序列数据挖掘的关键技术。大部分现有方法主要针对单个时间序列样本进行符号表示,没有考虑样本间的近邻关系对符号化分类的影响。对此提出一种基于正交局部保持映射(Orthogonal Locality Preserving Projection,OLPP)的时间序列符号表示方法。使用OLPP对原始数据集进行维数约减,利用信息增益寻找维数约减后数据的最佳符号投影区间,采用多重系数分箱技术(Multiple Coefficient Binning,MCB)将降维后数据表示成符号序列。该算法在20个时间序列数据集上的分类效果好于已有方法,有效利用样本间的近邻关系能够显著提高算法的分类性能。

  • 单位
    河北经贸大学