摘要

网络流量数据具有明显的时序特征.针对基于机器学习的网络流量分类方法中,传统机器学习依赖人工设计特征以及深度学习无法兼顾特征自主生成与特征可解释性等问题,采用时序分析方法,提出了一种基于时序特征的网络流量分类方法.首先,将网络流量数据预处理为时序数据;然后,应用Shapelet-Transform算法来自主学习网络流量的时序特征,并改写Shapelet-Transform算法的计算逻辑,且将其部署在GPU上,使其可以快速处理大规模网络流量数据集;最后,结合支持向量机分类算法构造了最优分类模型来实现网络流量分类.公开数据集实验测试结果表明,所提方法可以实现网络流量时序特征的自主学习,并达到与深度学习接近的分类精度,同时给出深度学习方法无法提供的可解释性分类依据.