摘要

借鉴聚类思想引入基于支持向量数据描述(SVDD)的原理,建立P2P流量识别模型。该模型首先用主成分分析法(PCA)对训练集降维,然后用SVDD方法寻找包含大部分样本最小超球,保留各自支持向量样本点作为识别模型;然后计算测试样本距各球心距离,距离近者为其所属类别。该模型简单,适合P2P流量识别环境,克服了现有基于机器学习的流量识别方法在多类分类中模型复杂、数据不平衡等缺点。实验结果表明,该模型具有较高的分类精度和可靠性。

全文