摘要

支持向量机(Support Vector Machine,SVM)是一种公认有效的分类算法,在处理小规模二分类问题时表现出较好的性能,但在处理非平衡数据的分类问题时能力有限,针对非平衡数据的分类问题,文章提出一种基于划分融合的非平衡SVM算法(Imbalanced SVM Algorithm based Division Fusion,DFISVM)。首先提取多类样本中的部分代表点与少类样本一起加入训练集进行训练得到初始分类器,再依次利用划分融合的方法选择最优的增量样本,加入训练集进行训练,依次更新得到最优分类器。通过提取多类样本中部分样本参与训练,减少了实际参加训练的多类样本的数据规模,又通过划分融合的方法使提取的样本更能代表原始数据,从而提高了非平衡数据分类的性能。在UCI标准数据集上的实验结果表明,新算法能有效提高非平衡数据的分类性能。

  • 单位
    太原学院

全文