面向非平衡数据集分类的改进模糊支持向量机

作者:魏鑫; 张雪英*; 李凤莲; 胡风云; 贾文辉; 王超
来源:计算机工程与设计, 2019, 40(11): 3124-3199.
DOI:10.16208/j.issn1000-7024.2019.11.011

摘要

为提高模糊支持向量机在非平衡数据下的性能,提出基于信息熵的改进模糊支持向量机。综合考虑输入样本的不确定性和输入样本到类中心的距离,构造基于信息熵和基于类中心的模糊隶属度函数,将二者融合成一种新的模糊隶属度函数;为更有效地对非平衡数据集进行分类,将非平衡调节因子加入到模糊支持向量机模型中。实验数据集来自两部分,分别为非平衡公共数据集和脑卒中TCD数据集,基于公共数据集的实验结果表明,该方法能够有效提升分类性能,其中Se最高提升了71.43%,基于脑卒中TCD数据集实验结果表明,对正常人与斑块患者构成的非平衡数据集来说,在非平衡率为12.8时,较已有FSVM-CIL方法,本文方法可使其Gm提升4.94%。