摘要
为提高模糊支持向量机在非平衡数据下的性能,提出基于信息熵的改进模糊支持向量机。综合考虑输入样本的不确定性和输入样本到类中心的距离,构造基于信息熵和基于类中心的模糊隶属度函数,将二者融合成一种新的模糊隶属度函数;为更有效地对非平衡数据集进行分类,将非平衡调节因子加入到模糊支持向量机模型中。实验数据集来自两部分,分别为非平衡公共数据集和脑卒中TCD数据集,基于公共数据集的实验结果表明,该方法能够有效提升分类性能,其中Se最高提升了71.43%,基于脑卒中TCD数据集实验结果表明,对正常人与斑块患者构成的非平衡数据集来说,在非平衡率为12.8时,较已有FSVM-CIL方法,本文方法可使其Gm提升4.94%。
-
单位山西省人民医院; 太原理工大学; 神经内科