摘要
在解决类别不平衡问题的过程中,传统分类模型往往偏向对大类别样本的学习,影响模型分类效果。基于此,文章从数据采样、模型选择2方面入手,给出代价敏感神经网络集成(cost-sensitive neural network ensemble, CSNN_Ensemble)模型。首先通过随机下采样,得到多组训练数据集;其次对每组训练数据集训练BP神经网络,并结合代价矩阵构造多个代价敏感神经网络;最后以代价敏感神经网络为基学习器构造并行集成模型,并以投票的方式进行最终决策。实验结果表明,该模型在F1值、AUC值和期望总体代价3种性能方面表现优越,并具有一定的鲁棒性。
-
单位合肥工业大学; 数学学院