摘要

为了降低因贷款者违约给金融机构带来的损失和风险,对贷款者的个人信用进行评估有着极其重要的意义.针对贷款数据集的不平衡和高维特征问题,结合集成学习中串联与并联结构的优点,提出基于多分类器串并联结构的个人信用评估模型.利用SMOTE算法平衡数据集正负样本个数、随机森林计算特征重要性并筛选特征,再在新数据集上训练K近邻、Logistic回归、决策树、支持向量机4个基分类器,将它们的预测概率采用简单平均法进行综合,这样就形成了随机森林与4个基分类器的串并联结构.通过在真实数据集上训练和测试,发现该模型在预测准确率和区分好坏样本上都有显著优势,具有一定的适用性.

全文