摘要
本文利用Python、Excel等分析软件,在UCI credit card数据集上进行集成模型训练与Stacking模型融合构建,使用SMOTE+tomeklink综合采样法来处理非平衡数据,从而得到平衡且规范的样本数据。在实证研究上,本文依次选择逻辑回归、K近邻、神经网络、随机森林、LightGBM、XGBoost、Adaboost、CatBoost,利用Stacking算法将上述模型分三种情况进行模型融合,评估其在上述数据集上的预测效果。结果显示对于UCI credit card数据集而言,将随机森林、XGBoost、Adaboost、K近邻(KNN)、神经网络这五个模型作为基学习器,以逻辑回归模型作为第二层学习器建立的Stacking算法模型效果最好,因此利用Stacking算法堆叠融合构建的信用贷款违约风险预测模型具有优异的分类性能,并具有较强的可行性。
- 单位