摘要
针对目前信用卡经营中的信用风险问题,在集成学习的基础上,试图对两种算法展开融合改进,提出了基于引导聚集算法(Bagging算法)集成迁移学习框架(TrAdaBoost)的预测模型,发挥Bagging与提升算法(Boosting)两种算法各自的优势,提升集成模型的泛化性能与预测精度,并使用SMOTETomek混合采样(合成少数类过采样加相反类样本配对技术)算法平衡数据集,进而期望在信用风险预测领域开辟新途径。通过阿里云天池网上公开的信用违约数据集的实验结果表明,融合后的模型AUC值为0.9258,其他指标值相较于其他模型都有所提升,表明该模型对信用违约的预测效果较好。
- 单位