摘要
随着经济的快速发展,金融机构面临着借款人信用违约的巨大挑战,国内P2P网贷行业历经多次监管整治后,金融机构越来越重视线上风控问题。针对P2P个人信贷业务中的违约预测问题,本文使用随机森林和Easy Ensemble两种集成学习方法,在公开的Lending Club数据集上进行测试,实验结果显示,随机森林比传统的Logistic回归模型预测准确率更高,Easy Ensemble方法解决类别不平衡问题比传统的欠采样方法更好。本研究为P2P借贷平台提供合适的机器学习模型,以正确评估借款人信用,实现对借款人违约概率的有效估测,对我国P2P网贷平台的违约风险预警具有参考价值。
- 单位