基于组合学习的个人信用风险评估模型研究

作者:牛晓健; 凌飞
来源:复旦学报(自然科学版), 2021, 60(06): 703-719.
DOI:10.15943/j.cnki.fdxb-jns.2021.06.003

摘要

基于美国最大的P2P平台Lending Club 2019年的个人借款数据,尝试将深度学习方法引入个人信用风险评估领域,与集成学习构建串联结构的组合学习模型.具体做法是将深度神经网络的隐藏层作为"特征提取器",将原始变量转换为更高层次的抽象特征后输入随机森林、XGBoost、LightGBM和CatBoost 4种集成学习模型进行训练.研究结果表明,4种集成学习模型之间差距不大,随机森林表现最好,LightGBM训练速度最快;稀疏自编码器相比深度神经网络和主成分分析更适合作为集成学习的特征提取器,尤其是对Boosting类模型效果的提升更为明显.