摘要

信用评分技术是现代金融机构预测贷款违约风险的主要方法,目前银行、互联网金融平台等金融机构在原来关注违约概率的基础上,提出了估计不同时刻的违约风险及贷款寿命分布等更高要求。因此,常规基于分类的信用评分方法不再适用,有必要探索基于生存分析的信用评分模型。本研究将随机生存森林的方法应用于信用大数据的风险预测,并分别将其与Cox比例风险模型、基于Lasso惩罚的Cox模型、基于岭估计惩罚的Cox模型进行比较分析,不同情形的实验结果显示,随机生存森林的预测效果最好。此外,我们还借助随机生存森林对变量进行重要性评分排序并予以解释。本研究对提高贷款机构的决策能力和水平,具有一定的参考意义。

全文