摘要
本文基于商业银行客户信贷记录数据集,通过运用拉普拉斯分层模型对客户的信用风险进行预测研究。利用客户群体存在差异化的特点,采用XGBoost机器学习算法来选择分层特征以及结合多元特征的组合形式来预测客户的违约情况。在不同分层特征结构下依次对比拉普拉斯分层模型、单独模型、共同模型和随机森林四个模型的预测效果,并建立模拟数据集来对拉普拉斯分层模型的性能进行验证。研究发现:(1)拉普拉斯分层模型的预测精度是最高的,预测性能具有稳定性;(2)本文数据集所适用的最佳分层特征是贷款金额、年龄和婚姻;(3)分层特征的选择和数量会依据不同数据而产生相应变化,并非一成不变。结合本文的研究思路和结果,以期为商业银行在客户信用风险评估实践中提供新的思考和建议。
-
单位山东劳动职业技术学院