摘要

从信贷机构角度,无论是信用卡还是其他贷款业务都是风险业务;从借款人角度,机构可以减少信息不对称的影响做出准确判断为更多的人提供贷款,因此准确进行贷款违约风险预测具有重要意义。通过使用机器学习算法,采用Home Credit提供的数据作为样本,建立随机森林模型、逻辑回归模型、XGBoost模型和朴素贝叶斯模型进行对比实验。结果表明:除了两个外部数据源的标准化评分外,借款人收入、性别、抵押品以及贷款金额是影响模型预测的主要因素;年龄越大贷款违约风险越低;XGBoost模型在违约风险预测性能表现最优。