摘要

借贷数据规模大、维度复杂和极度不平衡等特性致使借贷预测的精度一直难以提升。为此,设计量化借贷期望损失值作为代价敏感项来优化集成模型的借贷预测算法,实现消除比例失衡的训练样本对预测模型的影响;提出基于代价敏感集成学习的借贷预测算法——ES-XGB和ES-LGB。其核心是改进了近年来表现优异的集成算法XGBoost和LightGBM,将优化后损失项加入模型的迭代学习过程中,以达到提升整体预测精度和提高违约类检出的目的。使用Lending Club平台提供的数据来做数值实验,证明所提出的算法模型在借贷预测中表现最佳。