摘要

文章提出一种基于SmoteTomek采样方法和GBDT决策树算法的违约风险预测模型,并以国外P2P平台的海量真实交易数据为例进行了实证分析。方法包括六个步骤:数据预处理、可视化探索性分析、特征选择、模型训练、超参数选择和模型评估。实验结果表明文章采用的SmoteTomek-GBDT算法相比较其他方法(Logistic、Adaboost、XGboost)更适用于不平衡数据,且获得了更高的正确率。

  • 单位
    阜阳师范大学