摘要
为提高信用特征集与目标标签的相关性,降低特征之间的冗余性,采用Person相关系数、卡方、递归特征消除、Lasso回归和随机森林5种特征选择方法投票表决,构造新的特征子集;为进一步提升模型预测效果,选用Hyperband算法对RF、XGboost集成模型参数优化,优化之后的hp-RF、hp-XGboost在Loan数据集上进行五折交叉验证,实证具有更好的识别效果,并在P2P人人贷数据上进行了应用,为我国信用评估的构建提出了新的方式.
-
单位南京信息工程大学; 徐州工程学院