摘要

在大数据背景下,信用机构拥有越来越多维度的贷款人数据,高维数据给构建信用风险评价模型带来了诸多难题。传统意义的信用风险评价模型日渐失效。利用中国银联信用数据作为研究样本,基于Lasso-RF两阶段特征选择,选取逻辑回归、支持向量机、随机森林、决策树等常用的信用评估分类算法,分别从准确率、精确率、召回率和F1值4个指标检验两阶段特征选择的有效性。实验结果表明:基于Lasso-RF两阶段特征选择方法较原始数据集在分类器的4个性能指标上均有所提升,证明了两阶段特征选择方法在个人信用风险评估上具有更好的分类效果。

  • 单位
    哈尔滨商业大学

全文