摘要

随着互联网金融行业的迅速发展,面对海量数据,传统信用风险评估面临着挑战。信用评估中样本类别不均衡,且特征冗余度高,成为影响目前评估分类精度的关键因素。为了解决以上问题,提出了一种基于灰狼优化算法同步处理样本欠采样与特征选择的方法。该方法将分类器的性能作为灰狼优化算法的启发式信息,然后进行智能搜索,以得到最优样本与特征集的组合,并在原始灰狼算法中引入禁忌表策略,避免算法陷入局部最优。实验表明,该方法相较于其他方法有较大改进,在不同数据集上的表现均证明了该方法能够有效解决样本不均衡问题,降低特征空间维度,同时提高分类准确率。其在信用风险评估上相比原始数据准确率提高了3%左右,证实了该方法在信用评估领域的适用性与优越性。

  • 单位
    嵌入式系统与服务计算教育部重点实验室; 同济大学