摘要

指数分布的数据特征存在广泛,在风险预警中,正负样本是非均衡的,传统的算法不能满足该类数据特征选择的效率和准确率。为了提高指数分布的非均衡数据特征选择的效率和准确率,文章首先改进了SMOTE,消除过拟合问题,其次采用皮尔逊相关性,计算特征的相关度,选出最优特征子集,最后给出了具体算法。实验证明,该方法能够提高指数分布的非均衡数据特征选择的效率和准确率,增强了预警模型的性能。

全文