基于加权随机森林的信用卡欺诈检测应用与研究

作者:张艺豪; 盛丹红; 李丽芳; 翟丹丹
来源:电脑编程技巧与维护, 2021, (04): 111-117.
DOI:10.16184/j.cnki.comprg.2021.04.040

摘要

随机森林为集合算法中最为经典的模型之一,利用多棵并行独立的决策树投票分类。随机森林使用有放回采样方法,随机采样若干个样本集合,针对这些样本集合构造若干个决策树。由于采样过程和决策树属性选择具有随机性,随机森林较好地解决了决策树的过拟合问题。不过随机森林算法中每颗决策树都是一样的权重,这显然不合理。包外误差作为衡量模型泛化误差的指标,利用包外误差赋予每颗决策树不一样的权重解决信用卡欺诈问题。经实验证明,提出的算法精确度提高,是更为有效的算法。