摘要
集成学习算法是机器学习中一类重要的算法。相比于简单的机器学习算法,集成学习算法能适应日益复杂的应用场景,尤其是在车险欺诈日益猖獗的当下。在此基于随机森林、极度梯度提升(Xgboost)、轻量级梯度提升机器学习(LightGBM)、自适应提升算法(Adaboost) 4种集成学习模型构建车险反欺诈系统,在一系列指标下评价4种模型的优劣,并且综合多种模型评估特征重要性,在数据量日益庞大的情况下选出识别车险欺诈最重要的特征数据,提高识别车险欺诈的工作效率。
-
单位南京审计大学