基于SHAP值惩罚特征的集成分类方法研究

曹玉茹; 高洋洋

doi:10.13546/j.cnki.tjyjc.2023.06.004

摘要

在回归问题中，惩罚特征即正则化是特征处理的常用方式。但在集成分类问题中，惩罚特征以改善训练效果的研究较少。文章提出一种基于GBDT模型训练的SHAP值对各样本特征惩罚加权，进而提升分类精度的集成模型；其中，对于测试样本的SHAP值估计，通过其与训练集的样本距离权重结合训练集的SHAP矩阵近似得到。实验结果表明：选择GBDT＿SHAP值惩罚特征后，模型的预测精度均有显著提升，验证了该算法的有效性。以GBDT＿SHAP＿GBDT模型为例，其在多组经典数据集上的分类效果良好，且在不平衡数据集上性能突出；若干组仿真实验表明，该方法能使模型快速达到较优且较为稳定的拟合效果，鲁棒性较强。

单位
上海对外经贸大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 16:49

基于SHAP值惩罚特征的集成分类方法研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友