摘要

构建相对贫困人口识别体系和监测预警机制,增强监测预警机制的针对性和有效性,是相对贫困长效治理的必要条件。由于相对贫困识别的理论和算法研究相对较少,本文提出了一种可解释的相对贫困识别与预警模型,即IEWRP模型。该模型以2018~2020年中国家庭追踪调查问卷(CFPS2018)数据为研究对象,运用方差分析技术对原始数据集进行特征选择。然后通过Gradient Boosting构建IEWRP模型,并与CART Tree、XGBoost、LightGBM等机器学习算法进行实验对比。最后,结合SHapley Additive exPlanation模型对影响相对贫困识别的相关特征的必要性和重要度进行了可解释性分析,识别出影响相对贫困识别的主要特征。实验结果显示,IEWRP模型的预测准确率、精确率、召回率、F1值、AUC(Area Under Curve)值分别为89.4%、90.6%、95.3%、92.9%、0.95,在准确率、精确率、F1值、AUC值四个方面分别提升了0.15%、0.28%、0.09%、0.23%。

  • 单位
    太原师范学院