摘要

针对贫困生数据类别不平衡、特征复杂等特点,提出ADA-MDF贫困生认定模型。首先利用ADASYN自适应过采样方法,通过合成少数类别样本,改善贫困生数据不平衡的问题,同时结合深度森林算法,拓展了其级联结构的多样性,加强模型的表征学习能力。在相同数据下,与DF、RF、XGBoost、LGB、GBDT模型进行了10次对比实验,结果表明,该模型较其他模型综合性能更为优越,平均准确率达到93.11%,与学校目前应用的模型相比,准确率提高了8.81%。综上,ADA-MDF贫困生认定模型是有效可行的,在高校资助工作中具有良好的应用前景。