基于随机森林的学生画像特征选择方法

作者:杨长春; 徐筱*; 宦娟; 田迎春; 经德林
来源:计算机工程与设计, 2019, 40(10): 2827-2834.
DOI:10.16208/j.issn1000-7024.2019.10.016

摘要

针对构建智慧校园学生画像的数据缺失与高维特征问题,引入外部数据弥补缺失的数据,辅助用户建模,提出一种基于随机森林的双向特征选择算法(RFBFS)解决高维特征问题。使用随机森林算法的变量重要性作为特征与目标变量之间相关关系的度量标准;运用分类准确性检验保留下来的特征子集是否达到最优;RFBFS采用双向搜索策略使算法的分类精度得到提升。对比实验结果表明,RFBFS是一个稳定且高效的算法,能有效降低特征空间维度,实现特征的有效分类。

全文