摘要
教育信息化的快速发展,推动了在线学习和混合式学习的普及,学习风险预警研究受到越来越多的关注,然而传统的预警算法都是针对平衡数据集设计,而教育数据集属于高度不平衡数据集,使得这些算法识别风险学生的难度增加。为了解决这个问题,提出一种基于变分自编码器和随机森林的混合式学习风险预警框架(VRFRisk)。框架使用变分自编码器对不平衡数据进行数据平衡处理,利用随机森林算法进行分类。在给定的数据集上的实验结果表明,VRFRisk可以有效处理不平衡的教育数据集,并在召回率和F分数方面提供比基线方法更好、更稳定的预测结果。
- 单位