基于机器学习的高考信息与大学程序设计课程成绩相关性分析研究

作者:金城; 崔荣一; 赵亚慧*
来源:延边大学学报(自然科学版), 2020, 46(04): 366-370.
DOI:10.16379/j.cnki.issn.1004-4353.2020.04.014

摘要

为研究学生高考信息与计算机程序设计课程(C语言)成绩的相关性,提出了一种基于随机森林算法的相关性预测与分析模型.首先,对2014—2016年延边大学计算机科学与技术专业的学生相关数据进行了清洗和筛选,并将C语言考试成绩分成5类;其次,将学生的高考信息作为特征训练随机森林分类模型;最后,使用LIME解释性模型对影响随机森林的主要特征进行了相关性分析.实验结果表明,影响C语言成绩的主要特征为生源、总成绩、民族、数学和语文.该研究结果可有效识别不同学生学习成绩的主要相关因素,为教师针对不同学生群体设计合理教学模式提供参考依据.