摘要
为了研究影响学生成绩的因素,更好地帮助学生学习,教师进行教学和学校管理。利用数据挖掘(DataMining)中机器学习决策树(DecisionTree)算法对原始数据选取,特征分类和数据预处理归一化。标签编码(LabelEcode)可以在有效降低数据维度的同时保证分类精度量化。本文的数据选自国外某一个高中年级的相关数据,包括学生在校的期末考试的成绩,家庭背景及在校学习行为等数据。通过sklearn,seaborn和matplotlib等软件来实现决策树算法,生成离线模型和学业指标评估报告,来更好完成对学生成绩预测影响因素的研究。
- 单位