摘要
基于某“双一流”建设大学本科生食堂消费大数据、助学金发放的行政数据以及家庭基本信息的调查数据,利用统计学习模型对基于食堂消费大数据识别家庭经济困难学生的精准性进行了估计。研究发现:食堂消费大数据对家庭经济困难学生的识别精准率仅能达到约60%,采用更精细的消费时间序列数据可以将识别精准率提高到约65%,进一步结合家庭基本信息的问卷调查数据则可以将识别精准率提高到约92%。相比传统的逻辑回归,采用提升树和支持向量机等判别模型可以提高模型对家庭经济困难学生的识别能力。本文的研究发现说明,仅仅利用食堂消费数据作为补助依据的精准度仍有待提高,应将食堂消费数据与学生家庭基本信息数据相结合来提升资助精准度。
- 单位