为了对学生一卡通数据、教务数据、图书馆数据进行相关性研究,挖掘这些数据的隐藏价值,文中提出基于聚类算法的学生消费数据与成绩数据的关联性分析。首先对原始数据进行预处理,使用Cubic插值法对缺失值进行插补处理,并采用主成分分析法将原始数据降至一维。然后通过改进的聚类算法K-Means++算法对降维后的数据进行了初步的聚类,并对不同k值取得的聚类结果进行性能比较,最后对8287个实验样本进行关联性计算。所得出实验的结果可以为学校提供决策帮助。