通过对学生生活、学习、活动等行为特征数据分析挖掘,采用改良的K-means聚类算法建立学生表现类别模型,实现根据学生表现数据将学生进行分类。选择学生"德育成绩、体育成绩、智育成绩、竞赛等级、贫困生等级、奖学金等级"6个属性数据作为特征评价指标。针对高校学生管理系统类别放多造成的数据重复、缺失、存储类型不一致等问题,对数据清洗、集成和变换数据存储格式,得到满足K-means算法的输入数据。