摘要

针对大学生体质异常数据提取内存开销大、覆盖率低等问题,提出基于聚类分析的大学生体质异常数据提取方法。通过Relief算法调整数据特征距离,筛选出异常数据的相关特征,采用K-means算法聚类分析异常数据,将单条信息汇集为一类信息,改进K-means算法的K值选取,实现大学生异常数据精准提取。经验证,该方法具有较高的覆盖率,拥有较小的内存开销与时间开销,能够有效降低异常数据提取过程中内存与时间消耗。