摘要

互联网环境下的数据信息量日趋增多,增加了数据挖掘的难度。为了更好地对数据信息进行挖掘和提取,可以引入机器学习的技术和方法,构建基于机器学习的K-means聚类算法和数据预处理相结合的框架。本文以校园一卡通消费数据为研究对象,结合数据信息的特征和规律,对数据信息进行脱敏处理、清洗、规约和集成等操作,进一步对数据进行整合和优化,较好地实现数据挖掘价值的最大化。

  • 单位
    福州墨尔本理工职业学院