摘要
K-means算法是通过计算数据与聚类中心的距离来更新聚类中心的一种无监督的机器学习算法,在距离已知的情况下,BIRCH算法是一种典型的基于距离特征数的类别判断对数据信息进行汇总的方法,是一种平衡迭代规约和聚类的方法。论文结合K-means算法和BIRCH算法优缺点,在数据处理中用K-means处理对离群点干扰较大的数据,BIRCH处理时间复杂度较低的数据的原则构建核心树;以子类的初始中点为叶节点,以欧式距离为依据判断节点间的相似性,并对判别类别进行划分得到核心数据,BIRCH以K类的中点为核心树的叶节点,以叶节点为基础构造核心树,并对核心树的各种特征数据进行完善。实验证明改进K-means算法比原始K-means算法在养老服务护理推荐时用时更短。
-
单位电子信息工程学院; 河南工业职业技术学院