基于外点检测的加权k-means算法

作者:胡豪杰; 陈辉; 穆婷婷; 姚敏立; 何芳*; 张峰干
来源:南京师范大学学报(工程技术版), 2022, 22(01): 75-80.

摘要

为解决k-means聚类算法中异常样本点破坏数据分布,致使簇中心发生较大偏差的问题,通过计算样本点与潜在簇中心的距离赋予样本点不同的权重,降低外点对数据分布的影响,并通过对权重向量施加?0-norm范数在聚类模型中自适应移除外点.采用交替最小化优化算法求解模型,在人工合成数据集和真实数据集上的实验表明,所提模型能有效降低外点对聚类的影响,可得到更有效的聚类效果.

  • 单位
    中国航天科技集团有限公司