摘要

噪声是影响聚类结果的最重要的因素之一,现有的模糊聚类算法主要通过对隶属度约束进行松弛的方式来降低噪声样本的影响。这种方式仍然存在两个基本问题需要解决:第一,如何评估一个样本是噪声的可能性;第二,如何在抑制噪声样本影响力的同时,保留正常样本的作用力。针对这两问题,该文提出了基于自适应松弛的鲁棒模糊C均值聚类算法(AR-RFCM)。新模型基于K最近邻的方式(KNN)来估计样本的可靠性,自适应地调整松弛参数,从而实现在降低噪声样本影响力的同时,保留可靠样本的作用力。此外,AR-RFCM利用了C均值聚类模型中隶属度的稀疏性来提高可靠样本的作用力,从而提高数据簇的内聚程度,进而降低噪声样本的影响。实验表明,AR-RFCM不仅在处理噪声样本时具有良好的鲁棒性,同时在25个UCI数据集实验中,分类正确率(兰德指数)平均高于FCM算法7.7864%。