一种结合自适应近邻与密度峰值的加权模糊聚类算法

作者:张春昊; 解滨*; 张喜梅; 徐童童
来源:小型微型计算机系统, 2023, 44(09): 1974-1982.
DOI:10.20009/j.cnki.21-1106/TP.2021-0988

摘要

传统的模糊C均值(fuzzy c-means, FCM)算法的聚类结果容易受到随机选取初始聚类中心的影响,且在聚类过程中忽视了样本的不同特征和样本本身的重要程度对聚类结果产生的影响.针对这一系列问题,提出了一种结合自适应近邻与密度峰值的基于信息熵加权的模糊聚类算法(ANNDP-WFCM).首先,结合自适应近邻的密度峰值算法(ANNDP)实现初始聚类中心的自动搜索,针对不同规模、不同结构的数据集可以自适应的找到每个样本的近邻集合,根据近邻信息定义样本的局部密度,搜索和发现数据集中的密度峰值点作为初始聚类中心.然后通过信息熵赋权区分不同特征在聚类过程中的重要程度,同时利用样本之间距离的倒数对样本本身进行加权,重新定义目标函数中的模糊聚类中心.最后针对目标函数,利用拉格朗日乘子法交替寻优,对最终的隶属度矩阵去模糊化得到聚类结果.通过不同公共数据集的对比实验,验证了ANNDP-WFCM算法具有较少的迭代次数和较高的聚类准确性.

全文