摘要
文章探讨了相关系数与距离相关系数的区别与联系,利用距离相关系数度量样本间相似度,进而度量样本类的结构;将样本间欧氏距离转化为样本间相似度,给出两种自适应转化方法,比较研究不同转化方法对谱聚类的影响。然后基于上述样本间相似度进行谱聚类,并以三个典型数据集进行数值实验。数值模拟结果显示:距离相关系数谱聚类算法简单有效,从一个新的视角度量样本间相似度,可将特征取值相关性强的样本聚为一类,各特征取值数量级一致;距离倒数谱聚类不依赖参数,简单有效;全局谱聚类与自适应谱聚类依赖未知参数且受影响较大,但参数选择没有一致做法,具有主观性;相对而言,稳定自适应谱聚类对参数取值范围的适应性更强。
- 单位