摘要

PAM算法是K-中心点算法中最具代表性的算法。在此算法中,相似性度量的计算方法仅假设数据对象属性之间是独立同分布,采用欧几里得距离公式来进行计算。但现实数据集中,数据对象属性之间是非独立同分布的,即它们之间都是相关联的。因此,本文针对数值型数据,在PAM算法中引入了数值型数据非独立同分布计算公式,将原本的皮尔森相关系数替换为斯皮尔曼等级相关系数,并进行了实验验证。结果显示,数值型数据非独立同分布计算公式的引入很好地提高了PAM算法的聚类精度。

全文