一种高效的阴阳k-Means聚类算法

作者:李长明; 张红臣*; 王超; 李晓光; 陆洋; 钱超越
来源:吉林大学学报(理学版), 2021, 59(06): 1455-1460.
DOI:10.13413/j.cnki.jdxblxb.2020406

摘要

针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题,提出一种高效阴阳k-means聚类算法.该算法根据数据相似性将原始数据进行逐层分解,并建立满m叉树结构存储各层数据,以树结构各叶子节点中存储的数据信息建立加权数据,运行加权阴阳k-means算法得到收敛中心.在原始数据中以加权数据收敛中心为初始化条件运行传统阴阳k-means算法进一步优化目标函数值.在5组UCI数据集上与k-means、传统阴阳k-means及另外两种加速算法进行对比实验,实验结果表明,该算法具有较高的加速比,且求解精度与传统阴阳k-means聚类基本相同.