摘要
针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题,提出一种高效阴阳k-means聚类算法.该算法根据数据相似性将原始数据进行逐层分解,并建立满m叉树结构存储各层数据,以树结构各叶子节点中存储的数据信息建立加权数据,运行加权阴阳k-means算法得到收敛中心.在原始数据中以加权数据收敛中心为初始化条件运行传统阴阳k-means算法进一步优化目标函数值.在5组UCI数据集上与k-means、传统阴阳k-means及另外两种加速算法进行对比实验,实验结果表明,该算法具有较高的加速比,且求解精度与传统阴阳k-means聚类基本相同.
-
单位长春理工大学; 长春光华学院