一种改进的自适应网格划分的分布式聚类算法

作者:蔡莉; 王浩宇; 周君; 何婧*; 刘俊晖
来源:小型微型计算机系统, 2023, 44(04): 731-736.
DOI:10.20009/j.cnki.21-1106/tp.2021-0619

摘要

在众多聚类算法中,基于网格划分思想的聚类算法是较为常用的算法类型之一,但现有的算法对于处理海量高维数据而言,会存在以下两个问题:一是聚类结果的准确率较低;二是算法耗时较长.为了解决现有算法的不适应性,该文在网格聚类算法的基础上结合降维技术、自适应网格划分、相对熵和分布式计算,提出了一种改进的自适应网格划分的分布式聚类算法(AMCBS),可以较好解决以上问题.经实验证明,该算法对于D31标准数据集、UCI数据集、人脸图片数据集和GitHub文本数据集等的效果均优于常见的聚类算法,具有较好的准确率和较高的运行效率.

全文