基于方形邻域的网格密度聚类算法

作者:兰红*; 朱合隆
来源:计算机应用研究, 2020, 37(06): 1735-1740.
DOI:10.19734/j.issn.1001-3695.2018.12.0883

摘要

针对大数据聚类低效的问题,提出一种方形邻域快速网格密度聚类算法(square-neighborhood and gridbased DBSCAN,SGBSCAN)。首先给出方形邻域密度聚类定义,利用方形邻域代替圆形邻域,降低时间复杂度;其次提出方形邻域密度聚类的grid概念,快速确定高密度区域内核心点与数据点之间的密度关系;最后提出grid密度簇,利用网格之间的关系加快密度簇的形成。算法应用于16个数据集,分别与已有文献算法进行对比,结果表明所提算法在聚类效率方面有显著提升,数据量越大算法效率提升越明显,且该算法适用于多维数据的聚类。

全文