摘要

DBSCAN已被广泛应用到计算机视觉处理及图像处理中的数据压缩和信息检索等领域。论文针对DBSCAN算法在数据分布不均匀时,使用全局阈值难以识别数据集中所有簇的问题,提出基于网格划分和密度比聚类的DBSCAN算法。该算法首先通过自适应多分辨率的网格划分思想把数据划分到多个网格空间中,利用所划分的网格加快查找到类簇的峰值和低谷;再利用密度估计来计算密度,从而快速确定全局阈值,并使用该全局阈值对数据集进行有效识别。通过对比实验表明,所提算法能够有效对密度不均匀的数据进行聚类,并具有较高的效率。