摘要
本发明具体涉及一种对含噪声点的实时数据流进行聚类和聚类边界界定的方法。其方案是:更新数据点X能映射到的网格g的密度;将密度大于或等于密度阈值densityThreshold(t)的网格g标记为高密度网格gh;将相邻的高密度网格gh或与高密度网格gh相邻的大于相似阈值的低密度网格gl’标记为聚类网格ggrid;所有聚类网格ggrid形成聚类;若聚类网格ggrid有相邻的未被聚类的网格gl”或聚类网格ggrid是位于网格空间边缘,则标记为聚类边界网格gboundary,所有聚类边界网格gboundary构成了聚类的边界;输出所有聚类和聚类边界;计算下一次聚类请求时刻tnext;当数据流到达时刻tnext时循环上述步骤,直到数据流D结束。本发明具有聚类效率高和边界界定效果好的优点。
- 单位