摘要

数据流为连续快速到达的数据序列,数据量大且时变性较强,对其聚类时不能准确获得聚类细节,无法高效处理演化数据流。因此,提出基于密度梯度的滑动窗口数据流任意形状聚类方法。结合数据流特征,确定数据处理时需要满足实时性、准确性等要求;根据不确定指数与不确定度分析聚类时必须处理的问题,定义核心密度单元与候选密度单元;通过点邻域、点密度、不动点以及边界点构建密度梯度模型,计算密度分布情况,分类不动点并赋予类别号,在指定聚类数与未指定聚类数两种情况下,按照合并程度函数大小排序,将拥有最小函数值的两类合并,完成数据流任意形状聚类。仿真结果表明,所提方法的聚类结果准确,对滑动窗口敏感性较低,加速比性能良好。