一种数据流自适应两阶段聚类算法

作者:李志杰; 廖旭红; 刘基旺; 江华
来源:现代信息科技, 2021, 5(14): 124-126.
DOI:10.19850/j.cnki.2096-4706.2021.14.032

摘要

K-means是最常用的批量聚类方法,然而该算法需要多次迭代并不能直接用于数据流聚类。文章基于自适应谐振理论(ART),提出一种针对数据流聚类的自适应两阶段聚类算法(ATPC)。该算法分为在线自适应微聚类和离线全局批量聚类两个阶段,自适应生成微簇,具有线性计算复杂度。在MOA平台上真实与模拟数据流的实验结果验证了ATPC方法的高效性。

全文