摘要

本文的基于PCA的高维流式数据聚类算法是在D-Stream算法的基础上提出来的。首先,从基本原理上分析了D-Stream算法在高维网格划分时,存在着大量计算,影响算法效率;其次,对于高维数据本身而言,存在着数据高维稀疏的特性;最后,本文采用PCA降维与滑动窗口技术相结合的思想来改进D-Stream算法,并通过仿真实验证明了算法的可行性。