随着具有高频数据流特性的D-PMU设备的广泛应用和普及,配电网系统中的量测数据量爆炸式增长,对大数据处理技术的要求越来越高。为了配电网能够可靠稳定运行,准确并及时对D-PMU存在的扰动进行在线预测分类显得非常重要。因此,提出了基于Spark的计算平台,采用PCA算法对D-PMU时间序列特征进行提取,结合XGBoost算法对D-PMU主要的扰动特征进行预测分类。实验结果表明提出的方法提高了D-PMU扰动分类的准确性,并且算法的计算速度也有显著的提升,确保了数据处理的实时性。