摘要
针对传统机器学习算法存在的问题,研究了在地理分布式情景下的用户负荷特征聚类算法。提出了在单节点集中数据集下生成局部聚类模型时采用的PCA-负荷指标特征融合算法以及集中式K-means算法。针对多节点地理分布式数据集,构建了考虑特征迁移的分布式聚类模型参数共识方法框架,提出了将所有节点的局部聚类模型通过参数共识得到全局聚类模型的分布式K-means算法,同时考虑了模型参数与数据集特征的可迁移性。通过某地区用户负荷数据对模型进行了验证。结果显示,分布式K-means能利用全局信息、考虑不同区域的差异来更好地识别典型用电曲线,并且算法具有较好的可迁移性。
- 单位