摘要

因集中供热建筑结构、住户行为习惯等差异,末端住户供暖数据具有特征差异大、非线性强、数据量大、响应时间长等特征,在原数据空间中利用聚类分析进行异常检测造成类间数据交叉,精确性无法保证。本文提出高维高斯混合聚类算法,将数据集映射到高维空间进行聚类,利用核函数映射、内积运算与高维特征空间分解等计算方法,提高精确度,规避维数灾难。搭建工业大数据分析平台,对比K-Means、高斯混合、恒虚警率、高维高斯混合算法聚类结果与异常检测精确度,本文所提算法将准确性提高到90.72%,误报率降低到5.92%,结合该算法完成4类异常用热数据集的解释与辨识。高维高斯混合聚类可以有效分析用户用热特征、检测异常数据,辅助降低采暖能耗,实现建筑节能。

全文