摘要

基于数据驱动的负荷预测模型在既有建筑运行阶段的准确性和可靠性受到人们越来越广泛的认可。特别是支持向量回归机(SVR)算法,基于统计学习理论和结构风险最小化原则克服了小样本学习困难、维数灾难等缺陷,在准确有效地解决复杂工程问题方面展现出巨大潜力,越来越深入地应用于暖通空调负荷预测领域。但在实际建模过程中,SVR算法对应的输入参数及算法本身的固有参数和核函数参数的选取,也会对模型最终性能产生显著影响。在现有建筑负荷预测模型的研究中,针对建模过程中参数优化的研究较少。主要研究SVR负荷预测模型参数的优化,将统计学方法与机器学习算法相结合,结果显示:(1)可以采用Pearson相关系数对影响空调负荷的参数进行两两相关性分析,以解决输入参数之间存在多重共线性而导致模型估计失真或准确率较低的问题;(2)可采用随机森林算法计算输入参数对预测结果的贡献度,以剔除冗余参数,降低模型复杂度,并综合实际工程应用对经济成本和允许误差的考量来确定最终输入参数的个数;(3)以表征拟合度优劣的相关系数平方R2、反映预测精度的均方根误差RMSE和平均绝对百分比误差MAPE作为评价指标,针对研究对象,网格搜索法和粒子群优化算法对应的MAPE均在7.5%以下,RMSE远小于遗传算法的对应值,R2高达0.95,参数寻优结果能使预测模型具有更高的预测精度及更强的泛化能力。标准遗传算法容易陷入局部最优解,因此迭代完成后训练误差可能仍不理想。此外,网格搜索法的寻优时间为粒子群优化算法的数倍,随着训练样本量的增加,寻优时间的差距也会不断扩增,因此当训练样本较大时,利用粒子群优化算法可以缩短空调负荷预测模型的建模时间。