摘要
目的使用回归模型对建筑样本进行机器学习训练,筛选出适用于预测建筑能耗的模型。方法以香港地区1 923个商用建筑作为研究对象,通过网络信息收集的方式获取建筑的物理参数、使用参数以及环境参数,采用PCA算法对高维度数据进行降维处理,并对相关数据进行了归一化处理;选取13种常见的机器学习回归模型作为建筑能耗预测模型,采用平均绝对误差MAE、绝对中位差MAD和决定系数R2作为模型性能评价指标,采用StratifiedKFold分层采样法对总样本进行划分,并对划分后样本进行机器学习训练。结果 Bagging、XGBoost、Random Forest、Extra Trees集成学习回归模型对建筑能耗预测的准确性远优于其他9种模型,其中XGBoost有最小的MAE(6.47)和MAD(2.95),Random Forest有最大的R2(0.97)。结论 5种集成学习回归模型中除了分类算法外,Bagging、XGBoost、Random Forest、Extra Trees 4种模型对建筑能耗预测较优。XGBoost对数据较为完整的建筑能耗预测准确度最高,Extra Trees对于数据缺失严重的建筑预测准确度优于XGBoost。
- 单位