摘要
本文提出一种可用于建筑能耗预测的基于KNN分类器的DQN算法——K-DQN.其在利用马尔科夫决策过程对建筑能耗进行建模时,针对大规模动作空间问题,将原始动作空间缩减进而提高算法的预测精度及收敛速率.首先, K-DQN将原始动作空间平均划分为多个子动作空间,并将每个子动作空间对应的状态分为一类,以此构建KNN分类器.其次,利用KNN分类器,将不同类别相同次序动作进行统一表示,以实现动作空间的缩减.最后,K-DQN将状态类别概率与原始状态相结合,在构建新状态的同时,帮助确定缩减动作空间内每一动作的具体含义,从而确保算法的收敛性.实验结果表明,文章提出的K-DQN算法可以获得优于DDPG、DQN算法的能耗预测精度,且降低了网络训练时间.
- 单位