摘要

电动出租车充电随机性极强,负荷预测过程中缺乏合理的充电行为判据。针对这一问题,提出一种基于强化学习的电动出租车充电负荷预测方法。首先,借鉴交通领域的重力模型,计算城市各交通小区间的出租车乘用需求,建立电动出租车出行时空行为概率模型;然后,综合反映时间、空间及电量要素定义强化学习状态空间,构造基于单位时间净收益与单位电量净成本的奖励值函数,采用强化学习形成合理的充电判据;最后,采用蒙特卡洛法仿真大量出租车行驶与充电行为,计算充电负荷。算例分析表明司机单日平均收益通过强化学习不断趋于优化,类似于实际驾驶人不断积累经验形成合理充电习惯的过程,时间、空间、电量三方因素对充电决策的综合影响能够得到有效反映。

  • 单位
    国网山东省电力公司电力科学研究院