由于引入了光伏新能源,光伏充电站既可以通过向车辆充电获取利润,也可以对电网供电获得效益,因此如何合理安排充电、获得最大收益是充电策略研究的重点。通过深度置信策略梯度(DDPG)算法,对充电策略进行优化,将利润作为回报函数,训练智能体,可在无先验的基础上实现在线优化。最后,通过仿真实验证明,该算法可以在不同车辆、不同光照情况下取得相对较高的利润。