基于强化学习的电动车路径优化研究

胡尚民; 沈惠璋

doi:10.19734/j.issn.1001-3695.2019.07.0260

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于强化学习的电动车路径优化研究

作者：胡尚民; 沈惠璋

来源：计算机应用研究, 2020, 37(11): 3232-3235.

DOI：10.19734/j.issn.1001-3695.2019.07.0260

摘要

针对有路径总时长约束、载重量约束和电池容量约束的电动车路径优化问题(EVRP),考虑其途中可前往充电站充电的情境,构建以最小化路径总长度为目标的数学模型,提出一种基于强化学习的求解算法RLEVRP。该算法用给定的分布生成训练数据,再通过策略梯度法训练模型,并保证在训练过程中路径合法即可。训练得到的模型可用于解决其他数据同分布的问题,无须重新训练。通过仿真实验及与其他算法的对比,表明RL-EVRP算法求解的路径总长度更短、车辆数更少,也表明强化学习可成功运用于较复杂的组合优化问题中。

单位
上海交通大学

全文

访问全文

收藏分享被引浏览

更新时间：2020-12-09 21:20

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号