一种基于博弈强化学习的多式联运动态路径规划方法

叶峰; 覃诗; 赖乙宗

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种基于博弈强化学习的多式联运动态路径规划方法

作者：叶峰; 覃诗; 赖乙宗

来源：2021-04-20, 中国, ZL202110423315.7.

摘要

本发明公开了一种基于博弈强化学习的多式联运动态路径规划方法；所述方法包括以下步骤：S1订单处理模块接收用户的订单信息；S2博弈模块根据传入的订单信息计算博弈影响因子；S3并行强化学习模块根据传入的订单信息构建强化学习环境中的状态转移模型,根据所需目标构建强化学习中的奖励,学习单个目标下的Q网络；S4结合博弈因子和单个目标下Q网络进行多目标下的Q表的计算,生成订单初始策略；S5执行订单,根据订单执行情况调整博弈影响因子,调整多目标下的Q网络,直到订单执行完成。

单位
华南理工大学

收藏分享被引浏览

更新时间：2024-10-25 01:09

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号