一种基于深度强化学习的动态路由算法

肖扬; 吴家威; 李鉴学; 刘军

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种基于深度强化学习的动态路由算法

作者：肖扬; 吴家威; 李鉴学; 刘军

来源：信息通信技术与政策, 2020, (09): 48-54.

摘要

路由是网络基础架构稳定运行的保障,是支撑下一代网络持续发展的关键功能。如今,网络流量的快速增长和服务需求的不断变化使传统路由算法面临严峻的挑战。近年来,深度强化学习在解决复杂连续控制问题上表现出良好的效果。为了解决传统路由算法的一系列弊端,将深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)与路由场景相结合,提出一种基于深度强化学习的新型动态路由算法(DDPG4Net);随后,在自行开发的网络模拟器RL4Net上对该算法的效果进行了验证。

单位
北京邮电大学

收藏分享被引浏览

更新时间：2024-04-13 15:37

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号