基于牵引控制的深度强化学习路由策略生成

孙鹏浩; 兰巨龙; 申涓; 胡宇翔

摘要

当前网络规模的高速增长带来网络流量复杂度的日益提高,增加了对流量特征精确建模的难度.近年来业界提出使用深度强化学习技术实现网络路由的智能化生成,一定程度上克服了人工进行流量分析和建模的缺点.然而,目前提出的解决方案普遍存在可扩展性差等问题.对此,提出了一种基于牵引控制理论的深度强化学习路由策略生成技术Hierar-DRL,通过引入牵引控制理论并结合深度强化学习的自动策略搜索能力,提高了智能路由算法可扩展性.仿真实验结果表明:所提方案相比当前最优方案的端到端时延最多降低了28.5%,证明了所提智能路由方案的有效性.

单位
信息工程大学

收藏分享被引(6) 浏览

更新时间：2024-04-17 12:09

基于牵引控制的深度强化学习路由策略生成

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友