摘要
在面对网络变化时,传统的TCP拥塞控制协议因其固有的规则机制只能做出固定的动作,既未充分利用链路带宽,也未从历史经验中学习,并且在发生拥塞时带宽恢复所用时间较长。近年来基于强化学习的拥塞控制协议(Reinforcement Learning Congestion Control, RL-CC)虽然可以有效地从历史经验中学习,但是它没有考虑历史经验在时序上存在的因果关系。对这种因果关系进行隐式提取,提出一种基于时序卷积网络和强化学习的拥塞窗口自适应智能化拥塞控制协议(Temporal convolutional network and Reinforcement Learning Congestion Control, TRL-CC)。TRL-CC通过NS-3仿真不同带宽的网络环境。大量的仿真实验表明,与NewReno和RL-CC做对比,TRL-CC在吞吐量方面提升32.8%和8.5%,时延降低41.3%和12%。
- 单位