摘要

随着物联网时代的到来,万物互联的传输模式引发数据量爆炸式增长,给传统路由协议带来了严峻挑战。阐述了在数据量急剧增长的情况下,已有路由协议的局限性,并将路由选择问题重新建模为马尔可夫决策过程。在此基础上,采用深度强化学习方法为每项数据传输任务选择下一跳路由器,从而在避免数据堵塞的前提下尽可能缩短数据传输路径长度。仿真结果表明,所提方法能够显著降低数据堵塞概率,增大网络吞吐量。