摘要

为解决负载分配不均衡会限制水下无线传感网中吞吐量等性能的问题,提出一种基于强化学习的分布式水下负载均衡路由算法,算法中水下节点根据对应父节点的带宽状态,分布式地学习分配收益并进行负载分配。通过强化学习构建带宽状态和负载分配决策之间的关系模型,使节点在不同带宽状态下进行分配决策,引入演化博弈论来优化决策选择的策略,加快学习过程的收敛速度。仿真结果表明,该算法可实现分布式路由选择和网络负载的均衡分配,有效改善了网络性能。