摘要

在基站无法提供通信支撑区域,可引入无人机群作为中继节点来搭建无人机应急通信网络。针对无人机如何高效选择最优中继节点及保证系统吞吐量最大化问题,提出一种基于SA-SARSA强化学习算法的无人机中继选择策略。在所有的中继节点通过解码重传(DF)之后进行转发,得到用户端最大比合并后的平均吞吐量的表达式,通过设定SARSA算法的状态、动作、奖励函数,选择回报值最大的中继节点。同时,引入退火算法来使源节点探索到更多的中继节点,从而使无人机群通信网络性能达到最优状态。仿真结果表明,与改进前的SARSA中继选择策略相比,所提的SA-SARSA中继选择策略占理想算法比例提升10%。同时,在相同总功率条件下,所提策略所选的中继节点的吞吐量比Q-learning中继选择策略、SARSA中继选择策略分别提升了8%、13%。

全文