摘要

<正>本文提出了一种在认知无线电网络中,基于演员-评论家(Actor-critic)的深度强化学习算法的动态功率分配方案。次用户在没有任何主用户功率策略的先验信息下,应用强化学习的算法,通过不断地与环境互动进行训练来学习到相应的功率控制策略,从而能够在不影响主用户正常通信的前提下,与主用户共享同一个信道来进行通信,以满足用户的服务质量(Quality of service,Qo S)。我们的实验中也表明,次用户通过与环境的互动可以学习到有

全文