摘要

为解决认知无线电(Cognitive Radio, CR)中频谱和能量短缺的问题,提出一种基于深度Q网络(Deep Q-Network, DQN)的动态频谱接入算法。次级用户(Secondary User, SU)通过基站射频信号采集能量,并在频谱感知后实现信道的自主接入。模型通过DQN训练,并使用奖励机制和训练算法优化,SU能够根据环境信息作出合适的接入策略。仿真结果表明,提出的深度强化学习(Deep Reinforcement Learning, DRL)模型性能优于无学习模型,提高了频谱感知准确率及用户吞吐量,对比结果证明了模型的适用性及合理的虚警率可以提升模型的学习性能。

全文