摘要

本发明公开了一种用于认知无线电的多智能体协作频谱感知与接入方法,包括:步骤S101:获取每一个SU-(n)在当前时间帧开始时的环境参数;步骤S102:将所述每一个SU-(n)在当前时间帧开始时的所述环境参数输入确定性策略深度梯度MADDPG模型;步骤S103:获取所述MADDPG模型输出的每一个SU-(n)在当前时间帧的感知策略,其中所述感知策略是选择某一个信道检测是否空闲;步骤S104:将SUn的感知结果及其合作伙伴的感知结果融合成全局状态S(t),再把全局状态S(t)与全局动作A(t)、奖励r(t)和下一时刻状态S(t+1)送到确定性策略深度梯度MADDPG模型的经验重放缓冲区;将所述全局状态S(t)作为下一时刻的观测,如此循环往复,直到训练步数结束。解决了SU如何快速找到空闲信道的同时避免与其他用户碰撞的问题。