摘要

本发明公开了一种基于DDPG的发射资源智能认知管理方法,包括:构建并训练LSTM预测网络;利用深度强化学习智能体感知环境,以获取目标状态的观测值;将目标状态的观测值输入已训练的LSTM预测网络,得到目标的先验信息表示;将目标的先验信息表示输入Actor-Critic网络,得到动作向量;根据动作向量生成发射波束并分配功率,以实现发射资源的智能管理。本发明提供的基于DDPG的发射资源智能认知管理方法,简化了优化过程,提高了跟踪精度;且未限制发射波束与目标个数的数量关系,使得资源分配更合理,资源的利用效率更高,应用范围更广泛。