摘要
本发明属于目标跟踪领域,具体涉及基于深度确定性策略梯度DDPG的多机动目标跟踪方法。建立深度确定性策略梯度网络;利用LSTM网络生成深度确定性策略梯度网络输入数据s-k;设置深度确定性策略梯度网络的动作和回报,得到设定后深度确定性策略梯度网络;根据所述深度确定性策略梯度网络输入数据s-k训练所述设定后深度确定性策略梯度网络得到训练后深度确定性策略梯度网络;使用训练后深度确定性策略梯度网络进行多机动目标跟踪。本发明资源分配合理、雷达跟踪精度高,还解决无模型和马尔科夫决策问题。
- 单位
本发明属于目标跟踪领域,具体涉及基于深度确定性策略梯度DDPG的多机动目标跟踪方法。建立深度确定性策略梯度网络;利用LSTM网络生成深度确定性策略梯度网络输入数据s-k;设置深度确定性策略梯度网络的动作和回报,得到设定后深度确定性策略梯度网络;根据所述深度确定性策略梯度网络输入数据s-k训练所述设定后深度确定性策略梯度网络得到训练后深度确定性策略梯度网络;使用训练后深度确定性策略梯度网络进行多机动目标跟踪。本发明资源分配合理、雷达跟踪精度高,还解决无模型和马尔科夫决策问题。