摘要
面向小行星探测任务的需要,柔性连接的多节点深空探测器是针对单节点探测器着陆易倾覆或反弹等问题的一种解决方案。基于此构建了一种采用柔性连接的三节点探测器并对其软着陆情况进行建模,提出了带自注意力机制的多任务深度强化学习方法。各节点以探测器主体为参照物描述自身状态,节点之间通过联合学习来提高各自对复杂环境的适应能力;在对探测器和障碍物进行特征提取时,采用注意力机制来提高对自己任务的关注,学习出更优的策略,从而获得最大的奖励。通过与其他方法的实验结果对比,证明了提出的方法更有利于探测器的稳定着陆。
- 单位