摘要
六足机器人直接在现实环境中进行避障训练,会出现数据采样效率低、样机与障碍物产生碰撞造成零件出现不可逆损伤等情况。采用迁移学习中的渐进式神经网络(PNN)来实现模型的多环境迁移。实验基于双重深度(Double-DQN)强化学习预训练模型,将预训练后的模型有机结合为PNN结构,进而完成从源任务到目标任务的避障策略迁移。根据仿真实验的结果显示,相较于其他设计方法,PNN学习目标任务花费的时间大大降低。然后将仿真器中训练好的PNN结构移植到六足机器人样机中测试,最终测试结果表明:六足机器人能够成功完成避障任务。
- 单位