基于渐进式神经网络的六足机器人避障策略迁移

作者:董星宇; 傅汇乔*; 王鑫鹏; 唐开强; 留沧海
来源:传感器与微系统, 2023, 42(02): 135-144.
DOI:10.13873/J.1000-9787(2023)02-0135-05

摘要

六足机器人直接在现实环境中进行避障训练,会出现数据采样效率低、样机与障碍物产生碰撞造成零件出现不可逆损伤等情况。采用迁移学习中的渐进式神经网络(PNN)来实现模型的多环境迁移。实验基于双重深度(Double-DQN)强化学习预训练模型,将预训练后的模型有机结合为PNN结构,进而完成从源任务到目标任务的避障策略迁移。根据仿真实验的结果显示,相较于其他设计方法,PNN学习目标任务花费的时间大大降低。然后将仿真器中训练好的PNN结构移植到六足机器人样机中测试,最终测试结果表明:六足机器人能够成功完成避障任务。

全文