摘要
介绍了目前有关机器人强化学习和多任务学习的方法和成果。针对现有的强化学习算法在现实环境中采样效率低下和难以进行多任务学习的问题。提出一种基于渐进式神经网络的强化学习(PNNRL)算法。先根据现实原始图像,创建一个包含了现实中重要信息的高效模拟环境,在模拟环境中训练得到一个策略模型,然后基于渐进式神经网络,将模拟环境中训练得到的策略迁移到现实环境中,实现在加快模型收敛速度和数据采样效率的同时,还实现仿真域到现实域的策略迁移和避免了因为迁移学习造成的灾难性遗忘。结合机器人作业任务实验结果显示,PNNRL算法可以有效解决强化学习采样效率低的问题,并且利用渐进式神经网络的特性还可以做到多任务学习。最后对机器人多任务学习的研究前景做了展望。
- 单位