摘要
为适应人机协作组装任务分配日趋复杂的任务结构和高维的任务状态空间,提出了一种基于深度强化学习的人机协作组装任务分配方法。首先,将人机协作组装任务分配形式化为强化学习问题,设计了4通道帧图进行任务分配环境状态的表示,并构建了通用化的组装闯关游戏模拟环境。其次,为解决DQN(Deep Q-Networks)算法频繁的情节重启导致探索效率低下的问题,提出了存档机制及其改进算法Archive DDQN(Double DQN),并介绍了利用该算法与模拟环境交互以进行人机协作组装任务分配的流程方法。最后,通过2种不同难度的组装模拟环境进行对比实验,验证了所提出方法的有效性。
- 单位