基于深度强化学习的人机协作组装任务分配

熊志华; 陈昊; 王长生; 岳明; 侯文彬; 徐斌

摘要

为适应人机协作组装任务分配日趋复杂的任务结构和高维的任务状态空间，提出了一种基于深度强化学习的人机协作组装任务分配方法。首先，将人机协作组装任务分配形式化为强化学习问题，设计了4通道帧图进行任务分配环境状态的表示，并构建了通用化的组装闯关游戏模拟环境。其次，为解决DQN（Deep Q-Networks）算法频繁的情节重启导致探索效率低下的问题，提出了存档机制及其改进算法Archive DDQN（Double DQN），并介绍了利用该算法与模拟环境交互以进行人机协作组装任务分配的流程方法。最后，通过2种不同难度的组装模拟环境进行对比实验，验证了所提出方法的有效性。

单位
大连理工大学

收藏分享被引浏览

更新时间：2023-02-12 10:27

基于深度强化学习的人机协作组装任务分配

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友