基于局部加权k近邻的多机器人系统异步互增强学习

杨月全; 韩飞; 金露; 倪春波; 曹志强; 张天平

摘要

针对多机器人系统的增强学习问题,为提高机器人的学习速度和充分利用通信范围内其他机器人的增强学习的经验和结果,给出了2类基于局部加权k近邻时间差分的多机器人系统的交互式学习策略.对于机器人之间通信无时滞情形,基于环境感测和任务信息状态描述的局部加权k近邻状态选择方法,机器人通过对自身和通信范围内其他机器人Q值表的比较和分析,对其自身的Q值表进行优化迭代更新.在此基础上,分别给出了基于全局通信条件下和局部通信条件下多机器人系统的异步的互增强学习方案.最后,通过仿真实验进一步验证了所提方案的可行性和有效性.

单位
扬州大学; 复杂系统管理与控制国家重点实验室; 中国科学院自动化研究所

收藏分享被引浏览

更新时间：2020-06-17 12:30

基于局部加权k近邻的多机器人系统异步互增强学习

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友