摘要

本发明公开了一种基于联合学习的机器人最优人机交互阻抗控制方法、存储介质及机器人,方法包括如下步骤:构建任务空间参考回归轨迹、人机交互二阶阻抗模型与任务空间辅助轨迹,建立人机交互任务空间增广系统与对应的评价指标函数;基于积分强化算法在线更新人机交互二阶阻抗模型参数,直至得到最优参数;针对二阶阻抗模型,构建自适应神经网络阻抗控制器;基于确定学习理论获取经验知识,构建常值神经网络阻抗控制器。本方法有效解决了机器人在未知动力学信息与未知人类运动特性条件下人机交互的精确阻抗控制,运用强化学习机制实现在不同任务场景与不同交互对象条件下人机交互参数的在线最优调整。