摘要
目标跟随策略是四足机器人目标跟随系统的重要组成部分。针对跟随过程中目标运动随机因素多、系统决策复杂以及现实部署鲁棒性不足的问题,首先,提出一种基于深度强化学习的目标跟随策略,该策略根据输入的目标相对于机器人的空间位置信息,输出跟随动作指令,实现机器人对随机运动目标的跟随决策。然后,使用基于Actor-Critic框架的深度强化学习算法对机器人进行训练,并添加观测值噪声以获得更鲁棒的跟随策略和引入修正因子来减少仿真环境与真实环境中机器人的运动速度偏差,先在仿真平台上进行了初步验证,最后将跟随策略部署到四足机器人上进行实验验证。结果表明,系统跟随性能良好,满足大多数应用场景的需要。
- 单位