摘要

在使用轮式助行机器人辅助行走和康复训练过程中,机器人运动控制的稳定性和轨迹跟踪的准确性是人机交互的重要研究内容。本文将强化学习中的深度确定性策略梯度(DDPG)算法与比例积分微分(PID)控制器相结合,提出了一种轮式助行机器人轨迹跟踪方法。首先,对轮式助行机器人底盘的运动学模型进行了分析。其次,介绍了强化学习中的DDPG算法与PID控制器相结合的自适应PID控制器的实现原理和控制结构。最后进行了仿真实验。实验结果表明,与传统PID控制器相比,基于DDPG算法的PID控制器能在机器人系统跟踪期望轨迹时自适应调整参数,使机器人始终按照期望轨迹运动。同时,得益于强化学习的试错机制,控制器具有较强的抗干扰能力。