作为典型的强人工智能方法,强化学习已经开始被尝试应用于真实控制任务中。为了探究连续型强化学习在物理系统控制中的效果,以一阶倒立摆系统的平衡控制为实例,使用强化学习方法和经典PID控制方法对倒立摆系统分别进行建模与控制实现,并着重对控制表现进行对比分析,结果表明在该控制任务中连续强化学习训练所得的控制策略对扰动的反应更迅速,并具有更强的稳定性。