摘要
针对具有滞后特性的电缆绝缘挤出机,设计了一种基于Sherman Morrison和Sarsa(λ)的预测型强化学习控制器SM-Sarsa(λ)控制挤出直径。该控制器主要包含两个过程,一是以Sarsa(λ)为核心的决策过程,另一个是以Sherman Morrison为关键技术的拟合过程。两者相互配合,一方面决策过程可以为拟合过程提供样本数据得到预测模型,以便跟踪系统的传递函数,另一方面预测-学习过程通过拟合模型为决策-学习过程提供预测值,以便在等效无滞后的条件下进行实时控制。将SM-Sarsa(λ)与传统控制器进行仿真对比实验,结果表明:SM-Sarsa(λ)在牺牲一定训练时间的代价下,其控制效果明显优于传统控制器。采用该控制器的电缆绝缘挤出机,响应速度和收敛速度更快、超调量小,控制精度大幅度提高。
-
单位自动化学院; 江西理工大学