摘要

针对选择性催化还原(SCR)脱硝系统存在多扰动、大迟延、大惯性等特点,提出基于改进的双延迟深度确定性策略梯度(ITD3)算法、比例积分(PI)控制器和扰动观测器(DOB)的一种ITD3-PI复合串级控制算法。首先,借鉴PID控制思想提出了一种ITD3算法,通过对出口NOx质量浓度设定值与测量值之间的误差进行微分和积分运算生成新的环境状态,并将新的状态、测量值和误差同时储存于经验池中;然后,利用DOB来估计脱硝过程的扰动,并进行前馈补偿;最后,对ITD3-PI复合串级控制与TD3-PI复合串级控制、复合串级PID控制和串级PID控制进行对比实验。结果表明:所提方法控制速度快、超调量小、抗干扰能力强,为强化学习在SCR脱硝系统中的应用提供了新的思路。

全文