摘要

人工智能技术的发展推动了强化学习(RL)算法在工业过程控制中的应用。在航空、航天和核能等行业中,不仅要求控制算法准确性高,还对控制算法的可靠性提出高要求。对RL领域的可靠性评估方法进行了研究,提出了反应堆过程控制RL可靠性评估方法。该方法通过分析模型的推理性能以评估RL模型的决策能力,并创新性地提出了针对传感-控制系统的对抗样本(AE)生成方法。通过AE测试评估RL模型的抗干扰能力。利用所提评估方法对反应堆过程控制RL模型进行了可靠性评估。试验结果表明,所提方法可以评估实际应用中RL模型的可靠性。该研究为人工智能技术在反应堆控制应用的可靠性评估工作以及RL领域对抗测试方法研究提供参考。

全文