反应堆过程控制强化学习可靠性评估方法研究

乔宇; 颜瑞; 黄百健; 姚文卿; 王少华; 陈日罡

doi:10.16086/j.cnki.issn1000-0380.2023030135

摘要

人工智能技术的发展推动了强化学习（RL）算法在工业过程控制中的应用。在航空、航天和核能等行业中，不仅要求控制算法准确性高，还对控制算法的可靠性提出高要求。对RL领域的可靠性评估方法进行了研究，提出了反应堆过程控制RL可靠性评估方法。该方法通过分析模型的推理性能以评估RL模型的决策能力，并创新性地提出了针对传感-控制系统的对抗样本（AE）生成方法。通过AE测试评估RL模型的抗干扰能力。利用所提评估方法对反应堆过程控制RL模型进行了可靠性评估。试验结果表明，所提方法可以评估实际应用中RL模型的可靠性。该研究为人工智能技术在反应堆控制应用的可靠性评估工作以及RL领域对抗测试方法研究提供参考。

单位
北京大学; 中国核电工程有限公司

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 15:34

反应堆过程控制强化学习可靠性评估方法研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友