摘要

本发明公开了一种基于敏感度的深度强化学习智能体攻击方法,包括步骤:1)将滑动窗口在输入图像上滑动;2)分析滑动窗口内的像素点对深度强化学习智能体输出的累积奖励的影响,并计算像素点的敏感度;3)根据像素点的敏感度和攻击成本,在输入图像上挑选最敏感的像素点,构造敏感点集合;4)对敏感点集合中的像素点,利用梯度进行攻击。本发明提出用敏感度衡量像素点对深度强化学习智能体输出的累积奖励的影响,同时考虑即时奖励和累积奖励对攻击的影响,从而构造有效的深度强化学习智能体攻击方法,从而深入研究深度强化学习智能体存在的安全漏洞。