摘要

文本对抗样本的生成对于研究基于深度学习的自然语言处理系统的脆弱性,提升这类系统的鲁棒性具有重要的意义.本文对词级对抗样本生成中的重要步骤,替换词的搜索展开研究,针对现有算法存在的早熟收敛和有效性差的问题,提出了基于改进人工蜂群搜索算法的文本对抗样本生成方法.首先,根据知网HowNet库中单词的义原标注筛选得到拟被替换词的搜索空间;然后,基于改进的人工蜂群算法搜索并定位替换词生成高质量的文本对抗样本.本文针对当前主流的基于深度神经网络的文本分类模型,在两个文本分类数据集上进行了攻击测试.结果表明,跟已有文本对抗样本生成方法相比,本文提出的方法能以较高的攻击成功率误导文本分类系统,并更多地保留语义和语法的正确性.

  • 单位
    信息工程大学

全文