面向中文文本分类的字符级对抗样本生成方法

张顺香; 吴厚月; 朱广丽; 许鑫; 苏明星

摘要

对抗样本生成是一种通过添加较小扰动信息，使得神经网络产生误判的技术，可用于检测文本分类模型鲁棒性。目前，中文领域对抗样本生成方法主要有繁体字和同音字替换等，这些方法都存在对抗样本扰动幅度大，生成对抗样本质量不高的问题。针对这些问题，该文提出一种字符级对抗样本生成方法(PGAS)，通过对多音字进行替换可以在较小扰动下生成高质量的对抗样本。首先，构建多音字字典，对多音字进行标注；然后对输入文本进行多音字替换；最后在黑盒模式下进行对抗样本攻击实验。实验在多种情感分类数据集上，针对多种最新的分类模型验证了该方法的有效性。

单位
安徽理工大学

收藏分享被引浏览

更新时间：2023-02-11 02:49

面向中文文本分类的字符级对抗样本生成方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友