摘要
针对传统入侵检测领域由于数据不平衡而出现少数类检测率低的问题,设计了一种基于条件生成对抗网络和CatBoost算法的数据生成模型(SA-WCGAN)。首先,采用CatBoost算法对原始数据集进行特征选择,减少模型训练时间。之后,利用SA-WCGAN生成模型进行数据扩充,解决数据不平衡问题,该生成模型引入自注意力机制(SA),提取攻击样本的全局特征,提高少数类攻击样本生成的质量;同时,引入Wasserstein距离和梯度惩罚,提高模型训练过程的收敛速度和稳定性。实验结果表明:在公开基准数据集NSL-KDD上,SA-WCGAN生成模型在只有少数样本的攻击类型上具有较高的精确率、召回率和F1分数。同时,与现有5种方法的比较分析也证实了该模型的优越性。
-
单位自动化学院; 昆明理工大学