摘要

信息技术飞速发展导致了网络上的信息日益增加,随之而来的网络攻击日渐频繁,其频率和破坏力都在不断上升,攻击的隐匿性也越来越高。隐藏在大量信息下的网络攻击和异常行为,亟需有效的检测方法。训练机器学习检测算法时,对异常样本的数量要求较高。当异常样本在训练数据集中比例较小时,获得的模型检测效果较差。本文提出一种基于生成式对抗网络(Generative Adversarial Network,GAN)的异常数据模拟算法,用于提高训练样本中异常数据集的比例,解决了训练样本数据不均衡的问题,并利用K-means算法验证了生成样本数据的质量。

  • 单位
    吉林警察学院