摘要

针对许多检测模型受到数据不平衡和异常数据的复杂性等因素影响问题,提出一种以生成对抗网络(generative adversarial network,GAN)为基础的数据异常检测方法。该方法利用InfoGAN网络训练生成正常数据和异常数据,构造一个推理神经网络作为生成数据与原始数据的标签生成器,之后利用第二个GAN网络对推理网络精调,保证生成的样本和其标签对应;最后将生成样本与标签输入随机森林分类,通过Hyperband算法寻找随机森林最优超参,对推理网络进一步优化。在四个真实数据集上与五种传统机器学习模型进行实验对比,实验结果表明,该模型无需收集更多异常样本,达到数据平衡就可以有效进行数据异常检测。在Mnist数据集中,该模型的AUC值相比于K近邻(K-nearest neighbor,KNN)方法提高0.14,并且综合性能优于传统机器学习模型。