摘要

随着深度学习的快速发展,生成式模型领域也取得了显著进展.生成对抗网络(Generative adversarial network,GAN)是一种无监督的学习方法,它是根据博弈论中的二人零和博弈理论提出的. GAN具有一个生成器网络和一个判别器网络,并通过对抗学习进行训练.近年来, GAN成为一个炙手可热的研究方向. GAN不仅在图像领域取得了不错的成绩,还在自然语言处理(Natural language processing, NLP)以及其他领域崭露头角.本文对GAN的基本原理、训练过程和传统GAN存在的问题进行了阐述,进一步详细介绍了通过损失函数的修改、网络结构的变化以及两者结合的手段提出的GAN变种模型的原理结构,其中包括:条件生成对抗网络(Conditional GAN, CGAN)、基于Wasserstein距离的生成对抗网络(Wasserstein-GAN, WGAN)及其基于梯度策略的WGAN (WGAN-gradient penalty, WGAN-GP)、基于互信息理论的生成对抗网络(Informational-GAN, Info GAN)、序列生成对抗网络(Sequence GAN, Seq GAN)、Pix2Pix、循环一致生成对抗网络(Cycle-consistent GAN, Cycle GAN)及其增强Cycle-GAN (Augmented Cycle GAN).概述了在计算机视觉、语音与NLP领域中基于GAN和相应GAN变种模型的基本原理结构,其中包括:基于CGAN的脸部老化应用(Face aging CGAN, Age-c GAN)、双路径生成对抗网络(Two-pathway GAN, TP-GAN)、表示解析学习生成对抗网络(Disentangled representation learning GAN, DR-GAN)、对偶学习生成对抗网络(Dual GAN)、Gene GAN、语音增强生成对抗网络(Speech enhancement GAN, SEGAN)等.介绍了GAN在医学、数据增强等领域的应用情况,其中包括:数据增强生成对抗网络(Data augmentation GAN, DAGAN)、医学生成对抗网络(Medical GAN, Med GAN)、无监督像素级域自适应方法 (Unsupervised pixel-level domain adaptation method, Pixel DA).最后对GAN未来发展趋势及方向进行了展望.

全文