摘要

在PM2.5检测领域,生成对抗网络(GAN)是最为常见的数据集扩充方案,通常在GAN的训练中通过扩大生成器和鉴别器分布的支持度以防止鉴别器过拟合。然而,因难以找到合适的噪声分布,采用这种方法难以达到预期的数据集扩充目标。而结合Diffusion-Model框架构建的Diffusion-GAN数据生成模型可以缓解丢失问题来稳定训练梯度,并通过创建同一样本的不同噪声版本来增强数据,从而达到提高生成样本质量和生成器的多样性的目的。实验表明,Diffusion-GAN相较于基线算法,其训练性能和生成样本的保真度分别提高了15.1%和32.7%,能够满足PM2.5空气质量检测数据扩充的需求。

  • 单位
    安徽粮食工程职业学院