摘要
针对文本生成图像网络单生成器结构中语义信息与目标内容不匹配问题,提出一种语义-空间特征增强生成对抗网络(SFE-GAN)。该网络通过分别在低分辨率生成层(浅层)与高分辨率生成层(深层)引入密集连接网络,丰富传递特征多样性与加强特征融合,其中浅层约束生成图像定位,深层约束生成图像细节,进而提高生成图像与语义信息的相似性,约束生成图像细节,提升生成图像质量。在CUB数据集实验测试与SSA-GAN相比,IS和FID指标分别提升4.0%和1.3%,显著提升生成图像清晰度、多样性和与原始图像间相似性,为视频交互领域发展提供更多可能。
-
单位大连民族大学; 机电工程学院