针对难以获得长距离依赖的问题,本文受自然语言处理的启发,将图像分部分生成,并在每一部分的前后添加自注意力机制以获取空间上的依赖性,又增加不同区域内同一类别间的响应和一致性,最终设计实现了具有区域间注意力机制的街景生成模型。如此在获得长距离依赖的同时,部分生成也保留了区域间的独立性,防止图像生成因过于耦合而出现的图像不清晰现象。