本发明公开一种场景图文生成方法和系统,其方法包括步骤:S1:文本行提取,即从给定的场景图像中提取出文本所在的区域,作为文本行风格图像;S2:文本行风格迁移,即将给定的文本图像和风格图像进行融合,得到融合图像;S3:场景文本融合,即将融合图像嵌入到输入图像中,并进行渲染得到输出图像。本发明采取的技术方案,根据文本位置信息,将输入场景图片中的文字内容替换为其他语种文字内容,同时保留输入图片的文字的风格和背景,并提升了替换效果。