本研究主要目的是利用图形图像学技术,通过深度学习模型,对真人视频进行图像的数字化模拟,通过TTS技术来驱动合成数字人图像视频。通过对4K视频源内人形图像进行面部与身体动作要素的学习,从而达到利用AI的学习能力来模仿真人进行口型与声音波纹的匹配,最终合成视频。