摘要

伴随新媒体业务及智慧广电建设的开展,利用语音合成和虚拟数字人视频合成技术,对韵律、口型等驱动3D建模,定制“真人”为原型的虚拟主播形象,只需输入文字,就可进行音视频的快速合成播报,合成后的虚拟主播表情生动自然,唇形能随播报内容同步变化。本文主要阐述智能语音转写、合成的基本原理,以及虚拟数字人技术的技术架构、功能设计与实现效果。