摘要
为使得合成系统所生成的语音更加自然,构建了一个普通话对话语气韵律模型。借鉴现有陈述语气韵律模型的研究成果,针对对话语气的特点进行扩展,生成具有对话语气韵律特征的基频曲线。与陈述语气相比,对话语气具有较快的语速和较窄的调域,然而仅通过变换语速和调域却无法模拟出对话语气的特征。对话语气中音节内部基频曲线无法完成其原先固有的调形,这种现象称为"未完成现象"。为了模拟这种现象,利用分类树预测一个音节是正常音节还是未完成音节,并在基频曲线生成模型中对未完成音节进行特殊处理,使之生成具有对话语气韵律特征的基频曲线。听辨实验证明,基于本文所提出韵律模型合成的语音表现更加自然和口语化。
-
单位中国科学院自动化研究所; 模式识别国家重点实验室