摘要

近年来,随着语音信号处理技术的发展,合成语音在很多场景下已经能够满足实际的基本要求,但在自然度上方面,还需要进一步提高和改进。在汉语语音合成中,韵律结构的预测对于自然度的影响非常大,如何精确预测韵律结构,成为语音合成技术中需要解决的重要问题。该文结合注意力机制将深度神经网络双向RNN模型用于汉语韵律词的预测,得到的预测结果表明,具有注意力机制的双向RNN模型在进行韵律词的预测方面能够获得比较准确的效果。

  • 单位
    北京信息职业技术学院