基于变分自动编码的情感语音合成方法、系统、设备及介质

姬红兵; 张雅琼; 刘龙; 张梦璇; 张文博; 常雅琪; 李浩生; 谢家强; 林鹏逸

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于变分自动编码的情感语音合成方法、系统、设备及介质

作者：姬红兵; 张雅琼; 刘龙; 张梦璇; 张文博; 常雅琪; 李浩生; 谢家强; 林鹏逸

来源：2023-09-08, 中国, CN202311154581.X.

摘要

基于变分自动编码的情感语音合成方法、系统、设备及介质,方法包括：数据预处理、模型构建、模型训练及优化、语音还原；系统、设备及介质：用于实现基于变分自动编码的情感语音合成方法；本发明通过基于变分自动编码的风格生成模型从输入音频中学习情感风格,并利用变分自动编码器的特性微调融合情感风格特征,将情感风格特征、声学特征和文本序列输入注意力机制改进的端到端语音合成模型,提升了模型整体的情感细节建模能力和上下文信息学习能力,提高了合成语音的情感表现力和内容准确度。

单位
西安电子科技大学

收藏分享被引浏览

更新时间：2024-07-18 05:46

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号