语音欺骗检测方法的研究现状及展望

张雄伟; 李嘉康<sup>*</sup>; 孙蒙; 郑琳琳

doi:10.16337/j.1004-9037.2020.05.002

摘要

语音欺骗是指通过录音、语音合成(Text-to-speech,TTS)、语音转换(Voice conversion,VC)等手段,将一段非法的、未经过自动说话人验证(Automatic speaker verification,ASV)系统认证的声音进行"修改仿冒",以达到通过ASV系统检测的目的。随着人工智能和语音欺骗技术的发展,ASV系统在安全性方面遇到了严峻的挑战。检测输入ASV系统的语音的真实性,防止欺骗语音通过ASV的验证以提高ASV系统的安全性,是近年来语音领域研究的一个热点问题。国内外学者的最新研究从声学特征选取、识别模型选择等角度出发,探索了不同的语音欺骗方法对ASV系统的影响,并深入研究了相应的语音欺骗检测技术,在一定程度上提高了ASV系统的防欺骗性能。本文介绍了语音欺骗的基本方法,给出了语音欺骗检测的框架和典型声学特征,分两大类别总结了语音欺骗检测的主要方法和最新进展,梳理了目前语音欺骗检测中仍然存在的若干技术问题,并对语音欺骗检测技术的发展方向进行了展望。

单位
中国人民解放军陆军工程大学

全文

访问全文

收藏分享被引(16) 浏览

更新时间：2024-04-13 16:41

语音欺骗检测方法的研究现状及展望

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友