摘要

说话人匿名技术的出现,对基于声纹的生物特征识别造成了巨大的安全威胁。对于利用各种变声工具实施的说话人匿名,匿名语音中的说话人个性特征相比原始语音发生了显著改变,会严重影响说话人识别的效果。针对现有说话人重识别方法存在的语音还原手段单一、在变声工具类型未知情况下的匿名语音还原效果尚不明确等问题,提出了一种基于基频和共振峰联合还原的说话人变声匿名重识别方法。该方法在基频逆变换变声还原的基础上,引入McAdams系数调整语音的共振峰,同时使用基于x-vector的说话人识别模型进行声纹相似度评分,提高了黑盒变声匿名条件下还原语音与真实语音的声学特征相似度,增强了说话人识别系统对不同类型变声匿名语音的重识别能力。实验结果表明,提出的方法对四种音频编辑软件和三种真实变声器材匿名语音的重识别效果均优于现有基线重识别方法。

  • 单位
    中国人民解放军陆军工程大学