基于角裕度损失的说话人识别研究

孟飞宇

doi:10.16311/j.audioe.2022.10.005

摘要

针对传统身份认证矢量与概率线性判别分析结合的声纹识别模型步骤烦琐、泛化能力较弱等问题，基于自建的普通话唱红歌语音库，设计三个针对文本无关的闭集声纹识别模型，分别为Res-SD、Res-SA和Rep-SA模型。Res-SD模型采用传统的交叉熵损失函数完成训练，Rs-SA和Rep-SA模型采用可以在特征表达的角度空间中最大化分类界限的附加角裕度损失函数完成训练。实验结果验证了所提出的三个模型针对文本无关的闭集识别任务是有效的。在参数量和准确性方面，Rep-SA模型更适合在红歌数据库上学习到具有类别区分性的唱歌者特征。

单位
中国刑事警察学院

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 17:44

基于角裕度损失的说话人识别研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友