摘要
基于全变量因子分析和概率线性区分性分析的算法是目前与文本无关的说话人确认的主流算法。该文将全变量分析和支持向量机结合起来,把低维的全变量因子作为支持向量机的输入特征,并采用余弦核函数来增强低维特征的区分性,该系统取得了与当前主流算法相当的性能;进一步,将此系统得分和概率线性鉴别分析系统得分融合起来可以取得明显的性能提升。在NIST 2012说话人评测通用测试条件的女声部分,融合后的系统在情境一和三的检测代价函数相对最好的单系统分别下降了25.1%和25.2%。
-
单位科大讯飞股份有限公司; 中国科学技术大学; 国家计算机网络应急技术处理协调中心