一种语音关键词识别中扩增语料的选取方法

贺前华; 汪星; 严海康

摘要

本发明公开了一种语音关键词识别中扩增语料的选取方法,步骤包括：对含关键词的原始语音进行语音转化,得到同一语义但不同说话人信息的语音；对原始语音进行语音端点检测去除静音部分,再获取原始语音和生成语音中的关键词片段；将原始语音关键词片段分为男女两类样本,分别训练UBMM、UBMF,用第i个关键词的男女两类原始语音关键词片段分别训练GMM(M,i)、GMM(F,i)；采用GMM分离度度量判断GMM分量距离,将分离度较小的设为相似GMM分量,去除GMM(M,i)、GMM(F,i)中相似GMM分量,剩下分离度较大分量形成新的GMM′(M,i)、GMM′(F,i),用GMM′(b,i)、GMM′(g,i)对生成语音关键词片段进行性别分类；采用改进后的评价系数对生成语音进行评价,选取训练样本。本发明能在存在样本较少或不均衡的情况下更高效地训练模型。

单位
华南理工大学

收藏分享被引浏览

更新时间：2024-12-27 20:07

一种语音关键词识别中扩增语料的选取方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友