摘要
本发明公开了一种解决关键词识别样本不均衡的方法,包括1)改变语音基频并保持语音语义不变,利用语音转换技术对含关键词的语音进行转换,获得同一语义样本的不同性别、不同年龄说话人的多个语音样本;2)对神经网络模型中的损失函数做自适应加权处理:使用重量交叉熵时,在每轮训练中分别计算关键词语料和非关键词语料的准确率,根据两者之差自动调节第k轮的加权系数W-k;3)自适应帧数:在使用DNN作为训练模型时根据关键词长度对不同关键词使用不同的检出帧数L-i;本发明能有效缓解因数据不平衡或太少造成的训练效果差或无法训练等问题,同时能在一定程度上加快训练速度,提升训练效果。
- 单位