一种解决关键词识别样本不均衡的方法

贺前华; 汪星; 严海康

摘要

本发明公开了一种解决关键词识别样本不均衡的方法,包括1)改变语音基频并保持语音语义不变,利用语音转换技术对含关键词的语音进行转换,获得同一语义样本的不同性别、不同年龄说话人的多个语音样本；2)对神经网络模型中的损失函数做自适应加权处理：使用重量交叉熵时,在每轮训练中分别计算关键词语料和非关键词语料的准确率,根据两者之差自动调节第k轮的加权系数W-k；3)自适应帧数：在使用DNN作为训练模型时根据关键词长度对不同关键词使用不同的检出帧数L-i；本发明能有效缓解因数据不平衡或太少造成的训练效果差或无法训练等问题,同时能在一定程度上加快训练速度,提升训练效果。

单位
华南理工大学

收藏分享被引浏览

更新时间：2024-11-28 23:45

一种解决关键词识别样本不均衡的方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友