摘要
本发明公开了一种高效语音关键词检测器训练样本使用方法,包括:使用全部样本训练检测器n轮;在第k轮训练的准备阶段,基于第k-1轮训练所得检测器D-(k-1),获取样本的目标评分S(T)和竞争者评分S(C),构建样本参与第k轮训练的概率;根据样本参与训练的概率,挑选出第k轮所使用的样本集Z-(k);第k轮使用Z-(k)进行训练,获得新的检测器D-(k),重复上述获取样本参与训练的概率、挑选样本和训练的过程,直至模型收敛或训练轮次大于预设值,结束训练。本发明通过挑选能对模型训练提供更多区分性信息的样本进行训练,使训练更加关注重要的样本,在提升系统性能的同时,提升训练效率;而且可缓解关键词检测训练中类样本不平衡问题;方法简单、高效,有广阔的应用前景。
- 单位