摘要
针对现有语种识别技术在低资源情况下无法具备优异识别效果的问题,提出了一种基于自监督预训练模型的低资源语种类型识别的方法。通过无标签的自监督学习获取深度语音表征,然后再利用低资源的有标注数据和全连接层后端对网络进行语种识别微调。在多个数据集上的对比实验结果表明,方法相比现有的ivector方法和深度有监督学习方法具备更好的识别效果,从而帮助在低资源情况下语种类型识别的应用。
- 单位
针对现有语种识别技术在低资源情况下无法具备优异识别效果的问题,提出了一种基于自监督预训练模型的低资源语种类型识别的方法。通过无标签的自监督学习获取深度语音表征,然后再利用低资源的有标注数据和全连接层后端对网络进行语种识别微调。在多个数据集上的对比实验结果表明,方法相比现有的ivector方法和深度有监督学习方法具备更好的识别效果,从而帮助在低资源情况下语种类型识别的应用。