摘要
本发明公开了一种基于数据驱动的有监督字典学习音频分类方法、系统及介质。该方法包括:确定样本集类别数;利用输入的样本及其对应的类标签训练特定类字典;利用已训练的字典得出输入样本的稀疏编码,并将稀疏编码作为特征,训练SVM分类器;利用已训练的字典和已训练的SVM分类器对输入样本进行分类,输出预测标签。本发明通过每个类学习一个字典来实现最小化类内均匀性,最大化类的可分性,提高稀疏性以控制信号在字典上分解的复杂性,同时最小化基于类的重构错误,并提高字典的成对正交性。本发明能够广泛应用于多个场景中,如计算听觉场景识别和音乐和弦识别;其在数据集上的测试也相对稳定,泛化能力表现优秀。
- 单位